Otros
Una técnica más fácil de usar para almacenar datos en el ADN está inspirada en nuestras células
La codificación de información en el ADN ha parecido durante mucho tiempo una forma prometedora de proteger los datos a largo plazo, pero hasta ahora ha requerido un toque experto.
Resulta que no hace falta ser científico para codificar datos en el ADN. Los investigadores llevan décadas trabajando en el almacenamiento de datos basados en el ADN, pero un nuevo método basado en plantillas inspirado en los procesos químicos de nuestras células es lo suficientemente fácil de poner en práctica incluso para los no científicos. La técnica podría allanar el camino para una forma inusual pero ultraestable de almacenar información.
La idea de almacenar datos en ADN fue propuesta por primera vez en la década de 1950 por el físico Richard Feynman. El material genético tiene una densidad de almacenamiento y una durabilidad excepcionales: un solo gramo de ADN puede almacenar un billón de gigabytes de datos y retener la información durante miles de años. Décadas después, un equipo dirigido por George Church en la Universidad de Harvard puso la idea en práctica y codificó un libro de 53.400 palabras.
Este método inicial se basaba en la síntesis de ADN, es decir, encadenar secuencias genéticas pieza por pieza, como cuentas en un hilo, utilizando los cuatro bloques de construcción de nucleótidos A, T, C y G para codificar la información. El proceso era costoso, llevaba mucho tiempo y era propenso a errores, ya que creaba solo un bit (o un octavo de byte) con cada nucleótido añadido a una cadena. Y, lo que es más importante, el proceso requería de conocimientos especializados para llevarlo a cabo.
El nuevo método, publicado en Nature la semana pasada, es más eficiente, ya que almacena 350 bits a la vez codificando las hebras en paralelo. En lugar de enhebrar a mano cada hebra de ADN, el equipo ensambla las hebras a partir de bloques de ADN prefabricados de unos 20 nucleótidos de longitud, codificando la información alterando algunos y no otros a lo largo del camino. Long Qian de la Universidad de Pekín y su equipo obtuvieron la idea de estas plantillas a partir de la forma en que las células comparten el mismo conjunto básico de genes pero se comportan de manera diferente en respuesta a los cambios químicos en las hebras de ADN. "Todas las células de nuestro cuerpo tienen la misma secuencia genómica, pero la programación genética proviene de modificaciones del ADN. Si la vida puede hacer esto, nosotros podemos hacerlo", dice.
Qian y sus colegas codificaron los datos mediante metilación, una reacción química que activa y desactiva los genes mediante la unión de un compuesto de metilo (una pequeña molécula relacionada con el metano). Una vez que los bloques están fijados en sus lugares asignados en la cadena, los investigadores seleccionan qué bloques metilar, y la presencia o ausencia de la modificación representa los valores binarios de 0 o 1. La información puede entonces descifrarse utilizando secuenciadores de nanoporos para detectar si un bloque ha sido metilado. En teoría, el nuevo método es lo suficientemente simple como para llevarlo a cabo sin conocimientos detallados sobre cómo manipular el ADN.
La capacidad de almacenamiento de cada cadena de ADN es de aproximadamente 70 bits. Para archivos más grandes, los investigadores dividieron los datos en múltiples cadenas identificadas por códigos de barras únicos codificados en los bloques. Luego, las cadenas se leyeron simultáneamente y se secuenciaron según sus códigos de barras. Con esta técnica, los investigadores codificaron la imagen de un calco de tigre de la dinastía Han, solucionando problemas en el proceso de codificación hasta que la imagen regresó sin errores. El mismo proceso funcionó para imágenes más complejas, como una impresión fotorrealista de un panda.
Para evaluar la aplicabilidad de su método en el mundo real, el equipo reclutó a 60 estudiantes de diversos orígenes académicos (no solo científicos) para codificar cualquier texto que eligieran. Los voluntarios transcribieron su texto en código binario a través de un servidor web. Luego, con un kit enviado por el equipo, pipetearon una enzima en una placa de 96 pocillos con los bloques de ADN, marcando cuál sería metilado. Luego, el equipo pasó las muestras por un secuenciador para crear la cadena de ADN. Una vez que la computadora recibió la secuencia, los investigadores ejecutaron un algoritmo de decodificación y enviaron el mensaje restaurado a un servidor web para que los estudiantes lo recuperaran con una contraseña. El texto regresó con una tasa de error del 1,4% en letras, y los errores se corrigieron finalmente mediante modelos de aprendizaje de idiomas.
Una vez que esté más desarrollada, Qian cree que la tecnología será útil como almacenamiento a largo plazo para información de archivo a la que no se accede todos los días, como registros médicos, informes financieros o datos científicos.
El éxito que han conseguido los no científicos utilizando esta técnica en los ensayos de codificación sugiere que el almacenamiento de ADN podría llegar a convertirse en una tecnología práctica. “Todo el mundo almacena datos todos los días y, para competir con las tecnologías de almacenamiento de datos tradicionales, los métodos de ADN deben ser utilizables por la gente común”, afirma Jeff Nivala, codirector del Laboratorio de Sistemas de Información Molecular de la Universidad de Washington. “Esta es todavía una demostración temprana de que se puede llegar a los no expertos, pero creo que es bastante singular que sean capaces de hacerlo”.
El almacenamiento de ADN todavía tiene mucho que hacer antes de poder competir con el almacenamiento de datos tradicional. El nuevo sistema es más caro que las técnicas tradicionales de almacenamiento de datos o los métodos anteriores de síntesis de ADN, afirma Nivala, aunque el proceso de codificación podría volverse más eficiente con la automatización a mayor escala. Con el desarrollo futuro, el almacenamiento de ADN basado en plantillas podría convertirse en un método más seguro para hacer frente a las crecientes demandas de datos.