A medida que se decodifican más genomas personales, es necesario mejorar la forma de compartir y comprender los datos.
Si la nube de Internet estuviera en realidad en el aire, se derrumbaría bajo el peso de un trillón de bytes de datos biológicos.
Este año, se espera que las máquinas de secuenciación de ADN en todo el mundo produzcan 30.000 genomas humanos completos, según estimaciones de la revista Nature. Esa cifra supone un aumento en comparación con las 2.700 del año pasado y unas pocas docenas en 2009. Recordemos que solo hace una década, antes de la finalización del Proyecto del Genoma Humano, la cifra era igual a cero. A este ritmo exponencial, para el año 2020 podría ser factible -matemáticamente, al menos- decodificar el ADN de cada miembro de la humanidad en un solo tramo de 12 meses.
Este gran aumento de datos de ADN se está produciendo gracias a los deslumbrantes avances en la tecnología de secuenciación. Lo que costaba cientos de millones de dólares hace una década, ahora solo cuesta 10.000 dólares (7.300 euros). En unos pocos años, la decodificación del ADN de una persona podría costar 100 dólares (74 euros) o incluso menos.
Sin embargo, según afirma un cada vez mayor grupo de investigadores, lo que falta es una forma de dar sentido a lo que estas cadenas interminables de As, Gs, Cs y Ts significan para las personas y su salud. "Se nos da muy bien la secuenciación de personas, pero nuestra capacidad para interpretar todos estos datos se está quedando atrás", afirma Eric Schadt, director del Instituto Monte Sinaí de Biología Genómica y Multiescala, además de director científico en Pacific Biosciences, con sede en California (EE.UU.), dedicadas a la venta de máquinas de secuenciación.
Los científicos aún no saben todo lo que lleva a cabo nuestro ADN -la forma en que cada diferencia en el código genético puede influir en las enfermedades o el color del pelo. Los estudios tampoco han confirmado que todos los marcadores genéticos relacionados con, por ejemplo, enfermedades del corazón y la mayoría de cánceres en realidad aumenten el riesgo de que una persona padezca estas enfermedades. De igual importancia es el hecho de que los miles de genomas que se están produciendo en estos momentos no se pueden comparar fácilmente. No existe un formato estándar para el almacenamiento de datos de ADN y no se cuenta con una forma consistente para analizarlos o preservarlos. Incluso la nomenclatura varía de un laboratorio a otro.
La industria está trabajando para resolver estos problemas. A principios de este verano, en una reunión de genetistas y otros expertos a la que asistí en San Francisco, Clifford Reid, director general de Complete Genomics, con sede en el Área de la Bahía, pidió a un consorcio de empresas genéticas que desarrollara estándares de gran utilidad para un amplio rango de cuestiones, desde los procedimientos de consentimiento para los donantes de ADN hasta los métodos de recogida, almacenamiento y análisis de las muestras de ADN. Reid señala que el propósito final es "agregar conjuntos de datos múltiples, proporcionando un amplio acceso a dichos conjuntos que, en la actualidad, se almacenan en silos y en gran parte no están disponibles para la comunidad científica en general".
La "interoperabilidad" de los genomas aumentará la rapidez de la investigación sobre los vínculos entre el ADN y las enfermedades, afirman los científicos. Los investigadores serán capaces de validar sus suposiciones sobre vínculos entre la composición genética y las reacciones ante distintos fármacos, o la salud en general, mediante la realización de estudios mucho más amplios en los que se comparen los genomas de muchas personas. Además los médicos y los individuos serán capaces de utilizar métodos normalizados de presentación de informes sobre los riesgos y ventajas genéticos de una persona. Esto tendrá importancia a medida que más y más gente corriente decodifique su ADN.
Otra importante iniciativa proviene de Sage Bionetworks, una organización no lucrativa con sede en Seattle cofundada por Schadt y el director de Sage, Stephen Friend, ex líder de tecnologías avanzadas y grupos de oncología en Merck. Sage ha recaudado 20 millones de dólares (14,5 millones de euros) para apoyar un movimiento entre biólogos, informáticos, grupos de defensa del paciente y empresas, con el que lograr estandarizar las bases de datos de ADN que han surgido en los últimos años. "Esto no ocurrirá de un día para otro", asegura Schadt. "Pero va a ser algo enorme, como Internet".
En algunas empresas, se están realizando esfuerzos para construir una infraestructura de TI (Tecnología de la Información) capaz de reunir e interpretar genomas completos a una escala mayor. Jorge Conde, director general de Knome, una empresa en Cambridge, Massachusetts, dedicada a la venta de secuenciaciones completas de genomas como servicio y que cuenta con un equipo de doctores en la India para analizar los resultados, afirma que actualmente un mayor número de compañías farmacéuticas desean utilizar genomas completos para entender por qué los fármacos funcionan o provocan efectos secundarios en algunas personas y no en otras. "A medida que el precio ha ido cayendo, hemos observado un mayor interés por parte de las compañías farmacéuticas y de biotecnología", afirma Conde. El precio del servicio de secuenciación y análisis de Knome se ha reducido de 350.000 dólares en 2007 a menos de 10.000 en la actualidad (de 260.000 a 7.300 euros).
Una de las ideas más recientes de Knome, aún en una etapa inicial, es conseguir que las compañías farmacéuticas compartan los genomas que hayan decodificado. La compañía ha lanzado un servicio basado en la nube llamado kGAP que permite a los clientes el proceso de varios cientos de genomas a la vez, estudiando la presencia de 200.000 vínculos conocidos entre marcadores de ADN y genotipos de enfermedades y otros rasgos. La tecnología aún está orientada a facilitar grandes proyectos de investigación, aunque con el tiempo este tipo de motores podrían ser usados para comparar el genoma de un individuo con el de miles de personas y producir consejos de salud y diagnósticos personalizados. "Lo mejor se producirá cuando esta información esté disponible para ser utilizada por proveedores de atención sanitaria y pacientes", afirma Conde. "Pero para eso todavía faltan varios años".