.

Biotecnología

TR10: Internet se llena de ADN

1

Una red global con millones de genomas podría ser el próximo gran avance de la medicina

  • por Antonio Regalado | traducido por Francisco Reyes
  • 20 Febrero, 2015


Avance

Estándares técnicos que permitan que las bases de datos de ADN se comuniquen.

Por qué es importante

Tus tratamientos médicos podrían beneficiarse de las experiencias de millones de otras personas.

Disponibilidad

Entre uno y dos años.

Organizaciones clave

  • Alianza Mundial para la Genómica y la Salud
  • Google
  • El Proyecto del Genoma Personal

Noah tiene seis años y sufre un trastorno sin nombre. Este año, sus médicos empezarán a enviar su información genética a través de internet para ver si hay alguien, en algún lugar del mundo, como él.

Encontrar a alguien igual podría marcar una diferencia. Noah tiene un retraso del desarrollo, utiliza un andador y sólo dice unas pocas palabras. Y está empeorando. Las imágenes por resonancia magnética muestran que su cerebelo se está reduciendo. Su ADN fue analizado por especialistas en genética médica en el Hospital Infantil de Ontario Oriental (Canadá). En algún lugar entre los millones de letras A, G, C y T hay una falta de ortografía que quizá sea la clave del tratamiento. Pero a menos que encuentren un segundo niño con los mismos síntomas, y un error de ADN similar, los médicos no pueden aislar qué error genético de Noah es el de importancia crucial.

En enero, varios programadores en Toronto comenzaron a probar un sistema para el intercambio de información genética con otros hospitales. Estas instalaciones, en lugares como Miami y Baltimore (EEUU), y Cambridge (Reino Unido) también tratan a niños con trastornos conocidos como mendelianos, provocados por una mutación rara en un solo gen. El sistema, llamado MatchMaker Exchange, representa algo nuevo: una forma de automatizar la comparación de ADN de personas enfermas de todo el mundo.

Una de los responsables de este proyecto es un experto en bioinformática de la Universidad de California en Santa Cruz (EEUU), David Haussler. El problema con el que Haussler está lidiando actualmente es que la secuenciación del genoma está muy alejada de nuestra mayor herramienta para compartir información: internet. Esto resulta lamentable, ya que más de 200.000 personas ya han secuenciado sus genomas, un cifra que seguramente aumentará a millones durante los próximos años. La próxima era de la medicina depende de la comparación a gran escala de estos genomas, una tarea para la que él cree que los científicos están mal preparados. "Puedo usar mi tarjeta de crédito en cualquier parte del mundo, pero los datos biomédicos sencillamente no están en internet", asegura. "Todo es incompleto y está bloqueado". Los genomas a menudo se transportan en discos duros y son entregados por camiones de FedEx.

Haussler es fundador y uno de los líderes técnicos de la Alianza Global para la Genómica y la Salud, una organización sin fines de lucro formada en 2013 que se compara a si misma con el W3C, la organización de estándares dedicada a asegurar que internet funcione correctamente. También conocida por su difícil acrónimo en inglés, GA4GH, ha conseguido un gran número de miembros, entre ellos grandes compañías de tecnología como Google. Sus productos hasta ahora incluyen protocolos, interfaces de programación de aplicaciones (API) y formatos de archivo mejorados para transportar el ADN por internet. Pero en su mayoría, los problemas reales que está resolviendo no son de naturaleza técnica. En su lugar, son sociológicos: los científicos son reacios a compartir datos genéticos, y las reglas de privacidad hacen que sea legalmente arriesgado poner los genomas de la gente en internet.

Lo calamitoso de la genómica es que ya se ha recogido una gran cantidad de información que podría salvar vidas, pero es inaccesible.

Sin embargo, cada vez hay más presión por usar tecnología para estudiar muchos genomas al mismo tiempo y empezar a comparar la información genética con expedientes médicos. Esto se debe a que los científicos creen que tendrán que revisar más de un millón de genomas para resolver casos, como el de Noah, que podrían estar provocados por una única letra de ADN rebelde, o para hacer descubrimientos sobre la genética de enfermedades comunes que impliquen una compleja combinación de genes. Ningún centro académico tiene actualmente acceso a información tan extensa, o los medios financieros para ensamblarla.

Haussler y otros en la alianza creen que parte de la solución es una red informática tipo peer-to-peer que pueda unir datos muy dispersos. Sus estándares, por ejemplo, permitirían a un investigador enviar consultas a otros hospitales, que podían elegir qué nivel de información están dispuestos a compartir y con quién. Este control podría aliviar las preocupaciones de privacidad. Para añadir un nivel adicional de complejidad, las API también podrían recurrir a bases de datos para realizar cálculos, como por ejemplo volver a analizar los genomas que almacenan y generar respuestas.

El día que conocí a Haussler llevaba una camisa hawaiana gastada y estaba sentado en una silla de jardín de plástico junto a una piscina de hotel en San Diego (EEUU). Los dos estábamos allí para asistir a uno de los encuentros anuales de genetistas más grandes del mundo. Me dijo que le preocupaba que la genómica se estuviera alejando del enfoque tan abierto que había hecho que el proyecto del genoma fuera tan potente. Si los datos de ADN de la gente fueran más accesibles, Haussler cree que la medicina podría beneficiarse de la misma especie de "efecto de red" que ha propulsado tantos aspectos comerciales de internet. En caso contrario, esta información vital terminará abandonada en algo como los registros hospitalarios de Estados Unidos, una desastrosa mezcla de sistemas donde muy pocos son capaces de compartir información.

Una de las razones para actuar con rapidez es que la cantidad de datos genómicos está aumentando enormemente. Los laboratorios más grandes pueden hoy día secuenciar genomas humanos con gran detalle y a un ritmo de dos por hora. (El primer genoma tardó cerca de 13 años). Los cálculos a grandes rasgos sugieren que las rápidas máquinas de secuenciación de ADN serán capaces de producir 85 petabytes de datos este año en todo el mundo, el doble en 2019, y así sucesivamente. En comparación, todas las copias originales de películas en poder de Netflix ocupan 2,6 petabytes.

"Es una cuestión técnica", afirma el director general de Curoverse, Adam Berrey, cuya start-up con sede en Boston (EEUU) está utilizando estándares de la alianza para desarrollar software de código abierto para hospitales. "Tienes algo que llegará a ocupar exabytes de datos en todo el mundo y que nadie quiere mover. La pregunta es: ¿cómo consultas esos datos, todos juntos y a la vez? La respuesta es no mover los datos, sino mover las preguntas. Ninguna industria hace eso. Es un problema increíblemente difícil, pero tiene el potencial de transformar la vida humana".

Hoy día los científicos están ampliamente comprometidos en un proyecto que pretende documentar todas las variaciones en todos los genes humanos y determinar cuáles son las consecuencias de esas diferencias. Los seres humanos individuales se diferencian en unos tres millones de posiciones de ADN, o una de cada 1.000 letras genéticas. La mayoría de estas diferencias no importan, pero el resto explican muchas cosas que sí tienen importancia: desoladores trastornos como el de Noah, por ejemplo, o una probabilidad superior a la media de desarrollar glaucoma.

Así que imagínate que en un futuro próximo tuvieras la mala suerte de desarrollar cáncer. Un médico podría solicitar pruebas de ADN de tu tumor, sabiendo que cada cáncer está provocado por mutaciones específicas. Si fuera posible buscar la experiencia de todas las personas que comparten mutaciones particulares de tu tumor, además de qué medicamentos han tomado y cuánto tiempo vivieron, el médico podría hacerse una buena idea de cómo tratarte. Lo calamitoso de la genómica es que ya se ha recogido una gran cantidad de información que podría salvar vidas, pero es inaccesible. "El factor limitante no es la tecnología", señala el director médico de DNAnexus, David Shaywitz, una empresa bioinformática que aloja varias grandes colecciones de datos genéticos. "Es si la gente está dispuesta".

El verano pasado, la alianza de Haussler lanzó un motor de búsqueda básico de ADN, llamado Beacon. Actualmente, Beacon busca en cerca de 20 bases de datos de genomas humanos que previamente fueron hechas públicas y han implementado los protocolos de la alianza. Beacon sólo ofrece respuestas de tipo sí o no a un solo tipo de pregunta. Por ejemplo puedes preguntar "¿Alguno de tus genomas tiene una T en la posición 1,520,301 en el cromosoma 1?" "Realmente es el tipo de pregunta más básica que existe: ¿has visto alguna vez esta variante?",  señala Haussler. "Porque si ves algo nuevo, probablemente quieras saber si es el primer paciente en el mundo que lo tiene". Beacon ya es capaz de acceder al ADN de miles de personas, entre ellas cientos de genomas publicados en línea por Google.

Uno de los cofundadores de la Alianza Mundial es David Altshuler, que actualmente es director científico en Vertex Pharmaceuticals pero hasta hace poco era el director adjunto del Instituto Broad del Instituto de Tecnología de Massachusetts (MIT, EEUU) y Harvard, uno de los mayores centros de secuenciación de ADN académicos en el país. El día que visité Altshuler en su oficina de Broad, su pizarra estaba cubierta con diagramas que mostraban la herencia genética en las familias, además de la palabra "Napster" escrita en grandes letras azules, una referencia al famoso y rompedor servicio de intercambio de música de la década de 1990. Altshuler tiene sus propias razones para querer conectar grandes cantidades de datos genéticos. Como investigador académico, estaba a la caza de causas genéticas de enfermedades comunes como la diabetes. Ese trabajo se llevó a cabo comparando el ADN de personas con y sin la enfermedad, intentando encontrar las diferencias que se presentan con más frecuencia. Después de agotar un sinnúmero de becas de investigación de esta forma, los genetistas se dieron cuenta de que no habría respuestas fáciles, ni "genes de la diabetes" comunes o "genes de la depresión". Resulta que las enfermedades comunes no son causadas ​​por defectos individuales y delatadores. En su lugar, los científicos han aprendido que el riesgo de una persona está determinado por una combinación de cientos, si no decenas de miles, de variaciones raras en el código de ADN.

Esto ha creado un enorme dolor de cabeza estadístico. En julio pasado, en un informe con 300 autores, Broad analizó los genes de 36.989 personas con esquizofrenia. A pesar de que la esquizofrenia es altamente hereditaria, las 108 regiones génicas identificadas por los científicos explican sólo un pequeño porcentaje del riesgo que puede tener una persona de desarrollar la enfermedad. Altshuler cree que los grandes estudios de genes siguen siendo una buena forma de "descifrar" estas enfermedades, pero cree que probablemente habrá que analizar millones de genomas para conseguirlo.

Sea como sea, el intercambio de datos ha dejado de ser algo opcional, tanto si los investigadores intentan desentrañar las causas de las enfermedades comunes o las ultra raras. "Va a haber un cambio enorme en el modo de desarrollar el proceso científico, y es sólo porque la relación señal-ruido así lo requiere", señala un investigador que lidera un consorcio dedicado a estudiar la ciencia de la enfermedad de Alzheimer en la Universidad del Sur de California (EEUU), Arthur Toga. "No puedes conseguir un resultado con sólo 10.000 pacientes, vas a necesitar más. Los científicos van a compartir datos porque están obligados a hacerlo".

La privacidad, por supuesto, es un obstáculo para el intercambio. Los datos de ADN de la gente están protegidos porque pueden usarse para su identificación, como una huella digital, y sus registros médicos también son privados. Algunos países no permiten que la información personal se exporte con fines de investigación. Sin embargo Haussler cree que una red tipo peer-to-peer podría solucionar algunas de estas preocupaciones, ya que los datos no se moverán de sitio y el acceso a ellos podría estar controlado. Más de la mitad de los europeos y los estadounidenses afirman no sentirse incómodos por la idea de compartir sus genomas, y algunos investigadores creen que los formularios de consentimiento de los pacientes deberían ser dinámicos, un poco como los controles de privacidad de Facebook, permitiendo a las personas decidir qué quieren compartir y con quién, y luego cambiar de opinión. "Nuestros miembros quieren ser los que tomen las decisiones, pero no les preocupa tanto la privacidad. Están enfermos", señala la directora de la Alianza Genética, Sharon Terry, una gran organización de defensa del paciente.

El riesgo de no hacer bien el intercambio de datos es que la revolución del genoma podría renquear. Algunos investigadores afirman ver síntomas de que ya está sucediendo. La directora del equipo de investigación que secuenció el genoma de Noah, Kym Boycott, afirma que cuando el grupo adoptó la secuenciación como herramienta de investigación en 2010, tuvo un éxito inmediato. Durante dos años, entre 2011 y 2013, una red de genetistas canadienses descubrió las causas moleculares precisas de 146 afecciones, solucionando un 55% de los casos no diagnosticados.

Pero la tasa de éxito parece estar disminuyendo, asegura Boycott. Ahora los que quedan son los casos más difíciles, como el de Noah, y sólo se resuelven con la mitad de frecuencia que los otros. "Ya no tenemos dos pacientes con lo mismo. Por eso necesitamos el intercambio", señala. "Necesitamos más pacientes y un intercambio sistemático para hacer que [la tasa de éxito] vuelva a subir". A finales de enero, cuando le pregunté si MatchMaker Exchange había conseguido algún tipo de combinación, mostró cierta cautela y dijo que podrían pasar algunas semanas antes de que el software estuviera en pleno funcionamiento. En cuanto a Noah, dijo: "Aún estamos esperando poder clasificarlo. Para este niño, es algo muy importante".

- Antonio Regalado

Aquí tienes la lista completa de las 10 Tecnologías Emergentes de 2015

Biotecnología

Nuevas tecnologías y conocimientos biológicos empiezan a ofrecer opciones sin precedentes para mejorar nuestra salud.

  1. Manipulación genética para salvar al castaño americano de la extinción

    Una 'startup' llamada American Castanea se ha unido a la misión de revivir el castaño americano, el primer paso en su plan para darle a los bosques una mejora genética.

  2. África lucha contra el hambre recurriendo a alimentos del pasado

    Los investigadores, los agricultores y las instituciones agrícolas mundiales están adoptando cultivos largamente abandonados que prometen una mejor nutrición y mayor resiliencia al cambio climático.

  3. En la mente de las arañas: estos artilugios científicos permiten entender a los animales

    Los científicos construyen ingeniosos dispositivos para estudiar comportamientos animales que van desde el "mercado inmobiliario" del cangrejo ermitaño a la capacidad de resolver rompecabezas de las aves