Las tecnologías nuevas pronto harán posible secuenciar miles de genomas humanos. Ahora la parte difícil: comprender todos los datos.
Los 12 prototipos parecen fuertes prefabricados para los niños, cajas del tamaño de congeladoras, forradas con plástico rojo brillante y agrupadas de dos en dos o de tres en tres sobre el suelo de cemento en Pacific Biosciences, una startup de Menlo Park, CA. Pero el exterior simple de las máquinas oculta la complejidad interna. Cada caja tiene un chip pequeño atiborrado de miles de filamentos de ADN de bacterias o virus, cada filamento dentro de un hoyo en nano escala. Una enzima fijada al fondo de cada hoyo arma el filamento correspondiente rápidamente, y une las bases o sub-unidades de ADN, que se combinan apropiadamente con las del original. Cada uno de los cuatro tipos de bases, representados con las letras A, T, C y G, se etiquetan con un marcador fluorescente diferente que se activa por la reacción y une una base nueva al filamento. Como la máquina rastrea las reacciones a medida que acontecen, puede producir a granel, grandes cantidades de datos en bruto de las secuencias de las muestras de ADN a la misma velocidad que la cámara incorporada que las registra.
Un monitor de ordenador instalado junto a cada máquina muestra la imagen de la acción que ocurre. Una serie de luces se dispersa por la pantalla, encendiéndose y apagándose en rápida sucesión. Cada destello dura décimas de milisegundos, pero su color indica cuál de las cuatro bases se unió a un filamento de ADN, y su posición indica el lugar. El video debe pasarse en cámara lenta para poder verlo: los destellos son demasiado rápidos para que los procese el ojo humano. Los algoritmos del ordenador convierten al patrón de destellos en secuencias de ADN con una longitud de cientos a miles de bases. Los algoritmos adicionales luego comparan millones de esos tramos de ADN, identifican las piezas que se montan unas sobre otras en las puntas y encajan las piezas para reproducir el genoma completo.
En lo referido a secuenciar ADN, el tiempo es dinero, y las máquinas de Pacific Biosciences que saldrán al mercado en 2010, podrían ser las más rápidas hechas hasta el momento.Costó $ 300 millones y 13 años al Proyecto del Genoma Humano elaborar la secuencia de tres mil millones de pares de bases de ADN de un genoma humano compuesto, una tarea que se completó en 2003. Para octubre de 2008, los investigadores que utilizaban varios tipos de máquinas nuevas decían que podían secuenciar el genoma de un individuo en particular por menos de $ 100.000 (una empresa promete un genoma a $ 5.000 para la próxima primavera). Y Pacific Biosciences pronostica que para 2013, sus máquinas podrán secuenciar el genoma de una persona en 15 minutos por menos de $ 1.000.
Hasta ahora, los científicos secuenciaron los genomas de un puñado de personas, y eso significa darles un sentido general de variabilidad humana. Pero la tecnología para secuenciar de un modo rápido y barato haría que fuera práctico leer los genomas de miles, tal vez millones, de personas. Al revisar entre esa multitud de genomas y unir secuencias específicas de ADN con distintas características (altura, presión sanguínea, mano dominante y susceptibilidad a la ansiedad, por nombrar unas pocas), los científicos deben poder desentrañar la interacción compleja de las variables genéticas que hacen que cada individuo sea único. Lo más importante es que, ese tipo de capacidad para secuenciar puede revelar, finalmente, la base hereditaria de las enfermedades comunes, un enigma que se ha burlado de los genetistas durante décadas.
Sin embargo, el impacto real sobre la medicina es mucho menos cierto y puede resultar mucho menos positivo. Durante casi dos décadas, los investigadores han prometido que los adelantos en la tecnología de la secuenciación posibilitarían que los médicos practicaran medicina personalizada, centrando los tratamientos de los pacientes en sus perfiles genéticos. Se suponía que un número limitado de variables genéticas comunes terminarían dando lugar a una enfermedad en particular y los médicos podrían prescribir medicamentos según las variables que porten sus pacientes. Pero los últimos datos sugieren que hasta las enfermedades hereditarias más comunes, tales como diabetes y las enfermedades cardíacas, están ligadas a muchas variables diferentes, cada una de ellas ligeramente extraña. Si eso fuera cierto, entonces la práctica de la medicina personalizada sería muy complicada y muy cara. “No sería bueno tener al genoma por $ 5.000 y el análisis a $ 500.000”, comenta Francis Collins, ex director del Instituto Nacional de Investigación del Genoma Humano y líder del Proyecto del Genoma Humano.
Más Allá de las Variaciones Comunes
La medicina genómica se inició seriamente en los años 80, cuando los científicos identificaron genes asociados a enfermedades tales como la distrofia muscular de Duchenne, y la fibrosis quística. Ambas se consideran enfermedades Mendelianas, significando que son enfermedades resultantes de las mutaciones de un único gen; cualquiera que herede una o dos copias del gen modificado, dependiendo de la enfermedad, la padecerá. Durante los últimos 20 años, los investigadores identificaron genes de una cantidad de enfermedades Mendelianas, y pruebas de diagnóstico basadas en estos descubrimientos condujeron a diagnósticos tempranos. En el caso de enfermedades que se desarrollan solamente cuando una persona hereda dos copias de la mutación, las pruebas pueden detectar portadores sanos, ayudándoles a tomar decisiones con más información al decidir tener hijos. Sin embargo, las enfermedades de un gen único pertenecen a un porcentaje muy pequeño de las enfermedades humanas. Para la mayoría de las enfermedades, es muy difícil detectar a los culpables genéticos.
A medida que los científicos comenzaron a elaborar un borrador de la secuencia del genoma a fines de los 90, descubrieron un fenómeno muy útil. Grandes bloques de ADN, bloques de haplotipos, pasaban intactos de generación en generación. Distintas versiones de estos bloques, que estaban unidas a los orígenes ancestrales del individuo, tenían diseños característicos de variaciones genéticas comunes conocidas como polimorfismos de nucleótidos simples (SNPs), en los cuales la variación de la secuencia genética varía en una sola letra del ADN. Por lo tanto un SNP revelador podría servir como marcador para el ADN circundante. El descubrimiento fue de gran ayuda para los genetistas. Si cada bloque solía aparecer en una cantidad limitada de variaciones dentro de la población humana, sería innecesario cotejar cada base del genoma buscando variaciones asociadas a enfermedades comunes tales como asma o esquizofrenia. La presencia de un SNP particular indicaría qué bloque de haplotipos porta el individuo.
Los investigadores desarrollaron micro-conjuntos genéticos que podrían detectar la presencia de estos SNP comunes en el genoma rápidamente. Por buscar variaciones reveladoras (un proceso relativamente barato), los micro-conjuntos han dado lugar a los estudios más grandes del genoma hasta la fecha. Los científicos los utilizaron para buscar eficientemente de entre decenas de miles de genomas humanos los SNPs más comunes en personas con autismo o alzheimer, por ejemplo, más que en personas sanas. Durante los últimos dos años, se publicó una avalancha de estudios que identifican más de 300 variaciones genéticas asociadas a una colección de rasgos comunes y enfermedades.
Pero hallar estas variaciones no llevó al gran avance que esperaban algunos científicos para comprender la base genética de las enfermedades comunes. Eso es porque sólo dan cuenta de una fracción pequeña del riesgo genético de muchas enfermedades. Por ejemplo, los investigadores identificaron 18 genes que se asocian con la diabetes tipo 2, y las pruebas para identificar las variaciones fueron lanzadas. Sin embargo, siguen sin conocerse muchos otros factores de riesgo hereditarios de enfermedades. Eso significa que las pruebas nuevas dan un cuadro incompleto de las posibilidades que tiene una persona de contraer diabetes, y será difícil utilizarlos para tomar decisiones médicas. “Existen pocas razones para sentirse esperanzado de que las estrategias de prevención pueden revolucionarse con lo que hemos descubierto hasta ahora (sobre la base genética de las enfermedades comunes)”, explica David Goldstein, director del Center for Population Genomics and Pharmacogenetics en la Universidad Duke, de Durham, NC.
La búsqueda de los SNP tiene sentido si el riesgo hereditario de enfermedades como la diabetes tipo 2 proviene de la combinación de muchas variaciones genéticas comunes, cada una aportando un efecto pequeño. Pero, ¿si eso fuera sólo una pequeña parte de la historia? Y ¿si otros tipos de mutaciones genéticas extrañas estuvieran jugando un papel también? Como los micro-conjuntos se diseñaron para detectar SNP comunes, pueden pasar por alto variaciones que sólo aparecen en el 1 por ciento de la población. Estas mutaciones son el foco de una hipótesis alternativa, en la cual, como en el modelo Mendeliano, las variaciones individuales de alto impacto contribuyen mucho a la enfermedad. Cualquiera de las variaciones puede aparecer poco frecuentemente. Según este razonamiento, los mismos senderos bioquímicos, o senderos relacionados, pueden producir resultados semejantes. Colectivamente, podrían hacer que la enfermedad fuera relativamente común.
Hasta hace poco, sólo se realizaron pocos intentos para buscar variaciones extrañas asociadas a enfermedades comunes. Esta búsqueda puede significar pasar cada letra de ADN por un tamiz, algo que sólo se puede lograr con secuenciación. Con la vieja tecnología eso era demasiado caro como para resultar práctico. Pero en vista de los resultados decepcionantes de los estudios con los micro-conjuntos, los científicos están recurriendo a las tecnologías nuevas de secuenciación para probar rigurosamente la hipótesis de las variantes extrañas. Es probable que “gran parte del resto de lo hereditario (en el caso de enfermedades), esté oculto en variantes raras de gran impacto”, dice Collins. “Si realmente queremos conocer la genómica de la enfermedad, necesitamos completar las secuencias del genoma”.
Todavía se desconoce en qué medida las variaciones extrañas contribuyen a la enfermedad, pero la evidencia comienza a llegar poco a poco. En un estudio que se publicó este verano, los biólogos de la Universidad de California, Berkeley, secuenciaron un gen por una enzima llamada MTHFR, que convierte el folato de la vitamina B (ácido fólico) de una forma a otra. Previamente, los científicos habían identificado una variación genética común que produce una versión debilitada de la enzima, que aumenta el riesgo de defectos de nacimiento y, posiblemente, de enfermedades cardíacas. Al secuenciar el gen MTHFR en 564 personas de distintas etnias, Nick Marini y sus colegas hallaron cuatro variantes nuevas que afectan la función de la enzima; presentes en menos del 1 por ciento de los sujetos, estas variantes hubieran sido imposibles de detectar con los estudios del micro-conjunto.
El Genoma Personal
En una conferencia reciente en el venerable Cold Spring Harbor Laboratory de Long Island, James Watson, co-descubridor de la estructura del ADN, se sentaba repantigado en la primera fila del auditorio debajo de su propio retrato. Watson, que lideró por un tiempo al Proyecto del Genoma Humano, hizo que secuenciaran su genoma en 2007. El suyo fue sólo el segundo genoma individual que se trazó completamente. Craig Venter, que hizo un trabajo privado para secuenciar el genoma, utilizó su propio ADN de muestra.
A Watson no se lo conoce por quedarse sentado durante todas las presentaciones sucesivas de una conferencia. Pero una buena parte de esta conferencia trataba sobre él. Asistió a charla tras charla a medida que los científicos presentaban sus análisis de lo que se conoció afectuosamente como “El Proyecto Jim”. Watson es un hombre aparentemente saludable de 80 años, y los resultados de escudriñar su genoma hasta ahora han sido bastante mundanos. Por ejemplo, tiene copias extras de variaciones genéticas que aparecen en estudios previos para protegerlas contra enfermedades cardíacas y degeneración macular. Una mutación del gen BRCA1, que se asocia con el cáncer de mama, lo preocupó en un principio pero resultó inocua. Pero la mayoría del genoma de Watson está sin interpretar. Los científicos todavía tienen que encontrar el componente genético de su inteligencia, de su curiosidad, o de su tendencia a los estallidos políticamente incorrectos. Tal vez lo más importante para Watson sea si tiene vulnerabilidad genética por la esquizofrenia, ya que se la pasó a su hijo que padece la enfermedad.
La secuencia de referencia del Proyecto del Genoma Humano, que es un compuesto de información genética de más de 20 individuos, les dio a los científicos un plano básico del genoma. Pero un genoma único tiene sus limitaciones. Los científicos sólo al comparar genomas múltiples podrán comenzar a manejar la variación que subyace a la vulnerabilidad a ciertas enfermedades o a la locura, la tendencia hacia la destreza atlética o al genio matemático, la pulsión hacia el altruismo o a la agresión. Hasta Watson, que pasó su carrera tratando de comprender el ADN, parece menos que impresionado al observar la presentación de los detalles de su genoma. “Veremos si esto agrega 5 minutos a mi tiempo de vida”, comentó en la conferencia. De hecho, el significado de la mayoría de sus peculiaridades genéticas seguirán siendo un misterio hasta que muchas más personas se unan a él al hacer que secuencien sus genomas.
George Church, genetista de la Harvard Medical School, que ha estado trabajando con la tecnología de secuenciación desde la investigación para su doctorado en Harvard a principios de los 80, está decidido a que el proceso se acelere. Hace tres años, Church lanzó el Personal Genome Project (PGP), cuya meta es recolectar datos genéticos y médicos de miles de personas durante los próximos cinco años. El proyecto indica no sólo los desafíos técnicos y científicos que pueden presentarse al hacer secuencias a gran escala de los genomas humanos, sino que los éticos también.
En su fase piloto, el proyecto se centrará en 10 voluntarios, incluido Church, el psicólogo de Harvard Steven Pinker y la empresaria Esther Dyson. Para empezar, secuenciarán las regiones de códigos de sus genomas (el 1 por ciento que maneja la producción de proteínas). Esa información, junto con las historias clínicas de los participantes (incluso regímenes de recetas médicas) y la información respecto a su peso, altura, mano dominante y otros rasgos se depositarán en una base de datos pública. El equipo de Church espera que esta base de datos sirva como fuente para científicos y miembros del público, que quieran buscar asociaciones entre ciertas variaciones genéticas específicas y enfermedades u otras características.
El primer juego de datos que se dio a los participantes en octubre, marca tanto la promesa de la secuenciación como las limitaciones actuales del análisis genético. John Halamka, jefe de informática de la Harvard Medical School, y otro de los 10 voluntarios originales supieron que él porta una mutación de la enfermedad dental Charcot Marie, una enfermedad neurológica hereditaria. Esta variación extraña no se hubiera detectado con los SNP de micro-conjunto. Pero como Halamka pasó su niñez ileso, y sólo se detectó esta mutación particular en tres personas en el mundo, es difícil saber qué impacto tuvo en su salud, si es que tuvo alguno. Tal vez muchas personas porten una variación sin efectos adversos, y la asociación entre la enfermedad y la mutación se haya exagerado. O tal vez el gen tenga un impacto mayor que el esperado, aumentando el riesgo de otras enfermedades neurológicas. O, como hace notar George Church, el hallazgo puede ser simplemente un error.
Cuanto mayor sea la cantidad de entradas en la base de datos, más fácil será comprender un hallazgo como el de Halamjka. Y en abril 2008, el equipo de Church recibió la aprobación de Harvard para expandir el proyecto de 10 a 10.000 participantes. (Church piensa ir aumentando gradualmente, multiplicando la cantidad de participantes a 10 por año.) La próxima fase será probar seriamente tanto la tecnología para secuenciar los genomas como las estrategias utilizadas para interpretar los datos resultantes. A partir de noviembre, alrededor de un año desde la iniciación del proyecto, los científicos del PGP sólo habían llegado a la quinta parte del camino para secuenciar las regiones de códigos de todos los genomas de los voluntarios originales. Church tiene planes de expandir el PGP a todo el genoma una vez que secuenciar sea lo suficientemente barato. Si van a secuenciar miles de genomas más, la tecnología para secuenciar tendrá que ser tan rápida y fuerte como cree Church.
Demasiada Información
Utilizar los datos del PGP será un problema en sí. Primero, Church y su equipo tendrán que decidir la mejor manera de dar los resultados a grupos de voluntarios más grandes. Los primeros 10 recibieron consejo genético personalmente de parte de Joseph Thakuria, el médico director del proyecto y clínico genetista en la Harvard Medical School. Pero Thakuria no podrá aconsejar a miles de sujetos nuevos. Dada la escasez de genetistas y consejeros genéticos con el entrenamiento apropiado, el problema seguramente pasará de boca en boca a medida que la genómica personal se haga más accesible.
Pero el desafío más grande de la próxima fase de la genómica humana probablemente sea interpretar el significado del conjunto aparentemente interminable de variaciones que se descubrirán. Los cambios genéticos individuales ocurren por casualidad y algunos son inocuos. Otros son peligrosos, alteran algunos procesos celulares y aumentan el riesgo de enfermedades. Y algunos tal vez puedan llegar a ser beneficiosos. Por ejemplo, que mejoren la degradación de toxinas y protejan así contra ciertos males. Pero a menudo es imposible saber de qué tipo de variación se trata simplemente al mirarla. Y a medida que las tecnologías nuevas permiten que los científicos secuencien los genomas de grandes cantidades de personas, la lista de variantes conocidas crecerá rápidamente. “En términos de interpretación, esta información será peliaguda y problemática. Todos tenemos mutaciones y alteraciones que simplemente no comprendemos. Como siempre, la tecnología estará más allá de nuestra capacidad para utilizarla”, concluye James Evans, profesor de genética y medicina en la Universidad de Carolina del Norte en Chapel Hill.
La complejidad de la información genómica nueva también puede ser un obstáculo para la medicina personalizada que se suponía que se iba a iniciar con la secuenciación genética. Los investigadores esperaron crear pruebas que pronosticaran el riesgo individual ante una enfermedad específica o revelar qué medicamento funcionará mejor en una persona dada. Pero las pruebas genéticas que detectan variaciones recién descubiertas, no serán demasiado útiles hasta que los científicos puedan saber lo que significan dichas variaciones. Y si muchas de las enfermedades comunes son causadas por variantes extrañas, la tarea será tremenda. “Entender el riesgo basándose en variantes extrañas nos va a tomar años”, dice Dietrich Stephan, fundador y funcionario jefe de ciencias en Navigenics, una startup de genómica personal.
Algunos científicos piensan que el verdadero valor de la genómica no está para nada en la medicina personalizada. Dicen que valdrá la pena porque profundizará nuestro conocimiento de las enfermedades y ayudará a los investigadores a descubrir nuevos blancos para los medicamentos. “El valor primario del trazado genético no es la predicción de riesgo, sino llegar a una comprensión original respecto de los mecanismos de las enfermedades”, escribió David Altshuler, un físico y genetista en el Broad Institute de Cambridge, MA, en un artículo recientemente publicado en una edición de Science. De hecho, apunta Altshuler, identificar cambios genéticos extraños puede llegar a ayudar a un gran número de pacientes. Por ejemplo, los estudios de una forma hereditaria de colesterol alto que se halla en menos del 0,2 por ciento de la población, llevó al descubrimiento del receptor de la lipoproteína de baja densidad (LDL), que ayuda a quitar el colesterol en exceso del torrente sanguíneo. Eso a su vez, llevó a la creación de drogas exitosas conocidas como estatinas. Son medicamentos que inician el aumento de la cantidad de receptores LDL en la superficie de las células del hígado.
Nadie sabe cuándo llegará el próximo éxito. Hacer pronósticos respecto a los beneficios de la genómica es tan ingrato como tratar de pronosticar el riesgo de una enfermedad en sí. Y cuanto más fácil resulta secuenciar un genoma, más difícil resulta comprender la complejidad que revelan las secuencias. Como dice Collins: “el Proyecto del Genoma Humano fue tal vez una tarea simple comparado con lo que nos queda por encarar”.
Emily Singer es la editora biomédica senior de Technology review