El científico y emprendedor Craig Venter explica cómo la investigación genética y Silicon Valley empiezan a combinarse
Al científico del genoma y emprendedor J. Craig Venter se le conoce principalmente por ser la primera persona que secuenció su propio genoma en 2001.
Este año ha creado una nueva empresa, Human Longevity, que pretende secuenciar un millón de genomas humanos para 2020 y acabar ofreciendo programas web que ayuden la gente a guardar y comprender sus datos genéticos (ver "Microbios y metabolitos para luchar contra el envejecimiento").
Venter explica que, hasta la fecha, ha secuenciado el genoma de 500 personas y que los voluntarios también están empezando a someterse a una serie de pruebas que miden su fuerza, el tamaño de su cerebro, cuánta sangre bombea su corazón y, según detalla Venter, "prácticamente cualquier cosa que se pueda medir de una persona sin tener que abrirla". Esta información se introducirá en una base de datos que se puede usar para encontrar relaciones entre genes y estos rasgos así como distintas enfermedades.
Pero para conseguirlo harán falta potentísimos programas que digieran los datos. Y para desarrollarlos, Venter ha reclutado al especialista en aprendizaje automático que dirige Google Translate, Franz Och. Ahora Och aplicará métodos parecidos al estudio de los genomas en un taller de ciencia y software de los datos que Venter está montando en Mountain View, California (EEUU).
Esta contratación llega al mismo tiempo que el lanzamiento por parte de Google de un proyecto parecido para empezar a recoger datos biomédicos. Venter define los planes de Google para una base de datos biomédica como "un pequeño paso, una versión mucho más pequeña de lo que estamos haciendo nosotros".
Lo que está claro es que la investigación genómica y la ciencia de los datos se empiezan a combinar de nuevas maneras y a una escala mucho mayor de lo que nunca se haya hecho. Hemos preguntado a Venter por qué.
¿Qué tal vamos en genómica?
En mi opinión no ha habido un número significativo de avances. Uno de los motivos es que la genómica sigue una ley de números muy grandes. Yo tengo mi genoma desde hace 15 años y no puedo aprender gran cosa de él porque no hay tantos con los que compararlo.
¿Por qué ha contratado a un experto en traducción automática como principal científico de datos?
Por ahora no existe software que sirva para comparar mi genoma con el tuyo, mucho menos con un millón de genomas distintos. Queremos que llegue un punto en el que sólo se tarde unos segundos en comparar tu genoma con todos los demás. Hará falta mucho trabajo para llegar a ello.
Google Translate empezó como un algoritmo lento que tardaba horas o días en ejecutarse y no era demasiado preciso. Pero Franz Och construyó una versión de aprendizaje automático capaz de entrar en la web y encontrar todos los artículos traducidos del alemán al inglés o viceversa y aprender de ellos. Y después se optimizó, así que funciona en milisegundos.
Yo convencí a Franz y él se convenció a sí mismo, de que comprender el genoma humano a la escala a la que lo intentamos será uno de los mayores retos de traducción de la historia.
¿En qué se parece descubrir la conexión entre genes y enfermedades a traducir idiomas?
Todo lo que hay en una célula deriva de tu ADN, todas las proteínas, su estructura, si duran segundos o días. Todo eso está preprogramado en el lenguaje del ADN, que después se traduce en vida. A la gente le sorprenderá muchísimo saber hasta qué punto somos una especie con ADN por software.