
En 2017, recién doctorado en química teórica, John Jumper escuchó rumores: Google DeepMind había dejado atrás los proyectos de IA que jugaban con destreza sobrehumana y trabajaba en algo secreto, un sistema para predecir la estructura de las proteínas. Jumper no lo dudó y solicitó un puesto.
Solo tres años después, celebraba un triunfo inesperado. Junto al CEO Demis Hassabis, lideró el desarrollo de AlphaFold 2, un sistema capaz de predecir la estructura de las proteínas con una precisión atómica, igualando la exactitud de las técnicas más complejas de laboratorio, pero en una fracción del tiempo: horas en lugar de meses.
AlphaFold 2 resolvió un desafío histórico en biología que llevaba medio siglo sin respuesta. “Esta es la razón por la que fundé DeepMind”, me dijo Hassabis hace unos años. “De hecho, es el motivo por el que he dedicado toda mi carrera a la IA”. En 2024, Jumper y Hassabis compartieron el Nobel de Química.
Esta semana se cumplen cinco años desde que AlphaFold 2 sorprendió a la comunidad científica. Ahora que la euforia inicial se ha disipado, cabe preguntarse: ¿qué impacto real ha tenido? ¿Cómo lo están utilizando los investigadores? ¿Y qué viene después? Hablé con Jumper y con otros científicos para averiguarlo.
“Han sido cinco años extraordinarios”, dice Jumper entre risas: «Cuesta recordar cómo era mi vida antes de conocer a tantos periodistas”.
Tras AlphaFold 2 llegaron AlphaFold Multimer, capaz de predecir estructuras formadas por más de una proteína, y después AlphaFold 3, la versión más rápida hasta ahora. Google DeepMind también liberó AlphaFold sobre UniProt, una enorme base de datos de proteínas que millones de investigadores utilizan y actualizan en todo el mundo. Hoy, el sistema ha predicho la estructura de unas 200 millones de proteínas, prácticamente todas las que la ciencia conoce.
Pese al éxito, Jumper mantiene la cautela sobre los logros de AlphaFold. “Eso no significa que tengamos certeza absoluta sobre todo lo que contiene”, advierte. “Es una base de datos de predicciones, y arrastra todas las limitaciones propias de las predicciones”.
Un problema complejo
Las proteínas son las máquinas biológicas que hacen posible la vida. Forman músculos, cuernos y plumas; transportan oxígeno por el organismo y transmiten mensajes entre células; activan neuronas, digieren alimentos, impulsan el sistema inmunitario… y mucho más. Pero comprender con exactitud qué hace una proteína y qué papel puede desempeñar en distintas enfermedades o tratamientos exige conocer su estructura. Y eso no es fácil.
Las proteínas están formadas por cadenas de aminoácidos que las fuerzas químicas retuercen hasta convertir en nudos complejos. Una cadena sin plegar apenas ofrece pistas sobre la estructura que adoptará. En teoría, la mayoría de las proteínas podrían asumir un número astronómico de formas posibles. El reto consiste en predecir la correcta.
Jumper y su equipo desarrollaron AlphaFold 2 utilizando un tipo de red neuronal conocida como transformer, la misma tecnología que sustenta los grandes modelos de lenguaje. Los transformers son especialmente eficaces para identificar las partes clave dentro de un problema complejo.
Pero Jumper atribuye buena parte del éxito a la rapidez con la que pudieron probar un modelo inicial. “Obtuvimos un sistema que daba respuestas erróneas a una velocidad increíble”, recuerda. “Eso nos permitió ser muy audaces con las ideas que probábamos”.
Llenaron la red neuronal con toda la información posible sobre estructuras proteicas, como la forma en que proteínas de distintas especies han evolucionado hacia configuraciones similares. Y funcionó incluso mejor de lo que esperaban. «Estábamos seguros de haber logrado un avance», afirma Jumper. «Sabíamos que era un salto increíble en términos de ideas».
Lo que no había previsto era que los investigadores descargarían el software y empezarían a usarlo de inmediato para todo tipo de aplicaciones. Normalmente, explica, el verdadero impacto llega tras varias iteraciones, cuando se han corregido los fallos: «Me ha sorprendido la responsabilidad con que los científicos lo han utilizado, tanto en la interpretación como en la práctica, confiando en él lo justo, ni demasiado ni demasiado poco”.
Pero, ¿Hay algún proyecto que destaque en particular?
Ciencia de las abejas
Jumper menciona un grupo de investigación que emplea AlphaFold para estudiar la resistencia a enfermedades en abejas melíferas. «Querían comprender una proteína concreta mientras analizaban fenómenos como el colapso de las colonias», explica. «Jamás habría dicho: «Por supuesto, AlphaFold se usará en ciencia de las abejas»».
También destaca algunos ejemplos de lo que él llama usos «no indicados» [en inglés off label, literalmente «fuera de etiqueta»] de AlphaFold “en el sentido de que no estaba garantizado que funcionara”, casos en los que la capacidad de predecir estructuras proteicas ha abierto nuevas técnicas de investigación. “El primero, muy evidente, son los avances en el diseño de proteínas”, señala. «David Baker y otros han aprovechado esta tecnología al máximo».
Baker, biólogo computacional en la Universidad de Washington (EE UU), fue co-ganador del Nobel de Química el año pasado junto a Jumper y Hassabis por su trabajo en la creación de proteínas sintéticas capaces de realizar tareas específicas, como tratar enfermedades o degradar plásticos, mejor que las proteínas naturales.
Baker y su equipo han desarrollado su propia herramienta basada en AlphaFold, llamada RoseTTAFold. Pero también han experimentado con AlphaFold Multimer para predecir cuáles de sus diseños de proteínas sintéticas podrían funcionar.
«Básicamente, si AlphaFold confirma con seguridad la estructura que intentabas diseñar, la fabricas; si dice «no lo sé », no la haces. Solo eso supuso una mejora enorme». Según Jumper, este método puede acelerar el proceso de diseño hasta diez veces.
Otro uso «no idicado» que menciona Jumper: convertir AlphaFold en una especie de buscador. Habla de dos grupos de investigación que trataban de entender cómo las células espermáticas humanas se unen al óvulo durante la fecundación. Sabían cuál era una de las proteínas implicadas, pero no la otra. «Así que tomaron una proteína conocida del óvulo y analizaron las 2.000 proteínas de la superficie del esperma humano. Encontraron una que AlphaFold consideraba muy probable que se adhiriera al óvulo». Después lograron confirmarlo en el laboratorio.
«La idea de usar AlphaFold para algo que antes era imposible (nunca analizarías 2.000 estructuras buscando una sola respuesta) me parece realmente extraordinaria», afirma.
Cinco años después
Cuando apareció AlphaFold 2, pregunté a varios pioneros qué opinaban. Las primeras valoraciones fueron positivas, pero la tecnología era demasiado nueva para saber qué impacto tendría a largo plazo. Ahora he vuelto a hablar con uno de ellos para conocer su visión cinco años después.
Kliment Verba dirige un laboratorio de biología molecular en la Universidad de California, San Francisco (EE UU). «Es una tecnología increíblemente útil, no hay duda», me dice. «La usamos todos los días, constantemente».
Pero está lejos de ser perfecta. Muchos científicos recurren a AlphaFold para estudiar patógenos o desarrollar fármacos. Esto implica analizar interacciones entre varias proteínas o entre proteínas y moléculas más pequeñas del organismo. Sin embargo, se sabe que AlphaFold es menos preciso al predecir interacciones múltiples o su evolución en el tiempo.
Verba asegura que él y su equipo ya se han acostumbrado a esas limitaciones. «Hay muchos casos en los que obtienes una predicción y te quedas pensando», explica. «¿Es real o no lo es? No está del todo claro, está en una especie de zona gris».
«Es un poco lo mismo que ChatGPT», añade, y explica: «Ya sabes: puede darte una respuesta falsa con la misma seguridad que una verdadera».
Aun así, el equipo de Verba utiliza AlphaFold (tanto la versión 2 como la 3, porque tienen fortalezas distintas) para ejecutar versiones virtuales de sus experimentos antes de llevarlos al laboratorio. Con los resultados de AlphaFold, pueden acotar el enfoque de una prueba o decidir que no merece la pena realizarla.
«Realmente ahorra tiempo», afirma. «No ha sustituido ningún experimento, pero los ha complementado bastante».
Nueva ola
AlphaFold se diseñó para múltiples usos. Varias startups y laboratorios universitarios están aprovechando su éxito para crear una nueva generación de herramientas orientadas al descubrimiento de fármacos. Este año, una colaboración entre investigadores del MIT (Instituto Tecnológico de Massachussets) y la empresa de IA farmacéutica Recursion dio lugar a un modelo llamado Boltz-2, capaz de predecir no solo la estructura de proteínas, sino también la afinidad de posibles moléculas con su objetivo.
El mes pasado, la startup Genesis Molecular AI presentó otro modelo de predicción estructural llamado Pearl, que según la compañía supera a AlphaFold 3 en ciertas consultas clave para el desarrollo de medicamentos. Pearl es interactivo: permite a los desarrolladores incorporar datos adicionales para guiar las predicciones.
AlphaFold supuso un salto enorme, pero queda mucho por hacer, señala Evan Feinberg, CEO de Genesis Molecular AI: «Seguimos innovando de forma fundamental, solo que ahora partimos de una base mucho mejor».
Genesis Molecular AI está reduciendo los márgenes de error desde menos de dos ángstroms (el estándar fijado por AlphaFold) hasta menos de uno: una diez millonésima de milímetro, el ancho de un átomo de hidrógeno.
«Pequeños errores pueden ser catastróficos para predecir si un fármaco se unirá a su objetivo», advierte Michael LeVine, vicepresidente de modelado y simulación en la empresa. Las fuerzas químicas que interactúan a un ángstrom pueden dejar de hacerlo a dos. «Puede pasar de «nunca interactuarán», a «sí lo harán»», explica.
Con tanta actividad en este campo, ¿cuándo veremos nuevos tipos de fármacos en el mercado? Jumper es pragmático. La predicción de estructuras proteicas es solo un paso más, señala: «Este no era el único problema de la biología. No estábamos a una estructura de proteína de curar todas las enfermedades».
Lo resume así: antes, determinar la estructura de una proteína podía costar 100.000 dólares en el laboratorio. «Si solo nos separaran cien mil dólares de lograr algo, ya estaría hecho».
Al mismo tiempo, los investigadores buscan exprimir al máximo esta tecnología, añade Jumper: «Intentamos que la predicción estructural sea una parte aún mayor del problema, porque tenemos un martillo enorme para golpearlo».
¿Convertir todo en clavos? «Sí, hagamos que todo sean clavos», responde. «¿Cómo hacemos que esto que ahora es un millón de veces más rápido sea una pieza más grande de nuestro proceso?».
¿Qué viene después?
¿El próximo movimiento de Jumper? Quiere combinar la potencia profunda pero específica de AlphaFold con el alcance amplio de los LLM (grandes modelos de lenguaje, por sus siglas en inglés).
«Tenemos máquinas que pueden leer ciencia. Pueden razonar científicamente», afirma. «Y podemos construir sistemas asombrosos, sobrehumanos, para predecir estructuras proteicas. ¿Cómo logramos que estas dos tecnologías trabajen juntas?».
Eso me recuerda a AlphaEvolve, un sistema que desarrolla otro equipo de Google DeepMind. AlphaEvolve utiliza un LLM para generar posibles soluciones y un segundo modelo para filtrarlas, descartando las inútiles. Los investigadores ya lo han usado para descubrir soluciones prácticas en matemáticas y computación.
¿Es eso lo que tiene en mente Jumper? «No diré mucho sobre los métodos, pero me sorprendería que no veamos cada vez más impacto de los LLM en la ciencia», asegura. «Creo que esa es la gran pregunta abierta, sobre la que diré casi nada. Todo esto es especulación, por supuesto».
Jumper tenía 39 años cuando ganó el Nobel. ¿Qué es lo próximo para él?
«Me preocupa», admite. «Creo que soy el laureado más joven en química en 75 años».
Y añade: «Estoy más o menos en la mitad de mi carrera. Supongo que mi enfoque ahora es intentar cosas más pequeñas, ideas que puedan seguir impulsando las cosas. Lo próximo que anuncie no tiene por qué ser, ya sabes, mi segundo intento de Nobel. Creo que esa es la trampa».





