Inteligencia Artificial
AlphaFold 3 de Google DeepMind puede predecir cómo interactúan el ADN, el ARN y otras moléculas
AlphaFold 3 puede predecir cómo interactúan el ADN, el ARN y otras moléculas, lo que consolida aún más su papel de liderazgo en el descubrimiento de fármacos y la investigación. ¿A quién beneficiará?
Google DeepMind ha lanzado una versión mejorada de su herramienta de predicción biológica, AlphaFold, que puede predecir las estructuras no solo de las proteínas, sino de casi todos los elementos de la vida biológica.
Es un avance que podría ayudar a acelerar el descubrimiento de fármacos y otras investigaciones científicas. La herramienta se está utilizando actualmente para experimentar con la identificación de todo tipo de elementos, desde cultivos resistentes hasta nuevas vacunas.
Aunque el modelo anterior, lanzado en 2020, asombró a la comunidad investigadora con su capacidad para predecir estructuras de proteínas, los investigadores han estado deseando que la herramienta maneje algo más que proteínas.
Ahora, según DeepMind, AlphaFold 3 puede predecir las estructuras del ADN, el ARN y de moléculas como los ligandos, que son esenciales para el descubrimiento de fármacos. DeepMind afirma que la herramienta ofrece un retrato más matizado y dinámico de las interacciones moleculares que cualquier otra disponible hasta ahora.
"La biología es un sistema dinámico", dijo Demis Hassabis, CEO de DeepMind, a los periodistas en una conferencia. "Las propiedades de la biología surgen a través de las interacciones entre las diferentes moléculas de la célula, y se puede pensar en AlphaFold 3 como nuestro primer gran paso hacia [modelar] eso".
AlphaFold 2 nos ayudó a cartografiar mejor el corazón humano, modelizar la resistencia a los antimicrobianos e identificar huevos de aves extinguidas, pero aún no sabemos qué avances aportará AlphaFold 3.
Mohammed AlQuraishi, profesor adjunto de biología de sistemas en la Universidad de Columbia (EE UU) que no está afiliado a DeepMind, cree que la nueva versión del modelo será aún mejor para el descubrimiento de fármacos. "El sistema AlphaFold 2 solo conocía los aminoácidos, por lo que su utilidad para la biofarmacia era muy limitada", afirma. "Pero ahora, el sistema puede predecir en principio dónde se une un fármaco a una proteína".
Isomorphic Labs, una spin-off de DeepMind dedicada al descubrimiento de fármacos, ya está utilizando el modelo exactamente con ese fin, colaborando con empresas farmacéuticas para intentar desarrollar nuevos tratamientos para enfermedades, según DeepMind.
AlQuraishi afirma que este lanzamiento supone un gran paso adelante. Pero hay advertencias.
"Hace que el sistema sea mucho más general y, en particular para el descubrimiento de fármacos (en las primeras fases de la investigación), ahora es mucho más útil que AlphaFold 2", afirma. Pero como ocurre con la mayoría de los modelos, el impacto de AlphaFold dependerá de la precisión de sus predicciones. Para algunos usos, AlphaFold 3 tiene el doble de éxito que otros modelos similares como RoseTTAFold. Pero para otros, como las interacciones proteína-ARN, AlQuraishi afirma que sigue siendo muy impreciso.
DeepMind afirma que, dependiendo de la interacción que se esté modelando, la precisión puede oscilar entre el 40% y más del 80%, y que el modelo permitirá a los investigadores saber hasta qué punto confía en su predicción. Con predicciones menos precisas, los investigadores tienen que utilizar AlphaFold simplemente como punto de partida antes de buscar otros métodos. Independientemente de estos rangos de precisión, si los investigadores están tratando de dar los primeros pasos para responder a una pregunta como qué enzimas tienen el potencial de descomponer el plástico de las botellas de agua, es mucho más eficiente utilizar una herramienta como AlphaFold que técnicas experimentales como la cristalografía de rayos X.
Un modelo renovado
La mayor biblioteca de moléculas y el mayor nivel de complejidad de AlphaFold 3 exigían mejoras en la arquitectura del modelo subyacente. Así que DeepMind recurrió a las técnicas de difusión, que los investigadores de IA han ido mejorando en los últimos años y que ahora utilizan generadores de imágenes y vídeos como DALL-E 2 y Sora de OpenAI. Funciona entrenando un modelo para que empiece con una imagen ruidosa y luego reduzca ese ruido poco a poco hasta que surja una predicción precisa. Este método permite a AlphaFold 3 manejar un conjunto mucho más amplio de datos.
Esto supuso "una gran evolución con respecto al modelo anterior", afirma John Jumper, director de Google DeepMind. "Realmente simplificó todo el proceso de conseguir que todos estos átomos diferentes trabajaran juntos".
También presentaba nuevos riesgos. Como detalla el artículo de AlphaFold 3, el uso de técnicas de difusión hizo posible que el modelo alucinara, o generara estructuras que parecen plausibles pero que en realidad no podrían existir. Los investigadores redujeron ese riesgo añadiendo más datos de entrenamiento a las áreas más propensas a la alucinación, aunque eso no elimina el problema por completo.
Acceso restringido
Parte del impacto de AlphaFold 3 dependerá de cómo DeepMind reparta el acceso al modelo. En el caso de AlphaFold 2, la empresa publicó el código fuente abierto, lo que permitió a los investigadores echar un vistazo bajo el capó para comprender mejor su funcionamiento. También estaba disponible para todos los fines, incluido el uso comercial por parte de los fabricantes de medicamentos. Según Hassabis, en el caso de AlphaFold 3 no está previsto publicar el código completo. En su lugar, la empresa va a publicar una interfaz pública para el modelo denominada AlphaFold Server, que impone limitaciones sobre las moléculas con las que se puede experimentar y que sólo puede utilizarse con fines no comerciales. DeepMind afirma que la interfaz reducirá la barrera técnica y ampliará el uso de la herramienta a biólogos menos versados en esta tecnología.
Las nuevas restricciones son significativas, según AlQuraishi. "El principal argumento de venta del sistema -su capacidad para predecir interacciones entre proteínas y moléculas pequeñas- básicamente no está disponible para uso público", afirma. "En este momento es más que nada un teaser".