Computación

El ordenador que imita la mente de un químico para imaginarse nuevos fármacos

Un software ha sido alimentado con cientos de miles de ejemplos de moléculas ya existentes y ha aprendido a combinarlas para proponer nuevas estructuras y funciones que den lugar a nuevos fármacos

por Tom Simonite | traducido por Teresa Woods
15 Noviembre, 2016

¿Qué se obtiene al mezclar aspirina con ibuprofeno? El profesor de química de la Universidad de Harvard (EEUU) Alán Aspuru-Guzik no está seguro y por eso ha entrenado a un software para que le diga cuál es la estructura molecular que resulta al combinar propiedades de ambos fármacos.

El programa de inteligencia artificial (IA) podría ayudar a encontrar nuevos compuestos farmacéuticos. Las investigaciones farmacéuticas tienden a apoyarse en programas que revisan exhaustivamente enormes conjuntos de moléculas candidatas con reglas escritas por químicos y en simulaciones para identificar o predecir estructuras útiles. El primero depende de que los humanos piensen en todo, mientras el segundo está limitado por la precisión de las simulaciones y la potencia computacional necesaria.

El sistema de Aspuru-Guzik puede inventarse estructuras sin depender tanto de los humanos ni de largas simulaciones. Para ello se aprovecha de su propia experiencia, acumulada por los algoritmos de aprendizaje automático entrenados con datos de cientos de miles de moléculas.

Crédito: Universidad de Harvard.

"El programa explora de manera más intuitiva, con conocimientos químicos que ha aprendido como haría un químico", señala Aspuru-Guzik y añade: "Los humanos podrían ser mejores químicos si estuvieran asistidos por un software de este tipo". Aspuru-Guzik fue incluido en la lista de 2010 de Innovadores Menores de 35 de MIT Technology Review.

El nuevo sistema fue desarrollado con una técnica de aprendizaje automática, el aprendizaje profundo, que se ha generalizado en empresas de computación pero está menos establecido en las ciencias naturales. Emplea un diseño conocido como un modelo generativo, que ingiere gran cantidad de datos y emplea lo aprendido para generar nuevos datos propios.

Los modelos generativos suelen usarse para crear imágenes, discursos y textos, por ejemplo en el caso de la prestación Smart Reply (respuesta inteligente) de Google que sugiere respuestas a los correos electrónicos. Pero el pasado mes, Aspuru-Guzik y sus compañeros de las universidades de Harvard, de Toronto (Canadá) y de Cambridge (Reino Unido) publicaron los resultados de un modelo generativo entrenado con 250.000 moléculas de perfil farmacéutico.

El sistema podría generar nuevas estructuras potenciales al combinar propiedades de compuestos farmacéuticos existentes, y se le podría pedir que sugiera moléculas que muestren determinadas propiedades como la solubilidad y ser fácil de sintetizar.

El profesor de química de la Universidad de Stanford (EEUU) y socio de la empresa de capital riesgo Andreessen Horowitz, Vijay Pande, afirma que el proyecto se suma a las crecientes pruebas de que las nuevas estrategias del aprendizaje automático transformarán las investigaciones científicas (ver Stopping Breast Cancer with Help from AI).

Para el experto, el trabajo sugiere que el software de aprendizaje profundo puede interiorizar un tipo de conocimientos químicos y emplearlo para ayudar a los científicos. "Creo que esto podría ser ampliamente aplicable", señala Pande. En su opinión, "podría jugar un papel en la identificación o la optimización de los mejores candidatos a fármaco, o en otras áreas como células solares o catalizadores".

Los investigadores ya han jugado a entrenar a su sistema con una base de datos de moléculas de LED orgánicas, que son importantes para las pantallas. Pero para convertir la técnica en una herramienta práctica habrá que mejorar sus capacidades químicas, porque las estructuras que sugiere a veces carecen de sentido.

Pande señala que un desafío para pedir al software que aprenda química podría ser que los investigadores aún no han identificado el mejor formato de datos con los que alimentar al software de aprendizaje profundo. Las imágenes, el habla y el texto han demostrado encajar bien, tal y como demuestra el hecho de que los softwares del reconocimiento de imágenes, el reconocimiento de voz y la traducción ya casi logran el mismo rendimiento que los humanos. Pero las distintas formas de codificar las estructuras químicas puede que no sean del todo acertadas.

Aspuru-Guzik y sus compañeros están pensando en esto, y también en añadir nuevas prestaciones al sistema para reducir su tasa de gazapos químicos.

También espera que proporcionar más datos a su sistema para ampliar sus conocimientos químicos mejore su potencia, de la misma manera que las bases de datos de millones de fotos han ayudado a lograr que el reconocimiento de imágenes sea útil. La base de datos de la Sociedad Química Estadounidense contiene alrededor de 100 millones de estructuras químicas publicadas. Dentro de poco, Aspuru-Guzik espera alimentar una versión de su programa de IA con todas ellas.

Computación

El ordenador que imita la mente de un químico para imaginarse nuevos fármacos

Google anuncia un hito hacia la computación cuántica sin errores

El vídeo es el rey: bienvenido a la era del contenido audiovisual

Esta empresa quiere superar a Google e IBM en la carrera cuántica con un superordenador de fotones