.

Otros

Un cuello de botella de datos frena el avance de la ciencia de la IA, afirma el nuevo ganador del Nobel

0

La utilidad de la IA para el descubrimiento científico se verá limitada sin datos de alta calidad.

  • por Melissa Heikkilä | traducido por
  • 15 Octubre, 2024

Esta historia apareció originalmente en The Algorithm, nuestro boletín semanal sobre inteligencia artificial. Para recibir historias como esta en tu bandeja de entrada antes que nadie, regístrate aquí .

David Baker no ha dormido bien, pero está contento. Después de todo, acaba de ganar el premio Nobel.

La llamada de la Real Academia Sueca de Ciencias lo despertó en mitad de la noche. O, mejor dicho, lo despertó su mujer. Ella contestó el teléfono en su casa de Washington DC y gritó que había ganado el Premio Nobel de Química. El premio es el máximo reconocimiento a su labor como bioquímico en la Universidad de Washington.

“Me desperté a las dos [de la mañana] y básicamente no dormí en todo el día, que fue todo fiestas y cosas así”, me dijo al día siguiente del anuncio. “Tengo muchas ganas de volver un poco a la normalidad hoy”.

La semana pasada fue un hito importante para la IA, con dos premios Nobel otorgados por descubrimientos relacionados con la IA.

Baker no fue el único que ganó el Premio Nobel de Química. La Real Academia Sueca de Ciencias se lo otorgó a Demis Hassabis, cofundador y director ejecutivo de Google DeepMind, y a John M. Jumper, director de la misma empresa. Google DeepMind fue premiado por su investigación sobre AlphaFold , una herramienta que puede predecir cómo se estructuran las proteínas, mientras que Baker fue reconocido por su trabajo utilizando IA para diseñar nuevas proteínas . Lea más sobre esto aquí .

Mientras tanto, el premio de física fue para Geoffrey Hinton , un científico informático cuyo trabajo pionero en el aprendizaje profundo en los años 1980 y 1990 sustenta todos los modelos de IA más poderosos del mundo actual, y su colega informático John Hopfield, quien inventó un tipo de red neuronal de coincidencia de patrones que puede almacenar y reconstruir datos. Lea más sobre esto aquí .

En declaraciones a los periodistas después de que se anunció el premio, Hassabis dijo que cree que anunciará el uso de más herramientas de inteligencia artificial para realizar descubrimientos científicos importantes.

Pero hay un problema: la IA necesita grandes cantidades de datos de alta calidad para ser útil para la ciencia, y las bases de datos que contienen ese tipo de datos son escasas, dice Baker.

El premio es un reconocimiento a toda la comunidad de personas que trabajan como diseñadores de proteínas. Ayudará a que el diseño de proteínas pase de ser un tema marginal y lunático, en el que nadie pensó que sería útil para nada, a ser un tema central, afirma.

La IA ha sido un punto de inflexión para bioquímicos como Baker. Ver lo que DeepMind pudo hacer con AlphaFold dejó en claro que el aprendizaje profundo iba a ser una herramienta poderosa para su trabajo.

“Hay muchos problemas que antes eran muy difíciles y que ahora estamos resolviendo con mucho más éxito gracias a los métodos de IA generativa. Podemos hacer cosas mucho más complicadas”, afirma Baker.

Baker ya está muy ocupado trabajando. Dice que su equipo se está centrando en el diseño de enzimas, que llevan a cabo todas las reacciones químicas de las que dependen los seres vivos para existir. Su equipo también está trabajando en medicamentos que sólo actúan en el momento y lugar adecuados en el cuerpo.

Pero Baker duda en afirmar que este es un momento decisivo para la IA en la ciencia.

En el campo de la IA hay un dicho: basura que entra, basura que sale. Si los datos que se introducen en los modelos de IA no son buenos, los resultados tampoco serán deslumbrantes.

El poder de las herramientas de IA ganadoras del Premio Nobel de Química reside en el Banco de Datos de Proteínas (PDB), un tesoro de datos de alta calidad, seleccionados y estandarizados. Este es exactamente el tipo de datos que la IA necesita para hacer algo útil. Pero la tendencia actual en el desarrollo de la IA es entrenar modelos cada vez más grandes sobre todo el contenido de Internet, que está cada vez más lleno de basura generada por la IA. Esta basura, a su vez, se absorbe en los conjuntos de datos y contamina los resultados, lo que genera sesgos y errores. Eso simplemente no es suficiente para un descubrimiento científico riguroso.

“Si hubiera muchas bases de datos tan buenas como la PDB, diría que sí, que este [premio] probablemente sea solo el primero de muchos, pero es una base de datos única en biología”, afirma Baker. “No se trata solo de los métodos, sino de los datos. Y no hay tantos lugares donde tengamos ese tipo de datos”.


Ahora lee el resto de El Algoritmo

Aprendizaje más profundo

Adobe quiere facilitar a los artistas la inclusión de su trabajo en la lista negra para que no sea rastreado por la IA

Adobe ha anunciado una nueva herramienta para ayudar a los creadores a marcar su trabajo con una marca de agua y evitar que se utilice para entrenar modelos de IA generativos. La aplicación web, llamada Adobe Content Authenticity, también ofrece a los artistas la oportunidad de añadir "credenciales de contenido", incluida su identidad verificada, sus cuentas de redes sociales u otros dominios en línea, a su trabajo.

Una firma digital: las credenciales de contenido se basan en C2PA, un protocolo de Internet que utiliza criptografía para etiquetar de forma segura imágenes, vídeos y audio con información que aclara su procedencia (el equivalente del siglo XXI a la firma de un artista). Los creadores pueden aplicarlas a su contenido independientemente de si se creó con herramientas de Adobe. La empresa lanzará una versión beta pública a principios de 2025. Lea más de Rhiannon Williams aquí .

Bits y bytes

Por qué la inteligencia artificial y la energía limpia se necesitan mutuamente
Se está librando una batalla geopolítica sobre el futuro de la IA. La clave para ganarla es una revolución de energía limpia, sostienen Michael Kearney y Lisa Hansmann, de Engine Ventures, una empresa que invierte en empresas emergentes que comercializan ciencia e ingeniería de vanguardia. Creen que las enormes demandas energéticas de la IA representan una oportunidad para ampliar la próxima generación de tecnologías de energía limpia. ( MIT Technology Review )

El estado de la IA en 2025
El inversor en inteligencia artificial Nathan Benaich y Air Street Capital han publicado su análisis anual sobre el estado de la inteligencia artificial. ¿Sus predicciones para el próximo año? Los grandes modelos patentados comenzarán a perder su ventaja y los laboratorios se centrarán más en la planificación y el razonamiento. Tal vez no sea de sorprender que el inversor también apueste a que un puñado de empresas de inteligencia artificial comenzarán a generar ingresos importantes.

Silicon Valley, el nuevo monstruo del lobby
Los tentáculos de las grandes tecnológicas llegan a todas partes en Washington DC. Esta es una mirada fascinante a cómo las empresas tecnológicas presionan a los políticos para influir en la forma en que se regula la inteligencia artificial en los Estados Unidos. ( The New Yorker )

Otros

  1. La IA podría ayudar a encontrar puntos en común durante las deliberaciones de temas polémicos

    Los grupos que utilizaron las LLM de Google DeepMind avanzaron más a la hora de encontrar puntos de encuentro. Pero la tecnología no sustituirá a los mediadores humanos a corto plazo

  2. La "voz avanzada" de OpenAI llega a más usuarios con el objetivo de ser un asistente natural

    La compañía dice que la versión actualizada responde a tus emociones y tono de voz y te permite interrumpirla a mitad de una oración.

  3. Crece la preocupación de los virólogos por la gripe aviar: "Tiene potencial pandémico"

    La pervivencia de la gripe aviar en vacas lecheras de las granjas de EE UU podría mantenerse para siempre, un factor que está aumenta el riesgo de brotes en mamíferos -incluidos los humanos- en todo el mundo.

    Aves de corral | Getty Images