.

Inteligencia Artificial

Meta ofrece gratis un gran conjunto de datos para acelerar el descubrimiento de nuevos materiales mediante IA

1

Open Materials 2024 (OMat24) es uno de los mayores conjuntos de datos de entrenamiento de IA para la ciencia de materiales y está disponible de forma abierta y gratuita

  • por Melissa Heikkilä | traducido por
  • 22 Octubre, 2024

Meta ha lanzado un enorme conjunto de datos y modelos, denominado Open Materials 2024 (OMat24), que podría ayudar a los científicos a utilizar la IA para descubrir nuevos materiales mucho más rápido. OMat24 aborda uno de los mayores cuellos de botella en el proceso de descubrimiento: los datos.

Para encontrar nuevos materiales, los científicos calculan las propiedades de los elementos de toda la tabla periódica y simulan distintas combinaciones en ordenadores. Este trabajo podría ayudarnos a descubrir nuevos materiales con propiedades que contribuyan a mitigar el cambio climático, por ejemplo, fabricando mejores baterías o ayudando a crear nuevos combustibles sostenibles. Pero requiere conjuntos de datos masivos que son difíciles de conseguir. Para crearlos se necesita mucha potencia de cálculo y son muy caros. Además, muchos de los mejores conjuntos de datos y modelos disponibles en la actualidad están patentados y los investigadores no tienen acceso a ellos. Es ahí donde Meta espera ayudar: La empresa publica hoy su nuevo conjunto de datos y modelos de forma gratuita y los hace de código abierto. El conjunto de datos y los modelos están disponibles en la comunidad de desarrolladores Hugging Face para que cualquiera pueda descargarlos, probarlos y utilizarlos.

 "Creemos firmemente que contribuyendo a la comunidad y construyendo sobre modelos de datos de código abierto, toda la comunidad avanza más y más rápido", afirma Larry Zitnick, investigador principal del proyecto OMat.

Zitnick afirma que el nuevo modelo OMat24 encabezará la clasificación Matbench Discovery, que clasifica los mejores modelos de aprendizaje automático para la ciencia de materiales. Además, su conjunto de datos será uno de los mayores disponibles.

"La ciencia de los materiales está viviendo una revolución del aprendizaje automático", afirma Shyue Ping Ong, profesor de nanoingeniería de la Universidad de California en San Diego que no participó en el proyecto.

Antes, los científicos se limitaban a hacer cálculos muy precisos de las propiedades de los materiales en sistemas muy pequeños o a hacer cálculos menos precisos en sistemas muy grandes, dice Ong. Los procesos eran laboriosos y caros. El aprendizaje automático ha colmado esa laguna, y los modelos de IA permiten a los científicos realizar simulaciones sobre combinaciones de cualquier elemento de la tabla periódica de forma mucho más rápida y barata, afirma.

Gábor Csányi, catedrático de modelización molecular de la Universidad de Cambridge, que no participó en el trabajo, afirma que la decisión de Meta de hacer público su conjunto de datos es más importante que el propio modelo de IA.

"Esto contrasta con la situación de otras grandes empresas del sector, como Google y Microsoft, que también han publicado recientemente modelos competitivos entrenados con conjuntos de datos igualmente grandes pero secretos", afirma Csányi.

Para crear el conjunto de datos OMat24, Meta tomó uno ya existente, llamado Alexandria, y extrajo materiales de él. Después realizaron varias simulaciones y cálculos de distintos átomos para escalarlo.

El conjunto de datos de Meta tiene unos 110 millones de puntos de datos, muchas veces más que los anteriores. Otros tampoco tienen necesariamente datos de alta calidad, dice Ong.

Meta ha ampliado considerablemente el conjunto de datos más allá de lo que ha hecho la comunidad actual de científicos de materiales, y con gran precisión, afirma Ong.

La creación de estos conjuntos de datos requiere una gran capacidad de cálculo, y Meta es una de las pocas empresas del mundo que puede permitírselo. Zitnick dice que la empresa tiene otro motivo para este trabajo: Espera encontrar nuevos materiales para hacer más asequibles sus gafas inteligentes de realidad aumentada.

Según Chris Bartel, profesor adjunto de Ingeniería Química y Ciencia de los Materiales en la Universidad de Minnesota, que tampoco participó en el trabajo de Meta, los trabajos anteriores sobre bases de datos abiertas, como la creada por el Materials Project, han transformado la ciencia computacional de los materiales en la última década.

Herramientas como GNoME (redes gráficas para la exploración de materiales) de Google han demostrado que el potencial para encontrar nuevos materiales aumenta con el tamaño del conjunto de entrenamiento, añade.

"La publicación del conjunto de datos [OMat24] es un auténtico regalo para la comunidad y sin duda acelerará de inmediato la investigación en este campo", afirma Bartel.

Inteligencia Artificial

 

La inteligencia artificial y los robots están transformando nuestra forma de trabajar y nuestro estilo de vida.

  1. Minería paralela de datos, la técnica del nuevo traductor de Meta para dominar más de 100 idiomas

    La aplicación presentada por Meta nos acerca a la creación de un dispositivo de traducción universal similar al Pez de Babel de La guía del autoestopista galáctico, de Douglas Adams

    Minería paralela de datos, la técnica del nuevo traductor de Meta para dominar más de 100 idiomas
  2. Convirtiendo los trinos en datos: esta IA estudia la migración de las aves a través del sonido

    Tras décadas de frustración, las herramientas de aprendizaje automático están revelando a los ecologistas un tesoro de datos acústicos

  3. Mundos virtuales generativos y modelos que "razonan": qué nos depara la IA en 2025

    Ya sabemos que los agentes y los pequeños modelos lingüísticos serán las grandes tendencias del futuro. No obstante, destacamos otras cinco tendencias que deberías seguir de cerca este año

    Qué nos depara la IA en 2025