Inteligencia Artificial

La nueva IA de Google ya puede resolver problemas matemáticos complejos

AlphaProof y AlphaGeometry son pasos hacia la construcción de sistemas que puedan razonar, lo que podría desbloquear nuevas e interesantes capacidades.

por Rhiannon Williams | traducido por
29 Julio, 2024

Los modelos de IA pueden generar fácilmente ensayos y otros tipos de texto. Sin embargo, no son ni de lejos tan buenos resolviendo problemas matemáticos, que suelen implicar razonamiento lógico, algo que está más allá de las capacidades de la mayoría de los sistemas de IA actuales.

Pero esto puede estar cambiando. Google DeepMind afirma haber entrenado dos sistemas de IA especializados para resolver problemas matemáticos complejos que implican un razonamiento avanzado. Los sistemas, llamados AlphaProof y AlphaGeometry 2, trabajaron juntos para resolver con éxito cuatro de los seis problemas de la edición de este año de la Olimpiada Matemática Internacional (IMO, por sus siglas en inglés), una prestigiosa competición para estudiantes de secundaria. Ganaron el equivalente a una medalla de plata.

Es la primera vez que un sistema de IA logra un porcentaje de éxito tan alto en este tipo de problemas. "Es un gran avance en el campo del aprendizaje automático y la IA", afirma Pushmeet Kohli, vicepresidente de investigación de Google DeepMind, que trabajó en el proyecto. "Hasta ahora no se había desarrollado ningún sistema que pudiera resolver problemas con esta tasa de éxito y con este nivel de generalidad".

Hay algunas razones por las que los problemas matemáticos que implican razonamiento avanzado son difíciles de resolver para los sistemas de IA. Este tipo de problemas suelen requerir la formación y el uso de abstracciones. También implican una planificación jerárquica compleja, así como establecer submetas, retroceder y probar nuevos caminos. Todo ello supone un reto para la IA.

"A menudo es más fácil entrenar un modelo matemático si tienes una forma de comprobar sus respuestas (por ejemplo, en un lenguaje formal), pero comparativamente hay menos datos matemáticos formales en línea en comparación con el lenguaje natural de forma libre (lenguaje informal)", dice Katie Collins, investigadora de la Universidad de Cambridge especializada en matemáticas e IA, pero que no participó en el proyecto.

Salvar esta distancia era el objetivo de Google DeepMind al crear AlphaProof, un sistema basado en el aprendizaje por refuerzo que se entrena a sí mismo para demostrar enunciados matemáticos en el lenguaje formal de programación Lean. La clave es una versión de la IA Gemini de DeepMind que se ha perfeccionado para traducir automáticamente problemas matemáticos redactados en lenguaje natural e informal a enunciados formales, más fáciles de procesar para la IA. Así se creó una gran biblioteca de problemas matemáticos formales con distintos grados de dificultad.

Automatizar el proceso de traducción de datos a lenguaje formal es un gran paso adelante para la comunidad matemática, afirma Wenda Li, profesora de IA híbrida de la Universidad de Edimburgo, que revisó la investigación, pero no participó en el proyecto.

"Podemos confiar mucho más en la corrección de los resultados publicados si son capaces de formular este sistema de comprobación, y también puede ser más colaborativo", añade.

El modelo Gemini trabaja junto a AlphaZero (el modelo de aprendizaje por refuerzo que Google DeepMind entrenó para dominar juegos como el Go y el ajedrez) para probar o refutar millones de problemas matemáticos. A medida que ha ido resolviendo problemas con éxito, AlphaProof ha mejorado la resolución de problemas de complejidad creciente.

Mientras que AlphaProof fue entrenado para abordar problemas de una amplia gama de temas matemáticos, AlphaGeometry 2 (una versión mejorada de un sistema que Google DeepMind anunció en enero) fue optimizado para abordar problemas relacionados con movimientos de objetos y ecuaciones que implican ángulos, proporciones y distancias. Al haber sido entrenado con muchos más datos sintéticos que su predecesor, fue capaz de enfrentarse a preguntas de geometría mucho más complejas.

Para probar las capacidades de los sistemas, los investigadores de Google DeepMind les encargaron que resolvieran los seis problemas planteados a los humanos que competían en la OMI de este año y demostraran que las respuestas eran correctas. AlphaProof resolvió dos problemas de álgebra y uno de teoría de números, uno de los cuales era el más difícil de la competición. AlphaGeometry 2 resolvió con éxito una pregunta de geometría, pero dos preguntas de combinatoria (un área de las matemáticas centrada en contar y ordenar objetos) quedaron sin resolver.

"En general, AlphaProof se desempeña mucho mejor en álgebra y teoría de números que en combinatoria", explica Alex Davies, ingeniero de investigación del equipo de AlphaProof. "Seguimos trabajando para entender por qué ocurre esto, lo que esperamos que nos lleve a mejorar el sistema".

Dos matemáticos de renombre, Tim Gowers y Joseph Myers, comprobaron las respuestas de los sistemas. Concedieron a cada una de sus cuatro respuestas correctas una puntuación completa (siete de siete), lo que otorgó a los sistemas un total de 28 puntos de un máximo de 42. Un participante humano con esta puntuación obtendría la medalla de plata y se quedaría a las puertas de la de oro, cuyo umbral comienza en 29 puntos.

Es la primera vez que un sistema de IA consigue una medalla en las preguntas de la OMI. "Como matemático, me parece muy impresionante, y un salto significativo respecto a lo que era posible anteriormente", declaró Gowers durante una rueda de prensa.

Myers coincidió en que las respuestas matemáticas de los sistemas representan un avance sustancial respecto a lo que la IA podía lograr anteriormente. "Será interesante ver cómo se escalan las cosas y si se pueden hacer más rápidas, y si se pueden extender a otros tipos de matemáticas", dijo.

La creación de sistemas de IA capaces de resolver problemas matemáticos más complejos podría allanar el camino a interesantes colaboraciones entre humanos e IA, ayudando a los matemáticos a resolver e inventar nuevos tipos de problemas, afirma Collins. Esto, a su vez, podría ayudarnos a aprender más sobre cómo los humanos afrontamos las matemáticas.

"Todavía hay mucho que no sabemos sobre cómo los humanos resolvemos problemas matemáticos complejos", afirma.

Inteligencia Artificial

La nueva IA de Google ya puede resolver problemas matemáticos complejos

Deep Research, la herramienta de OpenAI que realiza investigaciones complejas en minutos

El modelo o3-mini de OpenAI, una IA más eficiente y con capacidad de "razonar"

DeepSeek cuestiona la idea de que la IA necesita más energía