Inteligencia Artificial
Mundos virtuales generativos y modelos que "razonan": qué nos depara la IA en 2025
Ya sabemos que los agentes y los pequeños modelos lingüísticos serán las grandes tendencias del futuro. No obstante, destacamos otras cinco tendencias que deberías seguir de cerca este año
La serie What's Next de MIT Technology Review analiza distintos sectores, tendencias y tecnologías para ofrecerte una primera visión del futuro. Puedes leer el resto aquí (en inglés).
En los últimos dos años, hemos tratado de anticipar lo que depara el futuro en el campo de la inteligencia artificial. No es fácil, dada la velocidad a la que avanza esta industria, pero parece que estamos en racha, así que aquí vamos de nuevo.
¿Cómo nos fue la última vez? Entre las tendencias destacadas de 2024 incluimos a los chatbots personalizados: aplicaciones interactivas impulsadas por grandes modelos de lenguaje multimodal. Aunque entonces no lo sabíamos, nos referíamos a lo que ahora se conoce como agentes, la gran novedad en IA en este momento. También hablamos de vídeo generativo y aquí acertamos de nuevo: pocas tecnologías han avanzado tanto en los últimos 12 meses, con OpenAI y Google DeepMind que lanzaron sus modelos, Sora y Veo, con apenas una semana de diferencia. Por otro lado, mencionamos robots de propósito general, capaces de realizar una variedad más amplia de tareas. Volvimos a dar en el clavo. Los avances en grandes modelos de lenguaje continúan impactando otras áreas tecnológicas y la robótica es una de las grandes beneficiadas.
También predijimos que la desinformación electoral generada por inteligencia artificial estaría omnipresente, pero en este caso, afortunadamente, nos equivocamos. Este año ha habido muchos temas que han generado preocupación, pero los deepfakes políticos han sido relativamente escasos.
¿Qué nos depara 2025? Vamos a dejar de lado lo evidente: es muy probable que los agentes y los modelos lingüísticos más pequeños dominarán el sector. En su lugar, aquí presentamos cinco tendencias alternativas según nuestro equipo de IA.
1. Mundos virtuales generativos
Si 2023 fue el año de las imágenes generativas y 2024 el del vídeo generativo, ¿qué nos espera a continuación? Si apostado por mundos virtuales generativos (también conocidos como videojuegos), ¡enhorabuena, choca esos cinco!
Tuvimos un primer vistazo a esta tecnología en febrero, cuando Google DeepMind presentó un modelo generativo llamado Genie, que podía transformar una imagen estática en un juego de plataformas 2D de desplazamiento lateral con el que los jugadores podían interactuar. En diciembre, la compañía lanzó Genie 2, una versión mejorada que es capaz de convertir una imagen inicial en un mundo virtual completo.
Otras empresas también están trabajando en tecnologías similares. En octubre, las startu-ps de IA Decart y Etched mostraron una versión no oficial de Minecraft en el que cada fotograma del juego se genera en tiempo real mientras. Además, World Labs, una start-up cofundada por Fei-Fei Li, creador de ImageNet (el extenso conjunto de datos fotográficos que dio inicio al auge del aprendizaje profundo), está desarrollando lo que llaman modelos de mundo grande o LWM.
Una aplicación evidente de esta tecnología son los videojuegos. En estos primeros experimentos hay un enfoque claramente lúdico, y las simulaciones 3D generativas podrían utilizarse para explorar conceptos de diseño de nuevos juegos, transformando un boceto en un entorno jugable en tiempo real. Esto podría abrir la puerta a la creación de tipos de juegos completamente nuevos.
Además, estas simulaciones también podrían ser útiles para entrenar robots. World Labs tiene como objetivo desarrollar lo que denominan "inteligencia espacial". Es decir, la capacidad de las máquinas para interpretar y interactuar con el mundo cotidiano. No obstante, los investigadores en robótica se enfrentan a la falta de datos confiables sobre escenarios reales con los que entrenar estas tecnologías. La creación de innumerables mundos virtuales y la inserción de robots virtuales en estos entornos para que aprendan mediante ensayo y error podría ser una solución a esta carencia.
– Will Douglas Heaven
2. Grandes modelos lingüísticos que "razonan"
La expectación estaba justificada. El pasado mes de septiembre, OpenAI presentó o1, un modelo que introdujo un nuevo paradigma en el funcionamiento de los grandes modelos lingüísticos. Solo dos meses después, la empresa amplió este paradigma con o3, que podría cambiar para siempre el rumbo de esta tecnología.
La mayoría de los modelos actuales, incluido el GPT-4 de OpenAI, tienden a generar rápidamente la primera respuesta que se les ocurre. A veces es correcta, otras no tanto. Sin embargo, los nuevos modelos de la empresa están diseñados para abordar los problemas de manera más meticulosa, desglosándolos en tareas más simples y trabajando paso a paso. Cuando una solución no funciona, intentan otra. Esta técnica, conocida como "razonamiento" (un término que, sabemos, está cargado de implicaciones), tiene el potencial de hacer que la tecnología sea más precisa, especialmente en áreas como matemáticas, física y lógica.
También es crucial para los agentes.
En diciembre, Google DeepMind presentó Mariner, un nuevo agente experimental de navegación web. Durante una demostración que la empresa ofreció a MIT Technology Review, pareció tener ciertos problemas. Megha Goel, jefa de producto de la compañía, le había solicitado al agente que encontrara una receta de galletas navideñas similares a las de una foto que le mostró. Mariner localizó una receta en línea y comenzó a añadir los ingredientes a la cesta de la compra. Luego se paró: no sabía qué tipo de harina seleccionar. Mientras, Goel observaba cómo el agente detallaba sus acciones en una ventana de chat, donde decía que usaría "el botón «Atrás» del navegador para volver a la receta".
Fue un momento sorprendente. En lugar de estancarse, el agente había desglosado la tarea en pasos más pequeños y eligió uno que le permitiría resolver el problema. Aunque la acción de pulsar el botón "Atrás" pueda parecer simple, para una inteligencia artificial es un desafío complejo, pero funcionó: Mariner regresó a la receta, verificó el tipo de harina y continuó agregando los ingredientes a la cesta de Goel.
Google DeepMind también está desarrollando una versión experimental de Gemini 2.0 Flash Thinking, su último gran modelo lingüístico, que emplea este enfoque paso a paso para la resolución de problemas.
OpenAI y Google representan solo la punta del iceberg. Muchas otras empresas están desarrollando grandes modelos lingüísticos que utilizan técnicas similares, lo que les permite mejorar en una variedad de tareas que van desde cocinar hasta programar. Este año, es probable que surjan más debates sobre el razonamiento de las máquinas (sí, lo sabemos).
– Will Douglas Heaven
3. El auge de la IA en la ciencia
Uno de los usos más fascinantes de la inteligencia artificial es su capacidad para acelerar los descubrimientos en las ciencias naturales. Tal vez la mayor demostración del potencial de la IA en este ámbito ocurrió el pasado octubre, cuando la Real Academia Sueca de las Ciencias otorgó el Premio Nobel de Química a Demis Hassabis y a John M. Jumper, de Google DeepMind, por el desarrollo de AlphaFold, una herramienta capaz de resolver el plegamiento de proteínas, y a David Baker por sus herramientas para diseñar nuevas proteínas.
Es probable que esta tendencia continúe en 2025, con un mayor enfoque en conjuntos de datos y modelos diseñados específicamente para el descubrimiento científico. Las proteínas fueron un objetivo ideal para la inteligencia artificial, ya que este campo contaba con datos de alta calidad que podían utilizarse para entrenar los modelos de IA.
La búsqueda de la próxima gran novedad ya está en marcha, y una de las áreas con gran potencial es la ciencia de los materiales. Meta ha dado un paso importante al publicar conjuntos de datos y modelos masivosque podrían permitir a los científicos utilizar la IA para descubrir nuevos materiales a mayor velocidad. Además, en diciembre, Hugging Face, en colaboración con la start-up Entalpic, lanzó LeMaterial, un proyecto de código abierto cuyo objetivo es simplificar y acelerar la investigación en este campo. Su primer proyecto consiste en un conjunto de datos que unifica, limpia y estandariza la información más relevante sobre materiales.
Los creadores de modelos de IA también están dispuestos a ofrecer sus productos generativos como herramientas de investigación para los científicos. Un ejemplo de ello es OpenAI, que permitió a los investigadores probar su último modelo, o1, para evaluar cómo podría asistir en sus investigaciones. Los resultados fueron prometedores.
Contar con una herramienta de IA capaz de actuar como un científico es una de las grandes aspiraciones del sector tecnológico. En un manifiesto publicado en octubre del año pasado, Dario Amodei, fundador de Anthropic, destacaba la biología como una de las áreas clave donde una inteligencia artificial avanzada podría hacer una gran diferencia. Amodei especula que, en el futuro, la IA podría no solo servir como un método de análisis de datos, sino también como un "biólogo virtual" capaz de realizar todas las tareas que hoy llevan a cabo estos profesionales. Aunque estamos aún lejos de alcanzar este escenario, es posible que en el próximo año se den avances significativos.
– Melissa Heikkilä
4. Las empresas de inteligencia artificial, cada vez más vinculadas a la seguridad nacional
Las empresas de IA que ofrezcan sus herramientas para la vigilancia de fronteras, la recopilación de información y otras tareas de seguridad nacional pueden ganar mucho dinero.
El ejército de Estados Unidos ha puesto en marcha diversas iniciativas que demuestran su interés por adoptar la IA. Desde el programa Replicator (motivado por la guerra de Ucrania), que promete invertir 1.000 millones de dólares (unos 970 millones de euros) en pequeños drones, hasta el Artificial Intelligence Rapid Capabilities Cell (AI RCC), una unidad especializada en aplicar la IA en diversas áreas, que van desde la toma de decisiones en el campo de batalla hasta la gestión logística. Los ejércitos europeos también se ven presionados para aumentar su inversión en tecnología, impulsados por la preocupación de que la administración de Donald Trump recorte el gasto destinado a Ucrania. Además, las crecientes tensiones entre Taiwán y China están en el centro de las preocupaciones de los militares.
En 2025, estas tendencias seguirán siendo una oportunidad para empresas de tecnología de defensacomo Palantir, Anduril y otras, que ya utilizan datos militares clasificados para entrenar modelos de IA.
Los grandes presupuestos de la industria de defensa también atraerán a las principales empresas de IA. En diciembre, OpenAI anunció una colaboración con Anduril en un programa para derribar drones, marcando un giro significativo en su postura de hace un año, cuando decidió no trabajar con el ejército. De este modo, se une a Microsoft, Amazon y Google, que llevan años colaborando con el Pentágono.
Otros competidores en el campo de la IA, que están invirtiendo miles de millones en entrenar y desarrollar nuevos modelos, se enfrentarán en 2025 a una mayor presión para generar ingresos. Es posible que encuentren suficientes clientes fuera del ámbito de la defensa dispuestos a pagar generosamente por agentes de IA capaces de realizar tareas complejas, o por industrias creativas que inviertan en generadores de imágenes y vídeo.
A pesar de ello, se verán cada vez más tentados a optar por firmar lucrativos contratos con el Pentágono de Estados Unidos. Las empresas se verán obligadas a plantearse si trabajar en proyectos de defensa entra en conflicto con sus valores. La justificación de OpenAI para cambiar su postura fue que "las democracias deben seguir liderando el desarrollo de la IA". La empresa argumenta que ceder sus modelos a los militares contribuiría a ese objetivo. En 2025, veremos cómo otras compañías siguen su ejemplo.
– James O'Donnell
5. A Nvidia le salen competidores
Durante gran parte del auge actual de la IA, si una empresa tecnológica quería aventurarse en la creación de un modelo de inteligencia artificial, Jensen Huang era la persona indicada. Como CEO de Nvidia, la compañía más valiosa del mundo, Huang dirigió a la empresa convertirla en el líder indiscutible de la fabricación de chips, tanto para entrenar modelos de IA como para realizar inferencias cuando alguien utiliza un modelo.
En 2025, varias fuerzas podrían transformar esta situación. Por un lado, gigantes como Amazon, Broadcom, AMD y otros han invertido considerablemente en nuevos chips, y ya se empiezan a ver señales de que podrían competir con los de Nvidia, especialmente en el área de la inferencia.
Un número creciente de start-ups está desafiando a Nvidia desde un enfoque diferente. En lugar de buscar mejoras en los diseños existentes, empresas como Groq apuestan por arquitecturas de chip completamente nuevas que, con el tiempo, podrían ofrecer un entrenamiento más eficiente. Aunque estos experimentos están aún en sus etapas iniciales, es posible que un competidor destacado ponga en duda la idea de que los mejores modelos de IA dependan exclusivamente de los chips de Nvidia.
En el marco de esta competencia, seguirá la lucha geopolítica por el control de los semiconductores. Hasta ahora, esa guerra ha seguido dos estrategias principales. Por un lado, Occidente ha intentado limitar las exportaciones a China de los chips más avanzados y de las tecnologías necesarias para fabricarlos. Por otro, iniciativas como la Ley CHIPS en EE UU. buscan impulsar la producción nacional de semiconductores.
Donald Trump podría intensificar esos controles a la exportación y ha prometido imponer aranceles elevados sobre cualquier bien importado de China. En 2025, esos aranceles colocarían a Taiwán, que es clave para EE UU debido al fabricante de chips TSMC, en el epicentro de las guerras comerciales. Por su parte, Taiwán ha expresado su intención de ayudar a las empresas chinas a trasladarse a la isla para eludir los aranceles propuestos. Esta decisión podría generar nuevas críticas por parte de Trump, quien ha manifestado su frustración por el gasto estadounidense en la defensa de Taiwán frente a China.
No está claro cómo se desarrollarán estos factores, pero lo que es indudable es que seguirán presionando a los fabricantes de chips para que reduzcan su dependencia de Taiwán, que es precisamente el objetivo de la Ley CHIPS. A medida que los fondos de esta ley comiencen a fluir, en 2025 se podrá evaluar si está logrando realmente un impulso significativo a la producción estadounidense de semiconductores.
– James O'Donnell