Inteligencia Artificial
El modelo o3-mini de OpenAI, una IA más eficiente y con capacidad de "razonar"
OpenAI ha lanzado o3-mini, un modelo de razonamiento más económico y preciso que su predecesor, diseñado para mejorar la generación de respuestas complejas
El jueves, Microsoft anunció que ampliará el uso de o1, de OpenAI, a todos los usuarios de Copilot. Ahora, OpenAI ha lanzado una nueva versión, o3-mini, disponible para quienes utilizan la versión gratuita de ChatGPT. Es la primera vez que la mayoría de los usuarios podrá acceder a uno de estos modelos de razonamiento, hasta ahora solo estaban disponibles en los planes de pago Pro y Plus.
Estos modelos utilizan la técnica de "cadena de pensamiento" para trabajar en los problemas paso a paso. Aunque pueden tardar más en responder, este enfoque mejora la precisión y la calidad de sus respuestas porque corrige posibles errores antes de ofrecer una conclusión. OpenAI asegura que o3-mini es un 24% más rápido que o1-mini.
Asimismo, son más eficaces para resolver problemas complejos. Si estás trabajando en un problema matemático de nivel doctoral, podrías probarlos. Si los modelos anteriores no han respondido con precisión a tus preguntas más avanzadas, esta nueva versión podría ofrecer mejores resultados. Para utilizar o3-mini, solo tienes que seleccionar la opción "Razonar" al iniciar una nueva conversación con ChatGPT.
Aunque los modelos de razonamiento ofrecen nuevas capacidades, también implican un mayor coste. o1-mini de OpenAI es 20 veces más caro que su equivalente sin razonamiento, GPT-4o mini. La empresa asegura que o3-mini reduce ese gasto en un 63% con respecto a o1-mini. Aun así, con un precio de 1,10 dólares (1,05 euros, aproximadamente) por millón de tokens de entrada, sigue siendo siete veces más caro que GPT-4o mini.
Este nuevo sistema se lanza poco después de la llegada de DeepSeek, que sacudió el mundo de la IA hace menos de dos semanas. La tecnología de DeepSeek ha demostrado un rendimiento comparable al de los mejores modelos de OpenAI, pero la empresa china asegura que su entrenamiento costó solo 6 millones de dólares (unos 5,8 millones de euros), frente a los más de 100 millones (unos 87 millones de euros) que, según estimaciones, costó entrenar GPT-4 de OpenAI. No obstante, muchos expertos han puesto en duda esta afirmación.
DeepSeek cuesta 0,55 dólares (0,53 euros) por millón de tokens de entrada, la mitad que o3-mini. Por tanto, OpenAI aún tiene mucho camino por recorrer para reducir sus costes. Se estima que estas tecnologías también implican un consumo energético mucho mayor debido a la cantidad de cálculos necesarios para generar una respuesta.
Esta nueva generación de sistemas de razonamiento también plantea desafíos en materia de seguridad. OpenAI empleó una técnica llamada alineación deliberativa para entrenar su serie o, haciendo que consultaran las políticas internas de la empresa en cada paso de su razonamiento. De este modo, se buscaba garantizar que no pasaran por alto ninguna norma establecida.
OpenAI ha descubierto que o3-mini, al igual que o1, supera significativamente a los modelos sin razonamiento en la evasión de restricciones y en la realización de "evaluaciones de seguridad complejas". En otras palabras, resulta más difícil de controlar debido a sus avanzadas capacidades. o3-mini es el primer sistema que obtiene una calificación de "riesgo medio" en autonomía de modelo, un nivel que se le ha asignado porque supera a sus predecesores en tareas de codificación específicas. Según la compañía, esto indica "un mayor potencial para mejorar de manera automática y acelerar la investigación en IA". No obstante, sigue mostrando un rendimiento deficiente en investigaciones del mundo real. Si alcanzara un nivel más alto, se consideraría de alto riesgo y OpenAI restringiría su publicación.