Otros

OpenAI lanza de forma gratuita su nuevo modelo de razonamiento o3-mini

OpenAI acaba de lanzar o3-mini, un modelo de razonamiento que es más rápido, más barato y más preciso que su predecesor.

por Scott J Mulligan | traducido por
31 Enero, 2025

El jueves, Microsoft anunció que lanzará el modelo de razonamiento o1 de OpenAI a sus usuarios de Copilot, y ahora OpenAI lanzará un nuevo modelo de razonamiento, o3-mini, para las personas que usan la versión gratuita de ChatGPT. Esta será la primera vez que la gran mayoría de las personas tendrán acceso a uno de los modelos de razonamiento de OpenAI, que anteriormente estaban restringidos a sus paquetes pagos Pro y Plus.

Los modelos de razonamiento utilizan una técnica de “cadena de pensamiento” para generar respuestas, básicamente resolviendo un problema presentado al modelo paso a paso. Con este método, el modelo puede encontrar errores en su proceso y corregirlos antes de dar una respuesta. Esto generalmente da como resultado respuestas más completas y precisas, pero también hace que los modelos hagan una pausa antes de responder, lo que a veces genera largos tiempos de espera. OpenAI afirma que o3-mini responde un 24 % más rápido que o1-mini.

Estos tipos de modelos son más efectivos para resolver problemas complejos, por lo que si tienes problemas matemáticos de nivel de doctorado que estás resolviendo, puedes probarlos. Alternativamente, si has tenido problemas para lograr que los modelos anteriores respondan correctamente a tus indicaciones más avanzadas, es posible que desees probar este nuevo modelo de razonamiento en ellos. Para probar o3-mini, simplemente selecciona "Razonar" cuando comiences una nueva indicación en ChatGPT .

Aunque los modelos de razonamiento poseen nuevas capacidades, tienen un costo. El o1-mini de OpenAI es 20 veces más costoso de ejecutar que su modelo equivalente sin razonamiento, GPT-4o mini. La compañía dice que su nuevo modelo, o3-mini, cuesta un 63% menos que o1-mini por token de entrada. Sin embargo, a $1.10 por millón de tokens de entrada, sigue siendo aproximadamente siete veces más costoso de ejecutar que GPT-4o mini.

Este nuevo modelo llega justo después del lanzamiento de DeepSeek que sacudió al mundo de la IA hace menos de dos semanas. El nuevo modelo de DeepSeek funciona tan bien como los mejores modelos de OpenAI, pero la empresa china afirma que costó aproximadamente 6 millones de dólares entrenarlo, en comparación con el costo estimado de más de 100 millones de dólares para entrenar el GPT-4 de OpenAI. (Vale la pena señalar que mucha gente está cuestionando esta afirmación).

Además, el modelo de razonamiento de DeepSeek cuesta 0,55 dólares por millón de tokens de entrada, la mitad del precio de o3-mini, por lo que OpenAI aún tiene un largo camino por recorrer para reducir sus costos. Se estima que los modelos de razonamiento también tienen costos de energía mucho más altos que otros tipos, dada la mayor cantidad de cálculos que requieren para producir una respuesta.

Esta nueva ola de modelos de razonamiento también presenta nuevos desafíos de seguridad. OpenAI utilizó una técnica llamada alineación deliberativa para entrenar sus modelos de serie o, básicamente haciendo que hicieran referencia a las políticas internas de OpenAI en cada paso de su razonamiento para asegurarse de que no ignoraran ninguna regla.

Pero la empresa ha descubierto que o3-mini, al igual que el modelo o1, es significativamente mejor que los modelos sin razonamiento en el jailbreaking y en las “evaluaciones de seguridad desafiantes”; en esencia, es mucho más difícil controlar un modelo de razonamiento dadas sus capacidades avanzadas. o3-mini es el primer modelo que obtiene una puntuación de “riesgo medio” en autonomía del modelo, una calificación otorgada porque es mejor que los modelos anteriores en tareas de codificación específicas, lo que indica “un mayor potencial de automejora y aceleración de la investigación de IA”, según OpenAI. Dicho esto, el modelo sigue siendo malo en la investigación del mundo real. Si fuera mejor en eso, se calificaría como de alto riesgo y OpenAI restringiría la publicación del modelo.

Otros

OpenAI lanza de forma gratuita su nuevo modelo de razonamiento o3-mini

Mark Zuckerberg y el poder de los medios de comunicación

Neuralink ante las promesas de Musk: más voluntarios y algunos avances

Robotaxis