La fórmula de OpenAI comienza a agotarse con GPT-4.5

GPT-4.5 podría ser el último lanzamiento de la línea clásica de modelos de lenguaje (LLM) de OpenAI GPT-4.5 es la última versión del modelo de gran lenguaje estrella de OpenAI. La compañía asegura que es su sistema de chat más completo y potente hasta la fecha. “Es un gran avance para nosotros”, afirma Mia Glaese, investigadora de OpenAI.

Desde el lanzamiento de los modelos de razonamiento o1 y o3, OpenAI ha desarrollado dos líneas de productos. GPT-4.5 pertenece a la que no se centra en el razonamiento. Nick Ryder, compañero de Glaese e investigador de OpenAI, lo describe como “una continuación de la serie clásica de GPT”.

Los usuarios con una suscripción a ChatGPT Pro, que cuesta 200 dólares (unos 188 euros) al mes, ya pueden probar GPT-4.5. Asimismo, OpenAI ha anunciado que comenzará a desplegarlo de manera progresiva para el resto de los usuarios.

Con cada nueva versión de sus modelos GPT, OpenAI ha demostrado que un mayor tamaño suele traducirse en mejor rendimiento. Sin embargo, se ha debatido mucho sobre este enfoque, incluso por parte del exdirector científico de OpenAI, Ilya Sutskever. Las afirmaciones de la compañía sobre GPT-4.5 parecen un desafío directo a quienes cuestionan esta estrategia.

Los grandes modelos lingüísticos aprenden patrones a partir de los miles de millones de documentoscon los que se entrenan. Los modelos más pequeños se enfocan en aspectos básicos como la sintaxis y los datos fundamentales. En cambio, los más grandes son capaces de identificar patrones más complejos, como señales emocionales. Por ejemplo, pueden detectar cuando las palabras de que indican hostilidad. “Todos estos patrones sutiles que surgen en una conversación humana son los fragmentos que captarán estos modelos cada vez más grandes”, afirma Ryder.

“Es capaz de mantener conversaciones cálidas, intuitivas, naturales y fluidas. Además, creemos que entiende mejor lo que los usuarios quieren expresar, especialmente cuando sus expectativas son más implícitas. Esto da lugar a respuestas más matizadas y reflexivas”, señala Glaese.

Música para los oidos

“En este momento ya entendemos cómo funciona el motor, y ahora se trata de hacerlo operar. El enfoque principal está en aumentar la capacidad de cálculo y los datos, encontrar métodos de entrenamiento más eficientes y ampliar los límites”, observa Ryder.

OpenAI no ha revelado el tamaño exacto de su nuevo modelo, pero asegura que el salto de escala de GPT-4o a GPT-4.5 es similar al de GPT-3.5 a GPT-4. Los expertos han calculado que GPT-4 podría contar con hasta 1,8 billones de parámetros, que son los valores ajustados durante el entrenamiento de un modelo

GPT-4.5 se entrenó utilizando técnicas similares a las empleadas para su predecesor, GPT-4, como el ajuste fino guiado por humanos y el aprendizaje por refuerzo con retroalimentación humana.

“La clave para crear sistemas inteligentes es una estrategia que llevamos años aplicando: identificar paradigmas escalables en los que podamos invertir más recursos para desarrollar sistemas más avanzados”, asegura Ryder.

A diferencia de los modelos de razonamiento como o1 y o3, que abordan las respuestas paso a paso, la mayoría de los grandes modelos lingüísticos, como GPT-4.5, ofrecen la primera respuesta que se les ocurre. En cambio, GPT-4.5 es más versátil. En pruebas realizadas con SimpleQA, un cuestionario de conocimientos generales desarrollado por OpenAI el año pasado, que abarca temas como ciencia, tecnología, programas de televisión y videojuegos, GPT-4.5 obtuvo una puntuación del 62,5%, frente al 38,6% de GPT-4 y al 15% de o3-mini.

OpenAI afirma que GPT-4.5 responde con muchas menos respuestas inventadas (conocidas como“alucinaciones”). En la misma prueba, GPT-4.5 inventó respuestas el 37,1% de las veces, frente al 59,8% de GPT-4o y el 80,3% de o3-mini.

SimpleQA es solo una prueba de referencia. En otras pruebas, como MMLU, que es una referencia más común para comparar grandes modelos lingüísticos, GPT-4.5 supera a los modelos anteriores de OpenAI, pero por un margen más pequeño. Además, en las pruebas estándar de ciencias y matemáticas, GPT-4.5 obtiene peores resultados que o3-mini.

El atractivo de GPT-4.5

El atractivo principal de GPT-4.5 parece ser su capacidad para mantener conversaciones. Los testerscontratados por OpenAI afirman que prefieren GPT-4.5 a GPT-4 para consultas cotidianas, tareas profesionales y creativas, como la creación de poemas. (Ryder añade que también es excelente en el arte ASCII, una tradición de la vieja escuela de Inte et).

Por ejemplo, si le dices que estás pasando por una mala racha, GPT-4.5 podría ofrecerte unas palabras de simpatía antes de decir: “¿Quieres hablar de lo que ha pasado o solo necesitas una distracción? Estoy aquí en cualquier caso”. En cambio, GPT-4 no es tan hábil para captar las señales sociales y podría intentar resolver el problema, aunque no se lo hayas pedido, ofreciéndote una lista de formas de animarte.

Tras años en la cima, OpenAI se enfrenta a una dura competencia. “Centrarse en la inteligencia emocional y la creatividad puede ser útil para ciertos casos de uso, como escritores o compañeros para lluvias de ideas”, afirma Waseem Alshikh, cofundador y director de tecnología de Writer, una start-up que desarrolla grandes modelos lingüísticos para clientes empresariales. “GPT-4.5 parece simplemente una nueva capa de pintura sobre el mismo coche de siempre. Añadir más capacidad de cálculo y datos a un modelo puede hacerlo sonar mejor, pero no cambia las reglas del juego”, añade.

“No merece la pena exprimir más el jugo si se tienen en cuenta los costes energéticos y el hecho de que la mayoría de los usuarios no notarán la diferencia en su uso diario. Prefiero que se centren en la eficienciao en resolver problemas específicos en lugar de seguir sobredimensionando la misma fórmula”, recrimina Alshikh.

Sam Altman ha afirmado que GPT-4.5 será la última versión de la línea clásica de OpenAI y que GPT-5 será un híbrido que combinará un modelo de lenguaje general de gran tamaño con un modelo de razonamiento.

"GPT-4.5 es OpenAI improvisando mientras cocinan algo más grande a puerta cerrada. Hasta entonces, parece una parada en boxes", ", dice Alshikh.

Por supuesto, OpenAI insiste en que su enfoque aún tiene potencial. “Personalmente, soy muy optimista sobre la posibilidad de encontrar la manera de superar esos cuellos de botella y seguir escalando. Creo que hay algo emocionante en combinar patrones a través de todo el conocimiento humano”, sostiene Ryder.

Música para los oidos

GPT-4.5 se entrenó utilizando técnicas similares a las empleadas para su predecesor, GPT-4, como el ajuste fino guiado por humanos y el aprendizaje por refuerzo con retroalimentación humana.

El atractivo de GPT-4.5

"GPT-4.5 es OpenAI improvisando mientras cocinan algo más grande a puerta cerrada. Hasta entonces, parece una parada en boxes", ", dice Alshikh.

Buscar en MIT Technology Review

Explorar Temas

Secciones

La fórmula de OpenAI comienza a agotarse con GPT-4.5

Música para los oidos

El atractivo de GPT-4.5

Música para los oidos

El atractivo de GPT-4.5