Esto es lo que hay que hacer para que los asistentes de IA sean realmente útiles.
Esta historia apareció originalmente en The Algorithm, nuestro boletín semanal sobre inteligencia artificial. Para recibir historias como esta en tu bandeja de entrada antes que nadie, regístrate aquí .
Olivier Godement, responsable de productos de la plataforma de OpenAI, y Romain Huet, responsable de la experiencia de los desarrolladores, están de gira por todo el mundo. La semana pasada, me reuní con ellos en Londres antes del DevDay, la conferencia anual para desarrolladores de la empresa. El DevDay de Londres es el primero que se celebra fuera de San Francisco. Godement y Huet se dirigen a Singapur a continuación.
Han sido unas semanas muy ajetreadas para la empresa. En Londres, OpenAI anunció actualizaciones de su nueva plataforma Realtime API , que permite a los desarrolladores incorporar funciones de voz en sus aplicaciones. La empresa está lanzando nuevas voces y una función que permite a los desarrolladores generar indicaciones, lo que les permitirá crear aplicaciones y asistentes de voz más útiles con mayor rapidez. Mientras tanto, para los consumidores, OpenAI anunció el lanzamiento de la búsqueda ChatGPT , que permite a los usuarios buscar en Internet utilizando el chatbot. Lea más aquí .
Ambos desarrollos abren el camino para el próximo gran avance en IA: los agentes. Se trata de asistentes de IA que pueden completar cadenas complejas de tareas, como reservar vuelos. ( Puede leer mi explicación sobre los agentes aquí ).
“Avanzamos unos años y cada ser humano en la Tierra, cada empresa, tiene un agente. Ese agente te conoce muy bien. Conoce tus preferencias”, dice Godement. El agente tendrá acceso a tus correos electrónicos, aplicaciones y calendarios y actuará como un jefe de personal, interactuando con cada una de estas herramientas e incluso trabajando en problemas a largo plazo, como escribir un artículo sobre un tema en particular, dice.
La estrategia de OpenAI es crear agentes por sí misma y permitir que los desarrolladores utilicen su software para crear sus propios agentes, afirma Godement. La voz desempeñará un papel importante en el aspecto y la funcionalidad de los agentes.
“En la actualidad, la mayoría de las aplicaciones se basan en el chat, lo cual es genial, pero no es adecuado para todos los casos de uso. Hay algunos casos de uso en los que no estás escribiendo, ni siquiera mirando la pantalla, y la voz es, en esencia, una modalidad mucho mejor para eso”, afirma.
Pero hay dos grandes obstáculos que deben superarse antes de que los agentes puedan convertirse en una realidad, dice Godement.
El primero es el razonamiento. Para crear agentes de IA es necesario que podamos confiar en que podrán completar tareas complejas y hacer lo correcto, dice Huet. Ahí es donde entra en juego la función de “razonamiento” de OpenAI. Introducida en el modelo o1 de OpenAI el mes pasado, utiliza el aprendizaje por refuerzo para enseñar al modelo a procesar la información mediante una “cadena de pensamiento”. Darle al modelo más tiempo para generar respuestas le permite reconocer y corregir errores, dividir los problemas en problemas más pequeños y probar diferentes enfoques para responder preguntas, dice Godement.
Pero las afirmaciones de OpenAI sobre el razonamiento deben tomarse con pinzas, dice Chirag Shah, profesor de informática de la Universidad de Washington. Los modelos de lenguaje de gran tamaño no muestran un razonamiento verdadero. Lo más probable es que hayan captado algo que parece lógica a partir de algo que han visto en sus datos de entrenamiento.
"A veces parece que estos modelos son realmente asombrosos en el razonamiento, pero es como si fueran realmente buenos en la simulación, y sólo hace falta un poco de esfuerzo para romperlos", afirma.
Godement admite que todavía queda mucho trabajo por hacer. A corto plazo, los modelos de IA como o1 deben ser mucho más fiables, rápidos y económicos. A largo plazo, la empresa necesita aplicar su técnica de cadena de pensamiento a un conjunto más amplio de casos de uso. OpenAI se ha centrado en la ciencia, la codificación y las matemáticas. Ahora quiere abordar otros campos, como el derecho, la contabilidad y la economía, afirma.
En segundo lugar, la capacidad de conectar diferentes herramientas, dice Godement. Las capacidades de un modelo de IA serán limitadas si tiene que depender únicamente de sus datos de entrenamiento. Debe poder navegar por la web y buscar información actualizada. La búsqueda ChatGPT es una forma poderosa en que las nuevas herramientas de OpenAI pueden hacer eso.
Estas herramientas deben ser capaces no solo de recuperar información, sino también de realizar acciones en el mundo real. El competidor Anthropic anunció una nueva función que permite a su chatbot Claude “ utilizar” una computadora interactuando con su interfaz para hacer clic en cosas, por ejemplo. Esta es una función importante para los agentes si van a poder ejecutar tareas como reservar vuelos. Godement dice que o1 puede “en cierto modo” utilizar herramientas, aunque no de manera muy confiable, y que la investigación sobre el uso de herramientas es un “desarrollo prometedor”.
Godemont afirma que espera que el año que viene aumente la adopción de la IA para la atención al cliente y otras tareas basadas en asistentes. Sin embargo, afirma que puede resultar difícil predecir cómo adoptarán y utilizarán las personas la tecnología de OpenAI.
“Francamente, cada año, cuando miro hacia atrás, me sorprenden los casos de uso que surgieron y que ni siquiera había previsto”, afirma. “Supongo que habrá bastantes sorpresas que ninguno de nosotros podría predecir”.
Ahora lee el resto de El Algoritmo
Aprendizaje más profundo
Esta versión de Minecraft generada por IA puede representar el futuro de la generación de videos en tiempo real
Cuando caminas por una versión del videojuego Minecraft de las empresas de IA Decart y Etched, la sensación es un poco extraña. Claro, puedes avanzar, talar un árbol y colocar un bloque de tierra, como en la realidad. Sin embargo, si te das la vuelta, el bloque de tierra que acabas de colocar puede haberse transformado en un entorno totalmente nuevo. Eso no sucede en Minecraft. Pero esta nueva versión está completamente generada por IA, por lo que es propensa a alucinaciones. No se escribió ni una sola línea de código.
Preparados, listos, ¡ya! Esta versión de Minecraft se genera en tiempo real, mediante una técnica conocida como predicción del siguiente fotograma. Las empresas de inteligencia artificial que están detrás de esta versión lograron esto entrenando su modelo, Oasis, con millones de horas de juego de Minecraft y grabaciones de las acciones correspondientes que un usuario realizaría en el juego. La IA es capaz de clasificar la física, los entornos y los controles de Minecraft solo a partir de estos datos. Lea más de Scott J. Mulligan .
Bits y bytes
La búsqueda con inteligencia artificial podría revolucionar la web
En el mejor de los casos, la búsqueda con IA puede inferir mejor la intención de un usuario, amplificar contenido de calidad y sintetizar información de diversas fuentes. Pero si la búsqueda con IA se convierte en nuestro principal portal de acceso a la web, amenaza con perturbar una economía digital ya precaria, sostiene Benjamin Brooks, miembro del Berkman Klein Center de la Universidad de Harvard, que solía dirigir políticas públicas para Stability AI. ( MIT Technology Review )
La IA agravará el problema de los desechos electrónicos. Esto es lo que podemos hacer al respecto.
Los equipos utilizados para entrenar y ejecutar modelos de IA generativa podrían producir hasta 5 millones de toneladas de desechos electrónicos para 2030, una fracción relativamente pequeña pero significativa del total mundial. ( MIT Technology Review )
Cómo una “entrevista” con una celebridad fallecida expuso los peligros de la IA
Una estación de radio financiada por el Estado en Polonia despidió a sus talentos y contrató presentadores generados por inteligencia artificial. Pero el experimento provocó indignación y se detuvo cuando uno de ellos “entrevistó” a un premio Nobel fallecido. ( The New York Times )
Meta dice sí, por favor, a más basura generada por IA
En la última conferencia de resultados de Meta, el director ejecutivo Mark Zuckerberg dijo que es probable que veamos
“Una categoría de contenido completamente nueva, que es contenido generado por IA o resumido por IA o un tipo de contenido existente reunido por IA de alguna manera”. Zuckerberg agregó que cree que “eso va a ser muy emocionante”. ( 404 Media )