Al combinar procesamiento del lenguaje natural y aprendizaje por refuerzo, la inteligencia artificial ha adquirido la capacidad de utilizar el lenguaje como una herramienta para convencer a otros personajes de un videojuego para que hagan cosas para lograr su objetivo
Una inteligencia artificial (IA) que completa misiones mientras habla con los personajes de un videojuego de aventuras basado en texto, no solo ha aprendido cómo hacer algo, también cómo conseguir que otros hagan cosas. El sistema da un paso hacia las máquinas capaces de utilizar el lenguaje como forma de lograr sus objetivos.
Prosa sin sentido: a los modelos de generación de lenguaje como GPT-3 se les da increíblemente bien imitar frases escritas por seres humanos, crear relatos, blogs falsos y publicaciones en Reddit. Pero este prolífico enfoque tiene poco sentido más allá de la producción del texto en sí. Cuando la gente usa el lenguaje, lo maneja como una herramienta: nuestras palabras convencen, ordenan y manipulan; hacen reír y llorar a otras personas.
Mezclar cosas: para construir una IA que usa palabras por una buena razón, los investigadores del Instituto de Tecnología de Georgia en Atlanta (EE. UU.) y Facebook AI Research combinaron técnicas de procesamiento del lenguaje natural (PLN) y de aprendizaje reforzado, con el que los modelos de aprendizaje automático aprenden a comportarse para lograr determinados objetivos. Ambos campos han experimentado un enorme progreso en los últimos años, pero ha habido poco intercambio entre los dos.
Juegos de palabras: para probar su enfoque, los investigadores entrenaron su sistema en un videojuego multijugador basado en texto denominado LIGHT, desarrollado el año pasado por Facebook para estudiar la comunicación entre humanos y jugadores de IA. El videojuego está ambientado en un mundo fantástico lleno de miles de objetos, personajes y ubicaciones colaborativos que se describen e interactúan mediante el texto en pantalla. Los jugadores (humanos o de IA) actúan escribiendo comandos como "abraza al mago", "golpea al dragón" o "quita el sombrero". También pueden hablar con los personajes controlados por un chatbot.
Dragon quest o las misiones del dragón: para dar a su IA razones para hacer algo, los investigadores añadieron alrededor de 7.500 misiones colaborativas, no incluidas en la versión original de LIGHT. También crearon un gráfico de conocimiento (una base de datos de relaciones sujeto-verbo-objeto) que dio a la IA el sentido común sobre el mundo del videojuego y sobre las conexiones entre sus personajes, como el principio de que un comerciante solo confiará en un guardia si son amigos. El videojuego contaba con algunas acciones (como "Vete a las montañas" y "Cómete al caballero") que se tenían que realizar con el objetivo de completar las misiones (como "Crea el tesoro más grande jamás alcanzado por un dragón").
Convencer con labia: uniendo todo esto, entrenaron a la IA para completar las misiones mediante el simple uso del lenguaje. Para realizar las acciones, la IA podría escribir el comando para esa acción o conseguir el mismo fin hablando con otros personajes. Por ejemplo, si la IA necesita una espada, puede optar por robar una o convencer a otro personaje para que se la dé.
Por ahora, el sistema no es más que es un juguete. Y sus formas pueden resultar bruscas: en un momento dado, si necesita un cubo, simplemente dirá: "¡Dame ese cubo o serás comida para mi gato!". Pero mezclar el PLN con el aprendizaje reforzado es un paso interesante que podría conducir no solo a mejores chatbots capaces de discutir y persuadir, sino a que tengan una comprensión mucho más rica de cómo funciona nuestro mundo lleno de lenguajes.