Inteligencia Artificial

La IA supera una prueba humana de creatividad, aunque esto no signifique ser creativa

Los grandes modelos lingüísticos imitan cada vez mejor la creatividad humana. Sin embargo, eso no significa que sean realmente creativos

por Rhiannon Williams | traducido por
18 Septiembre, 2023

La inteligencia artificial (IA) supera cada vez mejor las pruebas diseñadas para medir la creatividad humana. En un estudio publicado la semana pasada en Scientific Reports, los chatbots de IA recibieron puntuaciones medias más altas que los humanos en la Tarea de Usos Alternos (AUT, por sus siglas en inglés), una prueba utilizada habitualmente para evaluar esta capacidad.

Este estudio aviva el debate entre los investigadores de la IA sobre lo que significa que un ordenador supere pruebas diseñadas para humanos. Los resultados no indican necesariamente que las IA estén desarrollando la capacidad de hacer algo exclusivamente humano. Podría tratarse simplemente de que las IA pueden superar pruebas de creatividad, no de que sean realmente creativas en el sentido que nosotros entendemos. Sin embargo, investigaciones como ésta podrían ayudarnos a comprender mejor cómo los humanos y las máquinas abordan las tareas creativas.

Los investigadores empezaron pidiendo a tres chatbots de IA (ChatGPT y GPT-4 de OpenAI, así como Copy.Ai, basado en GPT-3) que propusieran el mayor número posible de usos para una cuerda, una caja, un lápiz y una vela en tan solo 30 segundos.

Sus instrucciones pedían a los grandes modelos lingüísticos que propusieran usos originales y creativos para cada uno de los objetos y explicaban que la calidad de las ideas era más importante que la cantidad. Cada chatbot se probó 11 veces con cada uno de los cuatro objetos y los investigadores dieron las mismas instrucciones a 256 participantes humanos.

Los investigadores utilizaron dos métodos para evaluar las respuestas de la IA y las humanas. El primero consistió en un algoritmo que valoraba el grado de similitud entre el uso sugerido para el objeto y su finalidad original. El segundo se centró en pedir a seis evaluadores humanos (que desconocían que algunas de las respuestas habían sido generadas por sistemas de IA) que valoraran cada respuesta en una escala del 1 al 5 en función de lo creativa y original que fuera: 1 para nada y 5 para mucho. A continuación, se calcularon las puntuaciones medias de las personas y las IA.

Aunque en promedio las respuestas de los chatbots se calificaron como mejores que las de los humanos, las respuestas humanas mejor puntuadas fueron superiores.

Si bien el propósito del estudio no era demostrar que los sistemas de IA son capaces de sustituir a los humanos en funciones creativas, plantea cuestiones filosóficas sobre las características propias de los humanos, afirma Simone Grassini, profesora asociada de Psicología de la Universidad de Bergen (Noruega), que codirigió la investigación.

"Hemos demostrado que en los últimos años la tecnología ha dado un salto muy grande cuando hablamos de imitar el comportamiento humano", afirma. "Estos modelos están en constante evolución".

Demostrar que las máquinas pueden rendir bien en tareas diseñadas para medir la creatividad en humanos no demuestra que sean capaces de algo parecido al pensamiento original, afirma Ryan Burnell, investigador asociado del Instituto Alan Turing (Reino Unido), que no participó en la investigación.

Los chatbots que se probaron son "cajas negras", es decir, no sabemos exactamente con qué datos se entrenaron ni cómo generan sus respuestas, afirma. "Lo que es muy plausible que ocurra aquí es que un modelo no genere nuevas ideas creativas, sino que se base lo que ha visto en sus datos de entrenamiento, que podrían incluir exactamente esta tarea de usos alternativos", explica. "En ese caso, no estamos midiendo la creatividad, sino el conocimiento previo del modelo sobre este tipo de tarea".

Eso no significa que no siga siendo útil comparar cómo abordan determinados problemas las máquinas y los humanos, afirma Anna Ivanova, investigadora postdoctoral del Instituto Tecnológico de Massachusetts (MIT) que estudia los modelos lingüísticos y no ha trabajado en el proyecto.

Sin embargo, hay que tener en cuenta que, aunque los chatbots son muy buenos respondiendo a peticiones concretas, unos ligeros retoques, como reformular una petición, pueden bastar para que dejen de rendir igual de bien, señala. Ivanova cree que este tipo de estudios debería llevarnos a examinar la relación entre la tarea que pedimos a los modelos de IA y la capacidad cognitiva que intentamos medir. "No deberíamos suponer que las personas y los modelos resuelven los problemas de la misma manera", concluye.

Inteligencia Artificial

La IA supera una prueba humana de creatividad, aunque esto no signifique ser creativa

OpenAI ha multiplicado casi por siete su inversión de 'lobby' ante la llegada de Trump

Minería paralela de datos, la técnica del nuevo traductor de Meta para dominar más de 100 idiomas

Convirtiendo los trinos en datos: esta IA estudia la migración de las aves a través del sonido