Inteligencia Artificial
Estos nuevos modelos de IA ayudan a los robots a hacer tareas en entornos desconocidos
Los "modelos de utilidad robótica" evitan la necesidad de ajustar los datos de entrenamiento cada vez que intentan hacer algo en entornos desconocidos
Es complicado conseguir que los robots hagan cosas en entornos que nunca han visto antes. Por lo general, los investigadores tienen que entrenarlos con nuevos datos para cada nuevo lugar que encuentran, lo que puede llevar mucho tiempo y resultar muy caro.
Ahora, los investigadores han desarrollado una serie de modelos de IA que enseñan a los robots a realizar tareas básicas en entornos nuevos sin necesidad de más entrenamiento ni ajustes. Estos cinco modelos de inteligencia artificial (IA), denominados modelos de utilidad robótica (RUM, por sus siglas en inglés), permiten a las máquinas realizar cinco tareas distintas –abrir puertas y cajones, y recoger pañuelos, bolsas y objetos cilíndricos– en entornos desconocidos y con una tasa de éxito del 90%.
El equipo, formado por investigadores de la Universidad de Nueva York, Meta y la empresa de robótica Hello Robot, espera que sus hallazgos agilicen y faciliten la enseñanza de nuevas habilidades a los robots y les ayuden a desenvolverse en ámbitos hasta ahora desconocidos. Este enfoque podría facilitar y abaratar el despliegue de robots en nuestros hogares.
"En el pasado, la gente se había centrado mucho en el problema de cómo conseguir que los robots hicieran de todo, pero no se había preguntado cómo conseguir que hicieran las cosas que saben hacer, en todas partes", explica Mahi Shafiullah, estudiante de doctorado de la Universidad de Nueva York que trabajó en el proyecto. "Estudiamos cómo enseñar a un robot, por ejemplo, a abrir cualquier puerta en cualquier lugar".
Enseñar nuevas habilidades a los robots suele requerir muchos datos, que son bastante difíciles de conseguir. Dado que los datos de entrenamiento de los robots deben recopilarse físicamente –una tarea larga y costosa–, es mucho más difícil crear y ampliar bases de datos de entrenamiento para robots que para tipos de IA como los grandes modelos lingüísticos, que se entrenan con información extraída de Internet.
Para agilizar la recopilación de datos esenciales para enseñar a un robot una nueva habilidad, los investigadores desarrollaron una nueva versión de una herramienta que ya habían utilizado en investigaciones anteriores: un iPhone conectado a un palo barato, del tipo que se suele utilizar para recoger basura.
El equipo utilizó el dispositivo para grabar unas 1.000 demostraciones en 40 entornos distintos, incluidos hogares en Nueva York y Jersey City, para cada una de las cinco tareas, algunas de las cuales se habían recopilado en investigaciones anteriores. A continuación, entrenaron algoritmos de aprendizaje en los cinco conjuntos de datos y a partir de ellos crearon los cinco modelos RUM.
Estos modelos se desplegaron en Stretch (un robot compuesto por una unidad con ruedas, un poste alto y un brazo retráctil que sujetaba un iPhone) para comprobar hasta qué punto eran capaces de ejecutar las tareas en entornos nuevos sin necesidad de ajustes adicionales. Aunque lograron una tasa de finalización del 74,4%, los investigadores consiguieron aumentarla hasta el 90% cuando tomaron imágenes del iPhone y de la cámara montada en la cabeza del robot. Se las mostraban al reciente modelo GPT-4o de OpenAI y le preguntaban si la tarea se había completado con éxito. Si GPT-4o respondía que no, simplemente reiniciaban el robot y volvían a intentarlo.
Según Mohit Shridhar, investigador científico especializado en manipulación robótica que no participó en el trabajo, uno de los grandes retos a los que se enfrentan los especialistas en robótica es que el entrenamiento y las pruebas de sus modelos en entornos de laboratorio no son representativos de lo que podría ocurrir en el mundo real.
"Es agradable ver que se está evaluando en todos estos hogares y cocinas tan diversos, porque si se consigue que un robot funcione en la naturaleza en una casa cualquiera, ése es el verdadero objetivo de la robótica", afirma.
El proyecto podría servir de modelo para construir otros "RUMs" útiles para otras tareas, que enseñen a los robots nuevas habilidades con un esfuerzo extra mínimo y facilitando a las personas que no son expertos el futuro despliegue de los robots en sus hogares, dice Shafiullah.
"El sueño que perseguimos es que yo pueda registrar un entrenamiento, colgarlo en Internet y que tú puedas descargarlo y ejecutarlo en un robot en tu casa", explica.