Inteligencia Artificial
Los robots que aprenden mientras fallan podrían abrir una nueva era de la IA
Lerrel Pinto afirma que la clave para construir robots domésticos útiles es ayudarles a aprender de sus errores.
Lerrel Pinto es uno de los Innovadores menores de 35 2023 de MIT Technology Review.
Cuando le piden que explique su trabajo, a Lerrel Pinto (31 años) le gusta responder con otra pregunta: "¿Cuándo fue la última vez que vio un robot molón en su casa?". La respuesta suele depender de si la persona que pregunta tiene un robot aspirador: ayer o nunca.
Pinto trabaja para solucionarlo. Como investigador de Informática en la Universidad de Nueva York (EE UU), quiere ver robots en el hogar que hagan más que pasar la aspiradora: "¿Cómo creamos robots que puedan ser una parte más integral de nuestras vidas, haciendo tareas domésticas, cuidando ancianos o rehabilitando, es decir, que estén ahí cuando los necesitemos?".
El problema es que el entrenamiento de robots con múltiples habilidades requiere muchos datos. La solución de Pinto consiste en encontrar nuevas formas de recopilar esos datos, en particular, haciendo que los robots los recopilen a medida que aprenden, un enfoque denominado aprendizaje autosupervisado. Una técnica que también defienden, entre otros, Yann LeCun, científico jefe de Inteligencia Artificial de Meta y compañero de Pinto en la Universidad de Nueva York.
"El trabajo de Lerrel es un hito importante en el acercamiento del aprendizaje automático a la robótica", afirma Pieter Abbeel, director del laboratorio de aprendizaje robótico de la Universidad de California en Berkeley. "Su investigación actual se recordará por haber sentado muchos de los cimientos del futuro aprendizaje de los robots", afirma.
La idea de un robot doméstico capaz de hacer café o fregar los platos tiene décadas, pero estas máquinas son todavía ciencia ficción. Los recientes avances en otras áreas de la IA, especialmente los grandes modelos de lenguaje, han hecho uso de enormes conjuntos de datos extraídos de Internet. Eso no se puede hacer con robots, asegura Pinto. Las empresas de coches autónomos pasan millones de horas en la carretera recopilando datos para entrenar los modelos que impulsan sus vehículos. Los fabricantes de robots domésticos se enfrentan a un reto similar: grabar muchas horas de imágenes de diferentes tareas realizadas en distintos entornos.
Pinto alcanzó uno de sus primeros hitos en 2016, cuando creó el mayor conjunto de datos robóticos del mundo en aquel momento: consiguió que los robots crearan y etiquetaran sus propios datos de entrenamiento, así como hacerlos funcionar 24/7 sin supervisión humana. Desde entonces, sus colegas y él han desarrollado algoritmos de aprendizaje que permiten a un robot mejorar a medida que falla. Un brazo robótico puede fallar muchas veces al agarrar un objeto, pero los datos de esos intentos pueden utilizarse para entrenar un modelo que tenga éxito. El equipo ha demostrado este método tanto con un brazo robótico como con un dron, convirtiendo cada objeto que se cae o cada colisión en una lección ganada a pulso.
Otro enfoque de Pinto consiste en copiar a los humanos. A un robot se le muestra un humano abriendo una puerta. Este toma estos datos como punto de partida e intenta hacerlo por sí mismo, añadiendo datos a medida que avanza. Así, cuantas más puertas vea abrir el robot, más probabilidades tendrá de abrir una puerta que no haya visto nunca.
El proyecto más reciente de Pinto es de muy baja tecnología: ha reclutado a varias docenas de voluntarios para que graben vídeos agarrando diversos objetos en sus casas con móviles iPhone montados en cubos de basura de 20 dólares (unos 19 euros). Cree que un par de cientos de horas de grabación bastarán para entrenar un sólido modelo de agarre.
Toda esta recopilación de datos se combina con eficientes algoritmos de aprendizaje que permiten a los robots hacer más con menos. Pinto y sus colegas han demostrado que con solo una hora de entrenamiento se pueden conseguir comportamientos diestros, como abrir una botella con una mano o dar la vuelta a una tortita.
En efecto, Pinto espera dar a los robots su momento de modelo de gran lenguaje. Al hacerlo, podría ayudar a abrir una nueva era en la IA. "Existe la idea de que la razón por la que tenemos cerebro es para movernos. Es lo que la evolución nos hizo hacer para sobrevivir, para encontrar comida", afirma. "En última instancia, pienso que el objetivo de la inteligencia es moverse, cambiar las cosas en el mundo, y creo que las únicas cosas que pueden hacerlo son las criaturas físicas, como un robot".
Lerrel Pinto es uno de los Innovadores menores de 35 años 2023 de MIT Technology Review. Conoce al resto de galardonados de este año.