Enseña a los robots a observar y aprender de sus propios logros para asumir tareas que antes parecían imposibles
Durante sus nueve meses en Google, Sergey Levine observó cómo el programa de la empresa AlphaGo venció al mejor jugador humano del antiguo juego chino Go en marzo. Levine, un especialista en robótica de la Universidad de California en Berkeley (EEUU), admiró la sofisticada hazaña del aprendizaje de máquinas pero no pudo evitar centrarse en una evidente carencia de los potentes algoritmos. "Nunca sujetó ninguna de las piezas", bromea.
Los creadores de AlphaGo entrenaron al programa alimentando un potente algoritmo de red neuronal con 160.000 partidas anteriores de Go. Esa una técnica similar a la que se usa con los algoritmos que han estudiado innumerables fotos de gatos y perros hasta aprender a reconocerlos en fotos no etiquetadas. Pero esta técnica no es fácilmente aplicable al entrenamiento de un brazo robótico.
Foto: Sergey Levine ha demostrado que sus algoritmos pueden ayudar a que un brazo robótico se autoenseñe a manipular varios objetos. Crédito: Daniel Berman.
Así que los expertos en robótica han recurrido a una técnica distinta: el científico le marca un objetivo al robot, por ejemplo el de enroscar la tapa de una botella, pero permite a la máquina averiguar los pormenores por sí sola. Al intentar realizar la tarea una y otra vez, finalmente alcanza la meta. Pero el proceso de aprendizaje requiere muchos intentos, y no funciona para tareas complejas.
El avance de Levine emplea el mismo tipo de algoritmo que ha destacado tanto en la clasificación de imágenes. Primero proporciona al robot versiones fáciles de resolver de la tarea entre manos, como por ejemplo que enrosque la tapa. El robot entonces estudia retrospectivamente sus propios éxitos. Observa cómo los datos de su sistema de visión corresponden con las señales motoras de la mano robótica que realiza correctamente la tarea. El robot supervisa su propio aprendizaje. "Realiza una ingeniería inversa de su propio comportamiento", explica Levine. Entonces puede aplicar lo aprendido a la realización de otras tareas relacionadas.
Con la técnica de inteligencia artificial, algunas tareas robóticas que parecían imposibles de repente se han vuelto alcanzables, gracias a la masiva mejora de la eficiencia de entrenamiento. De pronto, los robots se están volviendo mucho más listos.
—Andrew Rosenblum