Wojciech Zaremba (Polonia), 30
OpenAI
Ha enseñado a una mano robótica a hacer cosas por sí misma
Wojciech Zaremba lidera un equipo que ha utilizado aprendizaje automático para entrenar una mano robótica para que aprenda a recoger un bloque de juguete en diferentes entornos. El robot debía resolver por sí mismo cómo realizar la compleja tarea de agarrar el bloque y girarlo con sus dedos robóticos a partir de las instrucciones que recibió previamente.
Zaremba entrenó al robot mediante una red neuronal, un programa informático que imita el tipo de redes que utilizan nuestros cerebros. Aunque el aprendizaje reforzado ya se ha usado en robótica, nunca había resultado útil para algo tan complicado como controlar una mano robótica. Esto se debe a que las numerosas tareas involucradas requieren el equivalente a cientos de años de práctica. Y los robots entrenados en mundos virtuales generalmente no han sido capaces de traducir sus capacidades al mundo real, debido a la brecha entre la física simulada y la del mundo real.
Zaremba, cofundador del grupo de investigación de IA OpenAI, planteó la hipótesis de que variar las condiciones en un entorno virtual podría preparar a una red neuronal para el caos de la realidad. Después, introdujo 254 parámetros físicos, como la masa del bloque y la fricción de las yemas de los dedos, y descubrió que, después del entrenamiento, la mano fue capaz de manipular el bloque la primera vez que lo intentó en el mundo real.