El software, que sabe si una pila de bloques virtuales se caerá, podría señalar el camino hacia máquinas que aprendan los fundamentos físicos de la realidad.
Foto: El software de Facebook ha aprendido a predecir con precisión si una torre de bloques virtuales precariamente equilibrada se derrumbará.
¿Se caerá esta torre de bloques virtuales? Facebook ha entrenado software que conoce la respuesta.
Los investigadores en inteligencia artificial de la empresa emprendieron este proyecto en un esfuerzo por explorar cómo los ordenadores podrían aprender algo de sentido común físico básico. Entender, por ejemplo, que los objetos sin apoyos físicos se caen, o que un objeto más grande no cabe dentro de otro más pequeño, es fundamental para la manera en la que los humanos realizamos predicciones, comunicamos y explicamos el mundo. Para que las máquinas sean más útiles, necesitarán tener el mismo entendimiento de sentido común, dice Mike Schroepfer, el director de tecnología de Facebook.
"Tenemos que enseñar a los sistemas informáticos a entender el mundo de una forma similar [a la nuestra]", dijo en un adelanto de los resultados que presentó en el Web Summit en Dublin (Irlanda).
El ser humano aprende la física básica de la realidad a una edad temprana, al jugar y observar el mundo. Facebook aprovechó su software de procesamiento de imágenes para crear un sistema que aprendió a predecir si una pila de bloques virtuales se caería.
El software aprende al analizar imágenes de pilas de bloques virtuales, como la que se ve en la imagen de este artículo, o, a veces, dos imágenes en estéreo como las que captarían un par de ojos. En la fase de aprendizaje se le presentaron muchas torres distintas, algunas que se cayeron y otras que no. La simulación informó al software de aprendizaje de cuál hizo qué. Después de observar suficientes ejemplos, el software podía predecir por si sólo, con una precisión del 90%, si era probable que una torre determinada se cayera. "Si lo haces pasar una serie de pruebas, ganará a la mayoría de la gente", dijo Schroepfer.
La investigación fue realizada por el grupo de investigación en inteligencia artificial de Facebook, radicado en Nueva York (EEUU). El grupo se centra sobre todo en desarrollar software que pueda entender imágenes y el lenguaje, mediante una técnica conocida como aprendizaje profundo. La semana pasada el grupo presentó una app móvil capaz de contestar preguntas sobre el contenido de las fotos.
Yann LeCun, director del grupo y también profesor de la Universidad de Nueva York (EEUU), contó a MIT Technology Review que el sistema para predecir cuándo los bloques se caerán demuestra que podrían emplearse simulaciones físicas más complejas para enseñar más principios físicos de sentido común. "Sirve para establecer un punto de partida – si entrenáramos el sistema sin supervisarlo, tiene suficiente potencia para averiguar cosas así", dijo.
El grupo de LeCun ya desarrolló anteriormente un sistema, llamado "red de memoria", que puede adquirir algo de sentido común y habilidades de razonamiento verbal al leer unos sencillos cuentos (ver El hombre que enseña a las máquinas a entender el lenguaje).
Ahora ha pasado a ayudar a alimentar el asistente virtual que Facebook está probando, llamado M (ver "El asistente virtual de Facebook hace tareas que ninguna inteligencia artificial puede"). M está mucho más capacitado que Siri, de Apple, u otras apps parecidas, porque está controlado por un banco de operadores humanos. Facebook espera que, con el tiempo, los operadores pierdan importancia según su software aprenda a resolver las consultas por su propia cuenta.
La adición de la red de memoria a M está demostrando cómo eso podría suceder, dice Schroepfer. Al observar las interacciones entre los usuarios de M y los agentes de atención al cliente que contestan, ya ha aprendido a gestionar algunas consultas frecuentes.
Por ejemplo, si alguien quiere enviar flores, la red de memoria entrenada sabe que las cosas más importantes a preguntar son "¿cuál es tu presupuesto?" y "¿dónde deben ser entregadas?". Ahora el sistema ofrece a los agentes humanos plantear estas dos preguntas de forma automática mediante un botón, ayudando a que contesten con mayor rapidez. En el futuro la red de memoria podría ser capaz de gestionar determinadas peticiones de forma automática, según Schroepfer.
Facebook no se ha comprometido a convertir M en un producto de masas, pero Schroepfer dice que los resultados demuestran que sería posible. "El sistema ha averiguado todo esto sólo observando a los humanos", dijo. "No podemos permitirnos contratar operadores para el mundo entero, pero con el sistema de inteligencia artificial adecuado podríamos desplegarlo para el planeta al completo".