Este sistema distribuye sus neuronas en grupos para distintos conceptos, lo que permite manipularlo para influir en su resultado. Este avance muestra cómo 'piensa' y abre un poco la tapa de la caja negra de la inteligencia artificial
Las redes generativas antagónicas (o GAN), son las estrellas de los algoritmos de inteligencia artificial (IA). Estos sistemas han creado el primer cuadro elaborado por una IA que se ha vendido en una subasta de arte y son los que permiten superponer caras de celebridades en los cuerpos de estrellas porno. Trabajan enfrentando a dos redes neuronales entre sí para crear resultados realistas basados en los datos de alimentación. Con un montón de fotos de perros, una GAN puede crear perros completamente nuevos; con muchas caras, se pueden crear caras nuevas.
Ahora, los investigadores del MIT-IBM Watson AI Lab también se han dado cuenta del poder de las GAN. Dado que pintan lo que están "pensando", además de su potencial para causar problemas, podrían ofrecer información sobre cómo las redes neuronales aprenden y razonan. Se trata de algo que la comunidad investigadora lleva mucho tiempo buscado, un aspecto que se vuelve cada vez más importante a medida que aumentamos dependencia de los algoritmos (ver El secreto más oscuro de la inteligencia artificial: ¿por qué hace lo que hace?).
El estudiante de doctorado del MIT que involucrado en el proyecto, David Bau, afirma: "Es una oportunidad para descubrir qué sabe una red cuando intenta recrear el mundo visual". El equipo ha estado explorando los mecanismos de aprendizaje de una GAN dándole varias fotos de paisajes: árboles, hierva, edificios y cielo. Querían ver si aprendería a organizar los píxeles en grupos sensibles sin que se le dijera explícitamente cómo hacerlo.
Sorprendentemente, con el tiempo, acabó haciéndolo. Al encender y apagar varias "neuronas" y al pedirle a la GAN que pintara lo que pensaba, los investigadores encontraron distintos grupos de neuronas que habían aprendido a representar un árbol, por ejemplo. Otros grupos se encargaban de representar la hierba, paredes o puertas. En otras palabras, la red había logrado agrupar los píxeles de árbol con los píxeles de árbol y los píxeles de puerta con los de puerta, independientemente de cómo estos objetos cambiaran de color de una foto a otra en el conjunto de entrenamiento.
Foto: Las GAN saben que no se debe pintar ninguna puerta en el cielo. Créditos: Laboratorio de Informática e IA del MIT.
"Estas GAN están aprendiendo conceptos que recuerdan mucho a los conceptos a los que los humanos les han dado un nombre", afirma Bau. Y no solo eso, las GAN parecían saber qué tipo de puerta pintar en función del tipo de pared que aparecía en la imagen. Dibujarían una puerta de estilo georgiano en un edificio de ladrillo de arquitectura georgiana, y una puerta de piedra en un edificio gótico. Además, el sistema se negó a pintar puertas en un pedazo de cielo. Sin que se lo dijeran, las GAN habían captado ciertas verdades tácitas sobre el mundo.
El resultado fue una gran revelación para el equipo. Bau detalla: "Tienen ciertos aspectos del sentido común. Antes no estaba claro si había alguna forma de aprender este tipo de cosas [a través del aprendizaje profundo]". El hecho de que eso sí sea posible sugiere que el aprendizaje profundo puede ayudarnos a descubrir más sobre cómo funcionan nuestros cerebros, aunque su funcionamiento no se acerca ni de lejos a cualquier forma de inteligencia humana.
Otros grupos de investigación han empezado a encontrar comportamientos de aprendizaje similares en redes que manejan otros tipos de datos, según Bau. En la investigación del lenguaje, por ejemplo, han encontrado grupos de neuronas para palabras en plural y pronombres de género.
La posibilidad de identificar qué grupos corresponden a qué conceptos permite controlar el rendimiento de una red neuronal. El grupo de Bau puede activar únicamente las neuronas del árbol, por ejemplo, para hacer que las GAN pinten árboles, o activar solo las neuronas de la puerta para que pinten puertas. De manera similar, las redes lingüísticas pueden manipularse para cambiar su resultado, por ejemplo, para cambiar el género de los pronombres mientras se traducen de un idioma a otro. El investigador añade: "Estamos empezando a habilitar la capacidad para que una persona realice intervenciones que causen diferentes resultados".
El equipo ha lanzado una aplicación llamada GANpaint que convierte esta nueva capacidad en una herramienta artística. Permite activar grupos específicos de neuronas para pintar escenas de edificios en campos de hierba con muchas puertas. Más allá de esta ridícula y lúdica función, la aplicación señala un mayor potencial para esta investigación.
Tataa ! I'm happy to announce the release of #GANpaint today - based on the new #GANdissect method, which helps to identify what units in a #GAN have learned. It's a joy to be part of the team of David Bau, @junyanz89, Antonio Torralba,.. #MITIBM #AI See https://t.co/tVs2olyyds pic.twitter.com/8C8HfwRCSE
— Hendrik Strobelt (@henddkn) 27 de noviembre de 2018
Bau detalla: "El problema con la IA es que al pedirle que haga una tarea por nosotros, le estamos dando mucha confianza. Introducimos nuestros datos, el sistema llega a cabo su "mágico" pensamiento y nos ofrece un resultado. Incluso si tuviéramos expertos humanos súper inteligentes, tampoco nos gustaría trabajar con ellos así".
GANpaint está empezando a abrir la tapa de la caja negra de la IA para empezar a establecer relaciones. El creador de la aplicación, Hendrik Strobelt, concluye: "Podemos averiguar qué sucede si hacemos esto, o lo otro. En cuanto somos capaces de jugar con estas cosas, ganamos más confianza en sus capacidades y también en sus límites".