La inteligencia artificial puede superar a las personas a la hora identificar caras y objetos, e incluso es capaz de crear versiones propias increíblemente realistas. Pero esta investigación ha descubierto que los sistemas de visión artificial son incapaces de entender y replicar este tipo de imágenes
La visión humana es extraordinaria. Aunque durante muchos millones de años ha ido evolucionando para adaptarse a entornos específicos, la vista es capaz de realizar tareas que a las que los sistemas visuales primigenios nunca tuvieron que enfrentarse. La lectura es un buen ejemplo, al igual que la identificación de objetos artificiales como coches, aviones, señales de tráfico, etcétera.
Pero el sistema visual también tiene un conocido abanico de defectos al que conocemos como ilusiones ópticas. La ciencia ha identificado muchos de los procesos que provocan que estas ilusiones nos hagan ver colores, tamaños, alineaciones y movimientos que en realidad no están ahí.
Las ilusiones ópticas en sí mismas son interesantes porque proporcionan información sobre la naturaleza del sistema visual y la percepción. Por lo tanto, sería muy útil descubrir nuevas estrategias para identificar ilusiones ópticas que nos ayuden a explorar estos límites.
Ilusión ópitica: ¿Círculos concéntricos?
Aquí es donde entra el aprendizaje profundo. En los últimos años, las máquinas han aprendido a reconocer objetos y caras en imágenes y también a crear versiones similares. Así que cualquiera pensaría que un sistema de visión artificial debería aprender a reconocer ilusiones ópticas y crear las suyas propias.
Eso es lo que intentaron los investigadores de la Universidad de Louisville en Kentucky (EE.UU.) Robert Williams y Roman Yampolskiy, pero descubrieron que no era tanfácil como creían. De momento, los sistemas actuales de aprendizaje automático son incapaces de generar ilusiones ópticas, la pregunta es: ¿por qué?
Los últimos avances del aprendizaje profundo se basan en dos puntos. El primero es la disponibilidad de las poderosas redes neuronales y algunos trucos de programación que les ayudan a aprender. El segundo es la posibilidad de acceder a enormes bases de datos para entrenar a las máquinas.
Para enseñar a una máquina a reconocer caras, por ejemplo, hacen falta decenas de miles de imágenes con caras claramente etiquetadas. Gracias a esa información, una red neuronal puede aprender a detectar patrones faciales característicos: dos ojos, una nariz y una boca, por ejemplo. Y lo que es más impresionante, cuando dos redes de este tipo de juntan en un sistema conocido como redes generativas antagónicas, se retroalimentan mutuamente hasta que adquieren la capacidad de crear imágenes de rostros increíblemente realistas, pero totalmente artificiales.
Con este mismo enfoque, Williams y Yampolskiy intentaron enseñar a una red neuronal a identificar ilusiones ópticas. Pero aunque tenían la potencia computacional necesaria, carecían de una base de datos de entrenamiento adecuada. Así que la primera tarea de los investigadores fue crear una base de datos de ilusiones ópticas de entrenamiento.
Pero resulta que el primer paso ya fue bastante difícil. "El número de ilusiones ópticas estáticas es de unos pocos miles, y el número de tipos únicos de ilusiones es increíblemente bajo, tal vez solo unas pocas docenas", explica la investigación.
La escasez de datos es un enorme desafío para los sistemas actuales de aprendizaje automático. "Crear un modelo capaz de aprender a partir de un conjunto de datos tan pequeño y limitado representaría un gran salto en los modelos generativos y en la comprensión de la visión humana", añade el texto.
Así que Williams y Yampolskiy crearon una base de datos de más de 6.000 ilusiones ópticas y luego entrenaron a una red neuronal para que aprendiera a reconocerlas. Después, construyeron una red generativa antagónica para que creara sus ilusiones ópticas propias.
Pero este resultado también fue decepcionante. "Tras siete horas de entrenamiento en un Nvidia Tesla K80, el sistema no generó nada de valor", lamentan los investigadores, que han puesto su base de datos a disposición de otros usuarios.
Aun así, el experimento resulta interesante. La investigación detalla: "Las únicas ilusiones ópticas conocidas por los humanos han sido creadas por la naturaleza (por ejemplo, patrones de ojos en alas de mariposa) o por artistas humanos". En ambos casos, los humanos juegan un papel crucial en la capacidad de engaño de las ilusiones ópticas, porque es el sistema visual humano el que ve la ilusión.
Parece ser que eso es algo que los sistemas de visión artificial son incapaces de hacer. "Parece poco probable que [una red generativa antagónica] pueda aprender a engañar a la visión humana sin entender primero los principios que rigen estas ilusiones", sostienen Williams y Yampolskiy.
Puede que lograr este objetivo no sea fácil, porque los sistemas de visión artificial y el sistema visual humano son completamente diferentes. Varios investigadores están desarrollando redes neuronales que cada vez se parecen más al sistema visual humano. Una prueba interesante para ellos será analizar si son capaces de ver las ilusiones ópticas o no.
Mientras tanto, Williams y Yampolskiy muestran una actitud bastante pesimista. Su investigación concluye: "Parece que una base de datos de ilusiones ópticas no es suficiente para crear nuevas ilusiones". Así que de momento, las ilusiones ópticas van a seguir siendo una de esas cosas, cada vez más singulares, que los humanos dominan pero que se resisten a las máquinas.
Ref: arxiv.org/abs/1810.00415: Optical Illusions Images Dataset