.

aprendizaje de máquinas, inteligencia artificial, cuadros, creatividad, arte, red antagonista creativa

¿Cuáles de estas imágenes han sido creadas por una máquina? *Respuesta al final del artículo

Inteligencia Artificial

¿Puede distinguir los cuadros humanos de los generados por una inteligencia artificial?

1

Una investigación ha entrenado a una máquina para que genere obras de arte a partir de estilos que conoce pero que incluyan aspectos novedosos. Y los participantes del estudio calificaron las piezas creadas por el ordenador mejor que las obras humanas, aunque no saben si esto puede considerarse creativo

  • por Emerging Technology From The Arxiv | traducido por Teresa Woods
  • 06 Julio, 2017

La creatividad es uno de los grandes desafíos de la inteligencia artificial. Cada vez hay más demostraciones de programas que superan las capacidades humanas en ámbitos como el reconocimiento facial y de objetos, el garabateo, la síntesis de imágenes, la traducción y una gran variedad de juegos como el ajedrez y Go, entre otros. Pero cuando se trata de la creatividad, las máquinas siguen siendo bastante tontas. Y no es porque nadie lo esté intentando.  Por ejemplo, las máquinas han aprendido a reconocer un estilo artístico, separarlo del contenido de una imagen y a aplicarlo a otra distinta. Esta tecnología permite, por ejemplo, convertir cualquier fotografía en lo que parecería un cuadro de Van Gogh. Pero aunque estas investigaciones aportan conocimiento sobre la naturaleza del estilo artístico, no cuentan como creatividad. Por lo tanto, el desafío todavía consiste en encontrar formas de explotar la inteligencia artificial para fines creativos. El trabajo del investigador del Laboratorio de Arte e IA de la Universidad de Rutgers en Nueva Jersey (EEUU) Ahmed Elgammal y varios compañeros se aproxima bastante bien a este objetivo.

Este equipo ha entrenado una máquina para generar imágenes que cualquiera podría atribuir al arte humano, pero con diferencias que pueden medirse. Además, han llevado a cabo una especie de prueba de Turing para la creatividad en la que preguntaban a voluntarios si podían distinguir entre el arte humano y el generado por su máquina. También quisieron saber cuál les gustaba más, y los resultados son algo sorprendentes.

El enfoque es relativamente sencillo. Está basado en una máquina llamada red antagonista generadora, que incluye dos redes neuronales que ejecutan el proceso de aprendizaje de forma conjunta. Una de estas redes es un algoritmo tradicional de visión automática que aprende a reconocer un tipo concreto de imágenes. El equipo de Elgammal lo entrenó con la base de datos de WikiArt, que contiene más de 80.000 obras de más de 1.000 artistas que datan desde el siglo XV hasta el siglo XX.

Cada imagen está etiquetada con su estilo artístico. Así que la base de datos contiene más de 13.000 obras impresionistas, 2.000 obras cubistas, más de 1.000 obras del Renacimiento temprano, y así sucesivamente. La máquina aprende a reconocer cada uno de estos estilos.

En la siguiente etapa, otra red genera imágenes aleatorias y se las muestra a la red entrenada en la primera etapa. La primera red debe distinguir si la imagen representa algún estilo de los que conoce, o en caso contrario la rezacha. Al generar muchas imágenes, la segunda red aprende lo que la primera red reconoce como arte mediante un proceso de ensayo y error. Y tas  muchas iteraciones, aprende a generar imágenes que coinciden con estilos específicos.

El equipo no considera que esto sea una forma de creatividad, ya que la máquina se limita a imitar estilos artísticos conocidos. Por el contrario, un artista humano  intentaría empujar los límites del arte con un estilo nuevo. Los historiadores del arte y los psicólogos tienen varias hipótesis sobre el proceso creativo que da lugar a nuevas formas de arte. Una de ellas consiste en que una nueva obra artística tiene que estar firmemente arraigada en una tradición artística. En otras palabras, tiene que ser diferente, pero no demasiado diferente.

En particular, los teóricos dicen que el arte debe estimular al espectador de maneras específicas. "Las propiedades estimulantes más significativas para la estética son la novedad, el elemento de sorpresa, la complejidad, la ambigüedad y el desconcierto", afirma la investigación.

"La novedad se refiere al grado al cual un estímulo difiere de lo que un observador haya visto o experimentado antes. La sorpresa se refiere al grado al cual un estímulo no concuerda con la expectativa. La sorpresa no está necesariamente relacionada con la novedad, y, de hecho, la falta de novedad puede generar sorpresa. A diferencia de la novedad y la sorpresa, que se basan en comparaciones entre similitudes y diferencias de estímulos, la complejidad es una propiedad intraestímulo que aumenta a medida que crece el número de elementos independientes dentro de un estímulo. La ambigüedad se refiere al conflicto entre la información semántica y sintáctica de un estímulo. El desconcierto se refiere a la ambigüedad debido a múltiples significados, potencialmente contradictorios", detalla el trabajo.

Pero cualquiera que sea su efecto, el nivel de estímulo debe ser moderado en lugar de extremo. "Un estímulo muy pequeño se considera aburrido y uno excesivo puede generar aversión, lo que genera una respuesta negativa", explica el equipo de Elgammal.

Eso tiene importantes implicaciones sobre cómo se configura la red antagonista generadora. "Su objetivo consiste en generar arte con mayores niveles de potencial de estímulo de una manera limitada sin activar el sistema de aversión. En otras palabras, la máquina intenta generar arte que sea novedoso, pero no demasiado novedoso", detalla el artículo.

Los investigadores creen que han dado con una forma de conseguir que la máquina haga justo eso. Una vez que el programa ha aprendido a reproducir ciertos estilos artísticos, se reconfigura para generar imágenes que se ajusten a los límites aceptados del arte en general, pero también para maximizar la diferencia con los estilos conocidos. "El agente intenta explorar el espacio creativo al salirse de las normas de estilo establecidas, lo que da lugar a nuevas formas de arte", dice el equipo de Elgammal, que ha bautizado a la máquina como red antagonista creativa.

La prueba de fuego consiste en ver las reacciones humanas frente al arte creado por la máquina. Para averiguarlo, el equipo de Elgammal mostró una serie de imágenes, tanto humanas como artificiales, a los miembros de Mechanical Turk, un servicio de crowdsourcing de Amazon.

Las imágenes generadas por humanos incluyen obras de WikiArt del Expresionismo Abstracto, así como una selección de imágenes de una feria de arte contemporáneo celebrada en Basilea (Suiza) en 2016. Estas imágenes representan la cúspide del arte moderno. El motivo para escoger el expresionismo abstracto es que este carece de personas y objetos que claramente permitirían distinguir las piezas de un humano frente a las de una máquina.

Algunas de las obras artificiales fueron producidas por la red antagonista creativa, pero otras fueron creadas por la red antagonista generadora que se limitaba a reproducir los estilos que ya había aprendido. Los investigadores pidieron a cada persona que calificara las obras bajo varios parámetros, como cuánto le había gustaba cada una, cuán novedosa le había parecido y si creían que había sido creada por un humano o una máquina. También les preguntaron si eran capaces de percibir la intención del artista, si podían divisar una estructura emergente y si la imagen les inspiraba.

Los resultados son interesantes. A los seres humanos se les daba bastante bien distinguir entre las imágenes expresionistas abstractas creadas por un ser humano y las que fueron creadas por la máquina. Pero en el caso de las piezas de la feria de Basilea, los espectadores humanos tuvieron dificultades para diferenciarlas.

Los participantes dieron mejor calificación a las obras de la red antagonista creativa que las piezas humanas. Se identificaron más con ellas y las encontraron más estimulantes. Resulta tentador interpretar el resultado como una crítica al arte moderno y su nivel de creatividad. Pero el equipo de Elgammal evita una reacción precipitada. La investigación afirma: "Dejamos abierta la interpretación de las respuestas de los participantes que clasificaron mejor al arte artificial que las muestras de la feria Art Basel en diferentes aspectos".

La gran pregunta es si el proceso que el equipo de Elgammal ha utilizado para hacer sus imágenes se puede considerar creativo. Otra interpretación sería que no es más que un proceso puramente algorítmico que ha aprendido a explotar las debilidades emocionales de la humanidad. De ser así, tal vez una nueva forma de definir el arte en el futuro debería incluir que debe ser producida exclusivamente por un humano. Sea como sea, el trabajo tiene la capacidad de empujar un poquito más los límites del arte y de la creatividad.

Ref: arxiv.org/abs/1706.07068: CAN: Creative Adversarial Networks Generating “Art” by Learning About Styles and Deviating from Style Norms

*Respuesta: todos los cuadros de la imagen han sido creados por una máquina, ¿le gustan?

Inteligencia Artificial

 

La inteligencia artificial y los robots están transformando nuestra forma de trabajar y nuestro estilo de vida.

  1. Así funciona el oligopolio de los datos que entrenan los modelos de IA

    Un estudio revela que los datos empleados para entrenar la IA están concentrando el poder en manos de unas pocas empresas, creando un oligopolio alineado con los intereses y objetivos de corporaciones con fines lucrativos

    Tras el telón de la IA: de dónde salen los datos que la construyen
  2. El gobierno de EE UU pone bajo la lupa a las empresas de IA por publicidad engañosa

    La Comisión Federal de Comercio (FTC) de Estados Unidos ha tomado medidas contra varias empresas de IA por mentir y realizar publicidad engañosa, una lucha que continuará durante el próximo mandato de Donald Trump

    La Comisión Federal de Comercio (FTC) de Estados Unidos ha tomado medidas contra varias empresas de IA
  3. Las emisiones de la IA están a punto de dispararse aún más

    Las emisiones de los centros de datos se han triplicado desde 2018. A medida que modelos de IA más complejos como Sora de OpenAI comiencen a generalizarse, es probable que esas cifras se disparen

    Ordenador portátil echando humo