Investigadores de Yahoo Labs consiguen evaluar de manera automática la creatividad de los microvídeos de seis segundos de Vine
En enero de 2013 un servicio para compartir vídeos llamado Vine se lanzó de pronto al ciberespacio. El servicio, propiedad de Twitter, era único porque permitía a los usuarios grabar y compartir vídeos de no más de seis segundos de duración. En sólo unos meses se convirtió en la aplicación para compartir vídeos más popular de internet y en la aplicación gratis más descargada de la tienda de Apple.
La limitación de tiempo ha tenido un impacto interesante en el proceso creativo: ha obligado a los usuarios a contar sus historias en sólo seis segundos. Esto, por su parte, ha creado un nuevo género de filmación que hoy día cuenta con su propia categoría de seis segundos en el Festival de Cine de Tribeca de Nueva York (EEUU).
El extraordinario éxito de los vídeos de seis segundos ofrece una curiosa oportunidad. Como los vídeos son tan cortos, son relativamente fáciles de analizar usando algoritmos de visión artificial y técnicas de análisis de audio. Y esto plantea una cuestión interesante. ¿Pueden estas técnicas automatizadas diferenciar entre vídeos de seis segundos que un humano considere creativos y otros considerados como no creativos?
La respuesta nos llega gracias al trabajo de Miriam Redi desde el Yahoo Labs en Barcelona (España) y varios colegas que han utilizado técnicas de crowdsourcing y algoritmos de máquinas para analizar unos 4.000 vídeos de seis segundos del stream de Vine. Los resultados sugieren que las máquinas pueden distinguir bien entre contenido creativo y no creativo, al menos en vídeos de seis segundos.
El equipo empezó con un grupo de datos compilado a partir de 1.000 vídeos que ya habían sido destacados por su creatividad. Seleccionaron otros 200 vídeos de artículos en línea sobre la creatividad de Vine y rastrearon el contenido producido por los autores de este contenido para encontrar otros 2.300 vídeos. Finalmente, recogieron unos 500 videos más al azar del stream de Vine.
La siguiente tarea fue determinar cuáles de estos vídeos eran creativos y cuáles no. Para averiguarlo, pidieron a unos 300 voluntarios escogidos mediante crowdsourcing que vieran los vídeos y contestaran a la pregunta: "¿Es este vídeo creativo?"; dando como posibles respuestas positivo, negativo o no lo sé. Cada vídeo fue calificado por cinco voluntarios distintos.
Estos sujetos produjeron resultados sorprendentemente consistentes. Estuvieron de acuerdo en un 100% acerca del 48% de los vídeos. En otras palabras, los cinco evaluadores dieron la misma puntuación a casi la mitad de los vídeos. De dichos vídeos, acordaron que el 25% eran creativos. Para poner todo esto en perspectiva, los voluntarios identificaron sólo el 1,9% de los 500 vídeos seleccionados al azar como creativos, creando así una tasa de creatividad que podía usarse como base.
Después analizaron cada vídeo con varios algoritmos. Por ejemplo, buscaron características de composición como la regla de los tercios y la poca profundidad de campo. Usaron un algoritmo para analizar el contenido de las escenas de vídeo y estudiar los contornos y el diseño de las imágenes. También buscaron cualquier indicio de que los vídeos fueran animaciones fotograma a fotograma o de que estuvieran diseñados para reproducirse en un bucle sin fin, mediante la búsqueda de similitudes entre el primer y el último fotograma. Además, evaluaron el factor novedoso de cada vídeo comparando sus propiedades con otro grupo de vídeos seleccionados al azar.
A continuación buscaron correlaciones entre las características encontradas por los algoritmos de máquina y los vídeos identificados como creativos por los voluntarios humanos. Resulta que el contenido de la escena es lo que más está relacionado con la creatividad, seguido de las características de composición y el aspecto novedoso del vídeo.
Finalmente, entrenaron a un algoritmo de aprendizaje de máquinas para que utilizara estas características para encontrar vídeos creativos en un conjunto de datos que no había visto antes. El algoritmo fue capaz de clasificar correctamente los vídeos en función de su creatividad el 80% de las veces.
El resultado es interesante y abre la posibilidad de filtrar automáticamente el stream en directo de Vine y resaltar el contenido más creativo. "Esto nos permite estudiar la creatividad audiovisual a un nivel detallado y entender qué es lo que constituye exactamente la creatividad en los microvídeos", aseguran Redi y compañía.
Y si es posible que un algoritmo identifique con precisión la creatividad, ¿por qué no podría ser posible que un ordenador generase contenido creativo? De hecho, ver la diferencia entre la creatividad humana y la generada por un ordenador podría ser algún día un interesante ejercicio al estilo del test de Turing.