.

Computación

El aprendizaje profundo ya entiende lo que aparece en un vídeo

1

El software distingue los elementos que aparecen en cada momento y podría crear nuevas formas de publicidad y facilitar la edición

  • por Tom Simonite | traducido por Francisco Reyes
  • 05 Febrero, 2015

Foto: El software de procesamiento de vídeo de Clarifai puede identificar objetos y escenas en un vídeo y crear una línea de tiempo para que puedas saltar al lugar en que aparece un determinado elemento.

Durante los últimos años, los investigadores de compañías como Google y Facebook han hecho avances impresionantes a la hora de entrenar software para que entienda lo que está pasando en las imágenes, gracias a una técnica conocida como aprendizaje profundo. Ahora, una start-up llamada Clarifai ofrece un servicio que utiliza el aprendizaje profundo para entender los vídeos.

La compañía asegura que su software puede analizar rápidamente clips de vídeo para reconocer 10.000 objetos o tipos de escena diferentes. En una demostración la semana pasada durante una conferencia sobre el aprendizaje profundo, el cofundador y director general de Clarifai, Matthew Zeiler, subió un clip con imágenes de un variado paisaje alpino. El software creó una línea de tiempo con líneas gráficas que resumían en qué momento se detectaban distintos objetos o tipos de escena. Mostró exactamente cuándo aparecían la nieve y las montañas individualmente y en conjunto. El software puede analizar vídeo más rápidamente de lo que un ojo humano tardaría en verlo. Durante la demostración, el clip de 3,5 minutos se procesó en tan sólo 10 segundos.

Clarifai ofrece la tecnología como servicio y espera que sea utilizada por ejemplo para vincular anuncios al contenido de los videos en internet, o desarrollar nuevas formas de organizar colecciones de vídeo y editar metraje.

El aprendizaje profundo consiste en procesar datos a través de una red de simples "neuronas" simuladas que han sido entrenadas con datos de ejemplo. La tecnología de Clarifai se originó durante una investigación en la Universidad de Nueva York (EEUU), y en 2013 la empresa se hizo con los cinco primeros puestos del principal concurso anual de software para identificar contenidos de imágenes.

Hasta ahora, la mayoría de las investigaciones en el campo se han centrado en las imágenes fijas, no en el vídeo. Clarifai lanzó un servicio de reconocimiento de imágenes fijas el año pasado. Otra start-up que también utiliza el aprendizaje profundo, Dextro, lanzó su propio servicio de procesamiento de vídeo a finales de diciembre.

Cualquiera puede probar el sistema de vídeo de Clarifai. En su sitio web, se puede cargar un clip de vídeo de hasta 10 megabytes para ser analizado. Entre los diferentes objetos o tipos de escena detectados puede haber coches, árboles o personas. El software también se puede aplicar a conceptos descriptivos más abstractos, como "diversión" y "unión".

Zeiler cree que su tecnología podría crear un nuevo enfoque para ofrecer publicidad junto a los vídeos por internet. "El software puede identificar qué parte del vídeo es el lugar óptimo para colocar un anuncio", aseguró.

Las empresas ya pueden pagar por colocar sus anuncios junto a cierto tipo de vídeos sobre un tema en particular. Zeiler cree que ser capaz de asociar automáticamente anuncios con momentos particulares en vídeos debería ser aún más atractivo para los anunciantes. La tecnología de Clarifai podría hacer posible que, por ejemplo, Starbucks haga que sus anuncios aparezcan cuando se consuma café.

Zeiler señala que ya está trabajando con empresas interesadas en utilizar la tecnología de análisis de vídeo. La compañía también está trabajando para que el software haga más cosas. Unas funciones en fase de desarrollo permitirán que el software resuma automáticamente lo que sucede en un vídeo y reconozca en qué momento ha ocurrido una actividad en particular, asegura Zeiler.

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. Google anuncia un hito hacia la computación cuántica sin errores

    Una técnica llamada “código de superficie” permite a los bits cuánticos de la empresa almacenar y manipular datos fielmente durante más tiempo, lo que podría allanar el camino a ordenadores cuánticos útiles

  2. El vídeo es el rey: bienvenido a la era del contenido audiovisual

    Cada vez aprendemos y nos comunicamos más a través de la imagen en movimiento. Esto cambiará nuestra cultura de manera inimaginable

    Dos personas creando contenido en formato vídeo
  3. Esta empresa quiere superar a Google e IBM en la carrera cuántica con un superordenador de fotones

    La empresa quiere construir una computadora que contenga hasta un millón de cúbits en un campus de Chicago