.

Computación

Facebook ya sabe decirte qué sale en una foto

1

Su nueva 'app' combina la capacidad de entender el lenguaje hablado de la pregunta y el contenido básico de la imagen, por ejemplo un gato junto a unos plátanos

  • por Tom Simonite | traducido por Teresa Woods
  • 05 Noviembre, 2015

Foto: Yann LeCun

Una nueva app móvil experimental desarrollada por los investigadores de Inteligencia Artificial de Facebook contesta a preguntas por voz sobre el contenido de las fotos.

Yann LeCun, el director del grupo de investigación de Inteligencia Artificial, presumió de la app, que algún día podría ayudar a los discapacitados visuales, en una ponencia en la conferencia EmTech de MIT Technology Review en Cambridge, Massachusetts (EEUU). Mostró cómo la app respondía a una serie de preguntas sobre varias fotos. En una, un gato olisqueaba un gran racimo de plátanos poco maduros. La app contestó correctamente a preguntas por voz sobre si salía un gato en la foto, qué hacía, sobre qué se encontraban los plátanos y sobre el color de los plátanos (verdes) y del gato (blanco y negro). En otro ejemplo, un perro sujetaba un juguete en la boca. Cuando se le preguntó a qué jugaba el perro, la app contestó correctamente. "Al frisbee".

"Lo que veis no es una falsificación; es un sistema real, y es capaz de contestar preguntas básicas sobre las imágenes", afirmó LeCun. "Un sistema que realmente describe una imagen podría resultar muy útil para los discapacitados visuales".

La app es un ejemplo de cómo los investigadores de inteligencia artificial de Facebook y de otras partes intentan combinar la compresión de lo que aparece en una imagen con la del lenguaje (ver El software de Google dice que en esa foto sale "un grupo de jóvenes jugando al frisbee"). Históricamente, se ha trabajado en esas áreas por separado, pero combinarlos podría crear sistemas más capacitados para entender nuestro mundo y ayudarnos a gestionarlo.

El grupo de investigaciones de LeCun está sobre todo centrado en el uso de una técnica llamada aprendizaje profundo (ver El aprendizaje profundo quiere revolucionar todas las industrias). Este enfoque incluye el desarrollo de software que aprende de los datos y está inspirado en la forma en que se conectan las células cerebrales y trabajan juntas. La técnica ha proporcionado grandes avances en la capacidad de las máquinas de entender el lenguaje natural y reconocer objetos en las imágenes. LeCun cree que pronto habilitará a los ordenadores para que entiendan muchos matices del lenguaje y sean capaces de mantener una conversación básica (ver El hombre que enseña a las máquinas a entender el lenguaje).

La app que lució LeCun este lunes en la conferencia EmTech está alimentada por un modelo de redes neuronales artificiales, desarrollado por su grupo, llamado redes de memoria, que se han demostrado anteriormente capaces de aprender el razonamiento verbal básico al leer unos sencillos cuentos.

Eric Horvitz, el director del laboratorio de investigaciones de Microsoft en Redmond, Washington (EEUU), también habló en el evento EmTech del lunes, y dijo que los sistemas que combinan diferentes habilidades y técnicas de aprendizaje de máquinas representan un importante próximo paso para la inteligencia artificial que permitiría que fuese más potente.

"Podemos empezar a enlazar estas cosas para formar experiencias más grandes", dijo. "Estoy bastante seguro de que los próximos grandes saltos de la inteligencia artificial vendrán de soluciones integradas en lugar del fantástico trabajo realizado hasta la fecha en trozos determinados".

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. Google anuncia un hito hacia la computación cuántica sin errores

    Una técnica llamada “código de superficie” permite a los bits cuánticos de la empresa almacenar y manipular datos fielmente durante más tiempo, lo que podría allanar el camino a ordenadores cuánticos útiles

  2. El vídeo es el rey: bienvenido a la era del contenido audiovisual

    Cada vez aprendemos y nos comunicamos más a través de la imagen en movimiento. Esto cambiará nuestra cultura de manera inimaginable

    Dos personas creando contenido en formato vídeo
  3. Esta empresa quiere superar a Google e IBM en la carrera cuántica con un superordenador de fotones

    La empresa quiere construir una computadora que contenga hasta un millón de cúbits en un campus de Chicago