Inteligencia Artificial

Una máquina de Google logra reconocer objetos que solo ha visto una vez

La sed de miles de datos que el aprendizaje automático necesita para aprender a identificar objetos podría estar cerca de saciarse gracias a un truco que permite aprender con un solo ejemplo

por Will Knight | traducido por Teresa Woods
14 Noviembre, 2016

La mayoría de nosotros somos capaces de reconocer un objeto tras haberlo visto uno o dos veces. Pero los algoritmos de visión de máquinas y el reconocimiento de voz necesitan miles de ejemplos para familiarizarse con cada imagen o palabra nueva.

Investigadores de Google DeepMind acaban de encontrar una forma de cambiar esto. Hicieron un par de ingeniosos ajustes en un algoritmo de aprendizaje profundo para que pueda reconocer objetos a partir de un sólo ejemplo, un enfoque conocido como "one-shot learning" (que podría traducirse como aprendizaje con un solo ejemplo, o aprendizaje único). El equipo demostró el truco con una gran base de datos de imágenes etiquetadas, además de con textos escritos a mano.

Los mejores algoritmos pueden reconocer los objetos de manera fiable, pero su dependencia de miles de datos hace que su desarrollo requiera mucho tiempo y dinero. Un algoritmo entrenado para identificar coches en carretera, por ejemplo, necesita ingerir varios miles de ejemplos para funcionar de manera fiable en un coche autónomo. Recopilar tantos datos a menudo es complicado. Por ejemplo, un robot que necesite navegar un hogar desconocido no puede dedicar innumerables horas a divagar y aprender.

El Innovador menor de 35 global en 2016 de MIT Technology Review e investigador científico de Google DeepMind, Oriol Vinyals, añadió un componente de memoria a un sistema de aprendizaje profundo. Este tipo de sistemas se componen de gran red neuronal artificial entrenada para reconocer cosas al ajustar la sensibilidad de muchas capas de componentes interconectados de forma más o menos similar a las neuronas del cerebro. Tales sistemas necesitan ver muchas imágenes para ajustar las conexiones entre estas neuronas virtuales.

El equipo demostró las capacidades del sistema con una base de datos de fotografías etiquetadas llamada ImageNet. El software aún necesita analizar varios cientos de categorías de imágenes, pero después puede aprender a reconocer objetos nuevos, por ejemplo, un perro, a partir de una única imagen. En realidad, lo que reconoce son precisamente aquellos elementos que hacen único a un objeto en cuestión. El algoritmo pudo reconocer imágenes de perros con una precisión que se acerca a la de un sistema hambriento de datos convencional tras ver tan sólo un ejemplo.

Vinyals afirma que el trabajo podría resultar especialmente útil si lograse reconocer el significado de una palabra nueva. Esto podría ser importante para Google, según Vinyals, puesto que permitiría que un sistema aprenda rápidamente el significado de un nuevo término de búsqueda.

Ya se habían desarrollado otros sistemas de aprendizaje único, pero normalmente no son compatibles con sistemas de aprendizaje profundo. Un proyecto académico del año pasado empleó técnicas de programación probabilística para habilitar este tipo de aprendizaje sumamente eficiente (ver Nace el ordenador capaz de leer un texto escrito a mano).

Pero los sistemas de aprendizaje profundo son cada vez más capaces, especialmente con la adición de mecanismos de memoria. Otro grupo de Google DeepMind desarrolló recientemente una red con un tipo de memoria flexible, que la habilita para ejecutar sencillas tareas de razonamiento. Por ejemplo, puede aprender a navegar por un sistema de metro tras analizar varios diagramas de red mucho más sencillos.

"Es un enfoque muy interesante, ya que proporciona una nueva forma de lograr el aprendizaje único con conjuntos de datos a escala muy grande", afirma el director del Laboratorio para Inteligencia Cerebral y de Máquinas del Instituto Coreano de Ciencias y Tecnologías Avanzadas de Daejeon (Corea del Sur), Sang Wan Lee. En su opinión, se trata de "una contribución técnica a la comunidad de la inteligencia artificial, algo que los investigadores de visión de máquinas podrían apreciar plenamente".

Otros se muestran más escépticos sobre su utilidad, ya que el proceso sigue siendo muy distinto al sistema de aprendizaje humano. Para empezar, el profesor del departamento de ciencias cerebrales de la Universidad de Harvard (EEUU) Sam Gershman señala que los humanos generalmente aprenden al entender los componentes que conforman una imagen, lo que puede requerir conocimientos del mundo real o de sentido común. Por ejemplo, "un Segway podría tener un aspecto muy distinto al de una bicicleta o motocicleta, pero puede ser compuesto por las misma piezas".

Tanto Gershman como Wan Lee, coinciden en que aún falta bastante para que las máquinas igualen el aprendizaje humano. Wan Lee concluye: "Seguimos lejos de revelar el secreto del aprendizaje único de los humanos, pero esta propuesta presenta claramente nuevos retos que merecen un estudio más profundo".

Inteligencia Artificial

Una máquina de Google logra reconocer objetos que solo ha visto una vez

Al habla con la IA: el reto de lograr voces más diversas e inclusivas

Estos robots aprendieron a superar obstáculos reales desde un entorno virtual gracias a la IA

Por qué la IA podría comerle la tostada a la computación cuántica