La nueva tecnología de una startup permitirá a los teléfonos inteligentes reconocer objetos mediante la imitación del sistema visual humano.
¿Alguna vez ha encontrado un producto en una tienda y se ha preguntado si podría conseguirlo más barato en otro lugar? Pronto, una herramienta de búsqueda visual será capaz de ayudarle. Al tomar una instantánea del producto con el teléfono automáticamente podremos encontrar información de precios en línea.
La tecnología, desarrollada por Cortexica, una startup surgida de una investigación realizada en el Imperial College de Londres, ya se ha utilizado para crear una aplicación de comparación de vino llamada WINEfindr. La semana pasada, la compañía lanzó una interfaz de programación de aplicaciones (API) para la tecnología, que permitirá a terceros construir aplicaciones similares.
"Es un poco como las aplicaciones de escaneado de código de barras que enlazan un objeto físico en el mundo real con contenidos en línea", afirma Anil Bharat, investigador en Imperial y cofundador de Cortexica. "Pero en lugar de tener que crear un código QR, reconoce el objeto en sí mismo", afirma.
La plataforma VisualSearch de Cortexica utiliza técnicas inspiradas en el sistema de visión humana para compensar las distintas condiciones de iluminación. Identifica las principales características de un objeto, independientemente de su orientación, tamaño, o grado de oscuridad/luz que aparezcan en la imagen. Esto hace que sea posible identificar los productos a distancia, o incluso mientras se están moviendo. La tecnología de Cortexica también identificar logos y objetos en vídeos.
"La tecnología es interesante, aunque no ofrece demasiado", afirma James Ferryman, desde el grupo de visión por ordenador en la Universidad de Reading, en el Reino Unido.
Ferryman apunta que ya existen otras herramientas de búsqueda visual, como Goggles de Google, que reconoce una gran cantidad de objetos, etiquetas y puntos de referencia, y busca automáticamente en la red para obtener información sobre ellos; también existe TinEye, un servicio que permite a los usuarios cargar una imagen y buscar en la red para encontrar páginas web en las que el objeto aparezca representado.
Otro de los cofundadores de Cortexica, Jeffrey Ng, afirma que la tecnología de su compañía es más precisa y escalable que cualquier otra disponible en la actualidad.
El sistema de visión humana compara diferentes puntos de una imagen con sus vecinos—un fenómeno conocido como "extracción de bordes"—con el fin de identificar las características de una serie de condiciones diferentes. "Básicamente hemos copiado esa arquitectura", afirma Bharat. Cortexica utiliza unidades de procesamiento gráfico (GPU) para manejar el procesamiento en paralelo.
Hacer frente a las variaciones y resolverlas es un tema importante en la visión computacional, afirma Ferryman. "Es crucial. Si no se tiene esta invariancia, entonces no se pueden hacer comparaciones con confianza", afirma.