.

Computación

Microsoft hace una demostración de visión aumentada

1

Algoritmos mejorados de visión de ordenador superponen información digital al mundo real.

  • por Kate Greene | traducido por Rubèn Oscar Diéguez
  • 25 Febrero, 2009

Investigadores de Microsoft han creado un software que, en tiempo real, puede superponer información generada por ordenador por sobre una imagen digitalizada del mundo real.

Añadir datos visuales a un visualizador de vídeo es una técnica que se conoce como 'realidad aumentada'. (Ver “TR10: Realidad Aumentada.”) Michael Cohen, el investigador principal de Investigaciones Microsoft, en Redmond (Estados Unidos), asegura que el método podría aportar otra dimensión a los teléfonos inteligentes del futuro. “Podrías estar en la calle, levantar el dispositivo y éste podría reconocer un restaurante e indicar la calificación y el menú”, afirma. Un teléfono inteligente que tuviera un visualizador de realidad aumentada podría indicar la ruta de un ómnibus y calcular cuándo se espera que un determinado micro llegue a una calle en particular. “Se transformará esencialmente en tu portal hacia la información”, asegura Cohen.

Él y sus colegas han hecho una demostración de esta tecnología de realidad aumentada en TechFest, una muestra anual de  proyectos de investigación de Microsoft que se celebra en Redmond. Su software, que se ejecuta en un pequeño ordenador portátil, analiza escenas de una cámara, busca coincidencias con aquellas que están almacenadas en una base de datos y superpone información suplementaria en el visualizador. Los investigadores destacan que el teléfono inteligente con realidad aumentada podría permitir que los ingenieros “vieran” los caños o el cableado eléctrico por debajo de una calle.

La realidad aumentada ha sido un área de investigación activa durante más de una década, aunque a menudo se han necesitado visualizadores tipo casco y el equivalente a una mochila de equipo de computación. En los últimos años, los teléfonos y ordenadores portátiles con cámaras y otros sensores se hicieron lo suficientemente poderosos como para administrar la carga de trabajo de ordenador necesaria para ejecutar un sistema de realidad aumentada. Por ejemplo, los investigadores de Nokia y de la Universidad de Columbia (Estados Unidos) también están desarrollando sistemas de realidad aumentada, y una startup (empresa de corta vida con grandes posibilidades de crecimiento) japonesa llamada Tonchidot espera transformar el proyecto en producto. (Ver "Realizando hiper vínculos en la realidad a través de teléfonos portátiles").

La mayoría de los sistemas de realidad aumentada deben poder orientarse con precisión para que funcionen en forma fiable. Algunos localizan su posición mediante GPS o mediante la triangulación de varias señales de Wi-Fi, y determinar en qué sentido está apuntando utilizando un acelerómetro y una brújula digital. El dispositivo de realidad aumentada de Microsoft se centra en poder reconocer objetos dentro de una escena, utilizando algoritmos de visión de ordenador. Como la demostración se realiza en el entorno controlado de un salón de conferencias, los investigadores no están utilizando sensores de detección de ubicación. Dependen únicamente de la visión del ordenador.

Un desafío importante es reconocer los elementos de una escena sin tener en cuenta ni el ángulo, ni la iluminación. Cohen y su colega Simon Winder, un importante ingeniero de investigación de Microsoft, desarrollaron algoritmos que realizan esta tarea, fotograma por fotograma, para transmisiones de video en tiempo real. El algoritmo busca coincidencias automáticamente con imágenes analizadas previamente que están almacenadas en la base de datos. Al crear el algoritmo, los investigadores determinaron cuáles eran los mejores parámetros o características para que el sistema hiciera coincidir cada escena. Cohen explica que utilizaron aprendizaje automático para probar los distintos parámetros rápidamente y determinar cuáles lograban las mejores coincidencias.

Para la demostración, el equipo de Cohen tomó fotografías del salón de conferencias en que se realiza TechFest. Las fotografías se analizaron utilizando el software de visión de ordenador, y las características claves se almacenaron en una base de datos en un ordenador portátil que emplea una cámara de vídeo incorporada para capturar escenas.

“En aproximadamente una décima o una decimoquinta parte de un segundo, el software reconoce la escena y la busca en la base de datos”, comenta Cohen. Para el juego de la búsqueda del tesoro realizado durante la TechFest, el software exhibe un rastro de burbujas que apuntan en la dirección en que deberá caminar el usuario para hallar el tesoro.

Como es sólo un proyecto de investigación, Cohen hace hincapié en que todavía queda mucho espacio para mejoras. Él dice que, al fin y al cabo, los parámetros que se utilizan para identificar las características físicas de los objetos podrían redefinirse para que las coincidencias sean todavía más exactas.

Otro desafío que se deberá considerar es cómo funcionaría este sistema en un entorno mucho menos controlado, agrega Kari Pulli, un socio de investigación de Nokia. “La aplicación más conocida de la realidad aumentada es su uso como guía en un museo”, comenta. “Eso es fácil porque el entorno es fijo”. El desafío es asegurarse de que esos sistemas funcionen en entornos desconocidos, como una calle de una ciudad. Pero Pulli cree que esto podría llevarse a cabo mediante las bases de datos de Microsoft, Google y Navteq que contienen vistas de calles.

Cohen es optimista en cuanto a que los algoritmos de visión de ordenador que desarrolló su equipo podrían tener múltiples usos -desde sistemas de realidad aumentada hasta juegos y robótica- pero no cree que se apliquen pronto a algún producto específico de Microsoft.

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. Google anuncia un hito hacia la computación cuántica sin errores

    Una técnica llamada “código de superficie” permite a los bits cuánticos de la empresa almacenar y manipular datos fielmente durante más tiempo, lo que podría allanar el camino a ordenadores cuánticos útiles

  2. El vídeo es el rey: bienvenido a la era del contenido audiovisual

    Cada vez aprendemos y nos comunicamos más a través de la imagen en movimiento. Esto cambiará nuestra cultura de manera inimaginable

    Dos personas creando contenido en formato vídeo
  3. Esta empresa quiere superar a Google e IBM en la carrera cuántica con un superordenador de fotones

    La empresa quiere construir una computadora que contenga hasta un millón de cúbits en un campus de Chicago