La 'start-up' PredictGaze cree que la tecnología capaz de detectar dónde miras y qué aspecto tienes es la interfaz del futuro.
No hay muchos mandos a distancia en el salón de Ketan Banjara. Para bajar la música solo tiene que acercarse un dedo a los labios. Y cuando se levanta del sofá y sale del cuarto, su pantalla de televisión se apaga automáticamente.
Banjara es cofundador de PredictGaze, una start-up que combina la detección de la mirada, el reconocimiento de gestos y el reconocimiento de rasgos faciales para crear formas más naturales de controlar cualquier cosa, desde la tele hasta el coche.
Ahora que el uso de aparatos con pantallas táctiles se está convirtiendo en algo generalizado, PredictGaze es una de las numerosas empresas que apuestan por que lo próximo será el control de los aparatos sin necesidad de tocarlos. Y puesto que hay cámaras incorporadas en todo tipo de dispositivos, no cuesta imaginar que esto pueda suceder.
Por ahora el software de la empresa se ha integrado en un juego iOS que permite a los usuarios controlar a un monstruo zampón mediante movimientos de la cabeza. La tecnología también está probándose en algunas tiendas en Japón, donde las cámaras analizan el sexo, la sonrisa y el tiempo que pasa delante de un producto cada cliente con la esperanza de que estos datos sirvan para aumentar las ventas al ofrecer al comprador dubitativo un cupón en el momento adecuado, o mejorando la colocación del producto.
PredictGaze imagina toda clase de aplicaciones para su tecnología, desde impedir que tu hijo de cinco años vea contenido adulto en la televisión, hasta detectar que te estás durmiendo al volante de tu coche.
La tecnología de la empresa combina el aprendizaje de máquinas con algoritmos de visión de ordenador en un software que puede usar una cámara VGA estándar para averiguar a dónde estás mirando, cuál es tu sexo o si estás sonriendo, entre otras cosas. También es capaz de identificar gestos, y todo ello puede traducirse en órdenes para que los aparatos hagan lo que queremos.
Gracias a ellos podemos determinar la edad de una persona, por ejemplo. PredictGaze ha entrenado a su software con imágenes de personas de distintas edades. Esta información podría usarse para identificar tu edad partiendo de una imagen tuya cuando estás delante de una cámara conectada a un iPad en el que se ha instalado su software.
La empresa también ha entrenado a su software con miles de imágenes de acciones de personas mandando callar con un dedo en los labios para poder identificar esa acción.
Para hacer un seguimiento de la mirada, la cámara captura constantemente el movimiento de tus ojos y usa esos datos para calcular dónde estás mirando. Después, ese movimiento puede traducirse, por ejemplo, en el movimiento de un personaje en un juego.
“No es que tengamos tecnologías distintas que hemos combinado. Esa es una diferencia. Es una única tecnología capaz de manejar cara, gesto y mirada”, sostiene Banjara.
La empresa explica que procesa todos los datos en el propio aparato gracias al software, en vez de enviarlos a servidores remotos, y que ninguna de las imágenes recogidas por las cámaras se guarda. La tecnología funciona incluso cuando la luz es cambiante, según la empresa.
En el salón minimalista de Banjara en Mountain View, California (EE.UU.), el equipo de PredictGaze me hizo numerosas demostraciones con una televisión, un portátil, un iPad, un iPhone y un iPod Touch.
En una de ellas me senté delante de una gran televisión de pantalla plana conectada a un iPad que tenía el software de PredictGaze instalado. Mientras Rihanna se desgañitaba en un vídeo en la tele, Banjara se levantó y se fue; no pasó nada. Yo también me fui, y el vídeo se detuvo puesto que la cámara del iPad decidió que no quedaba nadie mirando.
En otra demostración, un miembro del equipo de PredictGaze que sujetaba un iPad se dedicó a ver una página web y a pasar las páginas de un libro electrónico con la mirada.
En una tercera demostración, dos personas nos sentamos delante del iPad y el software dilucidó certeramente cuántas personas había, cuál era el sexo de cada una, si estábamos sonriendo y pudo también determinar mi sexo incluso cuando me puse gafas y me tapé el pelo.
Ahora mismo, algunos de los usos de PredictGaze son muy sensibles y algo 'quisquillosos'. Si Banjara y yo nos quedábamos sentados en el sofá pero nos volvíamos el uno hacia el otro, Rihanna también dejaba de cantar. Y cuando jugué al juego para iPhone que usa el software de PredictGaze, se paró frecuentemente, diciendo que tenía problemas para seguir los movimientos de mi cabeza. Pero afinándolo un poco –y con la inclusión de cámaras de gran angular en televisiones y tabletas que recojan más acciones- puedo imaginar la utilidad de PredictGaze.
La empresa quiere vender su kit de desarrollo de software a desarrolladores para que lo usen dentro de sus aplicaciones. También planea vender su tecnología a las empresas de electrónica, que cada vez venden más aparatos con cámara incluida, para que PredictGaze se incorpore directamente en estos. Con el tiempo, PredictGaze también podría crear su propio hardware.
Pero Roel Vertegaal, profesor asociado de interacción computadora-humano en la Universidad Queen’s de Kingston, Ontario (Canadá) y director del Laboratorio de Medios Humanos de la facultad, no está tan impresionado con la tecnología de PredictGaze, y afirma que no es nueva. Él y otros han estado trabajando en este tipo de interfaces desde hace años, explica. Aún así, cree que es bueno que este tipo de tecnología empiece a ser viable comercialmente. “Creo que existe una necesidad real de este tipo de cosas”, afirma. En su salón, Banjara piensa lo mismo.