El Kinect de Microsoft es divertido, pero demuestra que las así llamadas interfaces de usuario naturales todavía tienen un largo camino por recorrer.
El Kinect de Microsoft, un sensor que funciona con la consola Xbox 360, ofrece para la mayoría de los usuarios una primera experiencia dentro del campo de las interfaces "naturales". El jugador controla el dispositivo de 150 dólares mediante la voz y los gestos; no necesita sostener ningún tipo de controlador ni llevar puestos guantes o ropa especiales. Durante una reciente charla en el MIT, el director de investigación y estrategia de Microsoft, Craig Mundie, describió el Kinect como un adelanto de lo que está por venir en cuanto a interfaces de usuario, y sugirió que lo que funciona en los juegos actualmente pronto se utilizará para hacer compras, diseñar, y muchas otras tareas informáticas comunes. En vez de pensar en controladores, teclados, y otras "prótesis específicas para aplicaciones", señaló Mundie, los usuarios podrían centrarse en la tarea que les ocupe en ese momento, haciendo que el software fuera mucho más atractivo y fácil de usar.
No obstante, y aunque usar Kinect con juegos es una experiencia divertida e interesante, el dispositivo también pone de manifiesto que las interfaces de usuario naturales tienen un largo camino por recorrer antes de poder ser adaptadas a las aplicaciones más cotidianas.
El Kinect utiliza tanto software como hardware para detectar la posición de una persona, los gestos y la voz. Para medir la posición, emite un rayo infrarrojo y mide el tiempo que la luz tarda en rebotar de los objetos que encuentra. Cuatro micrófonos son capaces de recibir comandos de voz, y el software filtra el ruido de fondo e incluso las conversaciones de otras personas en la habitación.
Dado que todos estos sistemas necesitan ser calibrados, la configuración de Kinect lleva algún tiempo. Después de conectar el sensor a una Xbox 360 y posicionarlo cerca de la línea central de la televisión, Kinect ajusta automáticamente su ángulo para poder obtener una imagen completa del usuario.
El Kinect también necesita mucho espacio. Tiene que ser capaz de ver el suelo como punto de referencia para los objetos de la habitación, y el usuario tiene que estar por lo menos a un metro ochenta del dispositivo (casi dos metros y medio si dos personas van a utilizarlo).
También evalúa los niveles de sonido de la habitación y ajusta el ruido procedente de los altavoces del televisor. Si algo cambia en la habitación—si se mueven los muebles, por ejemplo, o hay un cambio significativo en el entorno de sonido—el dispositivo se confunde y debe ser recalibrado.
Todo esto significa que como interfaz diaria, el Kinect tendría poco sentido práctico. Sus necesidades de espacio ponen a prueba la capacidad de un apartamento urbano típico. Si Microsoft quiere hacer que las interfaces naturales de usuario estén al alcance de todos, tendrá que tener en cuenta las necesidades de los pequeños dormitorios y los cubículos. El proceso de calibración es también demasiado meticuloso para que Kinect sea útil con cualquier aplicación crítica. Los usuarios nunca tolerarían la necesidad de recalibrar el aparato sólo para comprobar el correo electrónico.
Otro problema reside en el sistema que Kinect utiliza para asignar las posiciones de las manos del usuario, los hombros, las piernas, y así sucesivamente. Aunque lo hace de forma sorprendentemente precisa, no alcanza una resolución especialmente definida. Cuando interpreta los gestos, ve las manos, pero no ve los dedos. Esto significa que para controlar el dispositivo, el usuario tiene que ondear el brazo y hacer movimientos grandes.
Mientras esto suceda, una interfaz como la que proporciona Kinect no se podrá utilizar en un escritorio. Sería agotador a lo largo del tiempo, y también sería un proceso lento. Comparemos, por ejemplo, el tiempo que se tarda en desplazar hacia abajo tres páginas web con un ratón—algo que requiere pequeños movimientos de muñecas—con el tiempo que tardaríamos en subir y bajar el brazo en tres ocasiones
El dispositivo también es inaceptablemente lento en otras áreas. Para hacer clic en un botón en la pantalla, por ejemplo, el usuario tiene que mantener la mano inmóvil durante unos tres segundos para confirmar que quiere hacer clic. Imaginemos lo molesto que sería ir de compras por Internet si tuviéramos que esperar tres segundos cada vez que quisiéramos echar un vistazo más de cerca a algo.
Este tipo de problemas son probablemente demasiado grandes para que triunfen las interfaces gestuales, afirma Ben Bederson, profesor asociado de ciencias informáticas en la Universidad de Maryland, y dedicado al estudio la interacción humano-ordenador. "Hay que reconocer el trabajo que Microsoft ha hecho con Kinect", afirma. No obstante, añade que la impresionante tecnología del dispositivo es probablemente adecuada sólo para aplicaciones especializadas, tales como juegos. Incluso si la calidad fuera lo mejor posible, asegura, hay cuestiones fundamentales que no cree que se puedan resolver: los usuarios necesitan velocidad, precisión, simplicidad, y una interfaz cómoda que no interfiera con una tarea o haga que nos cansemos.
"Cuando Microsoft pueda abordar todas estas cuestiones con gestos", afirma, "seré todo oídos, aunque no soy optimista".