Su creador, Rohit Prasad, imagina un futuro en el que el asistente de voz esté en todas partes y controle cada detalle de su vida para poder anticiparse a sus necesidades. Sin embargo, los expertos advierten de serios problemas de privacidad
Empecé a usar a Alexa antes de que se pusiera de moda. Compré el primer modelo Echo un par de meses después de su lanzamiento al ver un anuncio en Amazon.com mientras compraba unos altavoces nuevos. Cuando lo recibí, mi por entonces compañera de piso, que era ingeniera de software en Google, comparó con entusiasmo las capacidades de Alexa con las de su Asistente de Google. Aunque el dispositivo de Amazon no estuvo a la altura, para mí, cumplía con todo lo que yo quería: ponía mis canciones favoritas, hacía sonar mi alarma por las mañanas y, a veces, me contaba las noticias y la meteorología.
Cinco años más tarde, aquellos simples deseos iniciales han sido eclipsados por las ambiciones de Amazon. Alexa ya está en todas partes, es capaz de controlar más de 85.000 productos inteligentes para el hogar, desde televisores hasta timbres y auriculares. Dispone de más de 100.000 "habilidades" y la cifra va aumentando. Procesa miles de millones de interacciones por semana, generando grandes cantidades de datos sobre nuestros horarios, preferencias y lugares. Alexa se ha convertido en un imperio, y Amazon no ha hecho más que empezar con ella.
En declaraciones a MIT Technology Review, el científico jefe de Alexa, Rohit Prasad, ha revelado más detalles sobre hacia dónde se dirige el sistema. El punto crucial del plan es que el asistente de voz pase de las interacciones pasivas a las proactivas. En lugar de esperar una orden y responderla, Alexa se anticipará a las necesidades del usuario. La idea es convertirla en una compañera omnipresente que actúe de forma activa y dirija nuestra vida. Eso requerirá que Alexa nos conozca mejor que nadie.
De hecho, Prasad, quien más tarde describió su visión para el futuro de Alexa en el WebSummit en Lisboa (Portugal), ya le había ofrecido al público una vista previa de cómo podría ser este cambio. En pasado junio, en la conferencia re: Mars, demostró una función llamada Alexa Conversations y explicó cómo se podría usar para ayudar a crear un plan para salidas nocturnas. En vez de iniciar manualmente una nueva solicitud para cada parte de la noche, solo tendríamos que empezar la conversación, por ejemplo, pidiendo unas entradas para el cine. Luego, Alexa haría un seguimiento para preguntarnos si también queríamos reservar una mesa en un restaurante o llamar a un Uber.
Foto: El vicepresidente y científico jefe de Alexa, Rohit Prasad. Créditos: Jeremy Portje.
Para impulsar esta transición, Amazon necesita avances tanto en su hardware como en su software. En pasado septiembre, el gigante tecnológico lanzó un conjunto de productos de Alexa "sin descanso", incluidos los Echo Buds (auriculares inalámbricos) y Echo Loop (un anillo inteligente). Todos estos nuevos productos permiten que Alexa escuche y registre muchísimos más datos sobre nuestra vida, para ofrecer mejor asistencia informada sobre dónde vamos, qué hacemos y qué preferencias tenemos.
Desde la perspectiva del software, estas habilidades requerirán que Alexa use nuevos métodos para procesar y comprender todas las fuentes dispares de información. En los últimos cinco años, el equipo de Prasad se ha centrado en desarrollar el dominio de los fundamentos de la inteligencia artificial (IA) del asistente, como el reconocimiento básico de voz y vídeo, y expandir su comprensión del lenguaje natural. Además de esta base, han empezado a desarrollar las capacidades de predicción inteligente y de toma de decisiones y, cada vez más, su habilidad de razonamiento de alto nivel. El objetivo, en otras palabras, es que las aptitudes de inteligencia artificial de Alexa se vuelvan mucho más sofisticadas en unos pocos años.
Una Alexa más inteligente
Así es como las actualizaciones de software de Alexa se unirán para realizar el escenario del plan de salir por la noche. Con el fin de dar seguimiento a una solicitud de entradas para el cine con indicaciones para la cena y un Uber, una red neuronal aprende, mediante miles de millones de interacciones de usuarios a la semana, a reconocer qué habilidades se suelen usar conjuntamente. Así es como entra en juego la predicción inteligente. Cuando suficientes usuarios reserven una mesa para cenar después de ir a ver una película, Alexa combinará esas habilidades y las recomendará en conjunto.
Pero se requiere razonamiento para saber a qué hora reservar el Uber. Teniendo en cuenta nuestra ubicación y la del cine, la hora de inicio de la película y el tráfico esperado, Alexa calcula a qué hora debe recogernos el coche para llegar a tiempo.
Prasad imagina muchos otros escenarios que podrían requerir un razonamiento más complejo. Podríamos imaginar una habilidad, por ejemplo, que nos permita preguntar a nuestros Echo Buds dónde están ubicados los tomates en el supermercado. Los Buds necesitarán registrar que estamos en el supermercado, acceder a un mapa de su plano de planta y luego decirnos que los tomates están en el pasillo número siete.
Foto: Todos los productos habilitados para Alexa del último lanzamiento de productos de Amazon en pasado septiembre. Cortesía de Amazon
En otro escenario, podemos pedirle a Alexa a través de nuestro Echo doméstico que nos envíe una notificación si nuestro vuelo se retrasa. Cuando llegue el momento de hacerlo, tal vez ya estemos de camino. Alexa tendrá que darse cuenta (identificando nuestra voz en la solicitud inicial) de que es usted quien necesita esa notificación, no su compañero de piso o un miembro de la familia, y, según el último dispositivo de Echo con el que interactuó, que usted ya se encuentra en su coche. Por lo tanto, la notificación debe ir a su coche y no a su hogar.
Este nivel de predicción y razonamiento también deberá tener en cuenta los datos de vídeo, ya que cada vez más productos compatibles con Alexa disponen de cámaras. Digamos que no estamos en casa, explica Prasad, y una niña llama a nuestra puerta para vender galletas. Alexa en nuestro Amazon Ring, el timbre equipado con cámara, debe registrar (a través de la entrada de vídeo y audio) quién está en su puerta y por qué, saber que no estamos en casa, enviarnos una nota a un dispositivo Alexa que tengamos cercano preguntando cuántas galletas queremos y pedirlas en nuestro nombre.
Para hacer esto posible, el equipo de Prasad está probando una nueva arquitectura de software para procesar los comandos de los usuarios. Supone filtrar la información de audio y visual a través de muchas más capas. Primero, Alexa debe darse cuenta a qué habilidad intenta acceder el usuario entre los aproximadamente 100.000 disponibles. A continuación, deberá comprender el comando en el contexto de quién es el usuario, qué dispositivo está usando esa persona y dónde. Finalmente, deberá adecuar la respuesta en función de las preferencias expresadas previamente por el usuario. Prasad detalla: "Esto es lo que creo que haremos en los próximos años: razonar y hacerlo todo más personal, con más contexto. Es como unirlo todo para tomar estas extensas decisiones".
El elefante en la habitación
Desde un punto de vista técnico, todo esto sería un logro increíble. De lo que habla Prasad, de la combinación de varias fuentes de datos y métodos de aprendizaje automático para llevar a cabo un razonamiento de alto nivel, ha sido un objetivo de los investigadores de inteligencia artificial durante décadas.
Sin embargo, desde la perspectiva del consumidor, estos cambios también tienen implicaciones de privacidad bastante críticas. La visión de Prasad asume que Alexa nos seguirá a todas partes, sabrá lo que hacemos en cada momento dado y será la principal interfaz para coordinar nuestra vida. Básicamente, esto requiere acumular enormes cantidades de detalles íntimos sobre nuestra vida. A algunos les preocupa que Amazon vaya más allá y use nuestros datos para publicitar y comercializar. "En última instancia, se trata de monetizar la vida cotidiana de la gente y de grupos de personas", opina el director ejecutivo del Center for Digital Democracy, una organización de defensa de la privacidad del consumidor con sede en Washington (EE. UU.), Jeffrey Chester.
Cuando se le presionó sobre este punto, Prasad destacó que su equipo ha facilitado a los usuarios la opción de eliminar datos de forma periódica y la exclusión voluntaria de la revisión humana. Sin embargo, ninguna de las dos opciones evita que los datos se usen para entrenar a la miríada de modelos de aprendizaje automático de Alexa. De hecho, Prasad aludió a una investigación en curso que cambiaría el proceso de aprendizaje de Alexa a otro en el que los modelos se actualizarían rápidamente en cualquier momento que haya nuevos datos de usuario, lo que garantiza que el valor de dichos datos se capturaría antes de su eliminación. En otras palabras, eliminar nuestros datos automáticamente solo significaría que no estarían disponibles para entrenar los futuros modelos cuando se hayan actualizado los algoritmos de entrenamiento; para los modelos actuales, nuestros datos se usarían casi de la misma manera. (En las solicitudes de respuesta a este asunto, un portavoz de Amazon afirmó que la compañía no vendía los datos recopilados por Alexa a anunciantes externos ni a la publicidad dirigida, a menos que el usuario accediera a un servicio a través de Alexa, como a Amazon.com por ejemplo.)
La directora de privacidad del Centro de Internet y Sociedad de la Facultad de Derecho de la Universidad de Stanford (EE. UU.), Jen King, cree que estas estrategias para controlar los datos son demasiado superficiales. La experta señala: "Si la idea es dar a las personas un control importante, entonces habrá que respetar su decisión de no usar sus datos o darles más opciones sobre cómo se utilizan. Ofrecer ayuda funcional a alguien de una manera específica se podría hacer de una forma que cuidaría mucho más la privacidad. No creo que eso tenga que ser inherentemente problemático".
En la práctica, cree que esto significa varias cosas. Primero, como mínimo, Amazon debería ofrecer a los usuarios la opción de permitir que sus datos se usen en lugar de hacerlo por defecto y ofrecerles la posibilidad de pedir que no se usen. En segundo lugar, Amazon debería ser más transparente sobre la finalidad o para qué se están usando sus datos. Actualmente, cuando eliminamos nuestros datos, no está claro qué pudo haber hecho la compañía con ellos. King añade: "Si tenemos una cámara de vigilancia con IA en nuestra casa podemos olvidar que está encendida y empezar a pasearnos desnudos. A los usuarios les sería útil saber si, cuando eliminemos esos archivos, el sistema ya los ha usado para entrenar cualquier algoritmo".
Finalmente, Amazon debería dar a los usuarios más flexibilidad sobre cuándo y dónde puede usar sus datos. Los usuarios podrían decidir, por ejemplo, entregar sus propios datos, pero denegar los de sus hijos. La experta continúa: "Las empresas de tecnología tienden a diseñar estos productos con la idea de todo o nada. Creo que esta estrategia es totalmente errónea. Puede que las personas consideren que algo les conviene pero eso no significa que quieran lo mismo en todas las facetas de su vida".
La visión final de Prasad es hacer que Alexa esté disponible y sea útil para todos. Incluso en los países en desarrollo, imagina versiones más baratas a las que las personas accederían a través de sus teléfonos inteligentes. El responsable concluye: "Creo que estamos haciendo una transición de la carga cognitiva en las tareas rutinarias. Quiero que Alexa sea un potenciador de la productividad... que sea realmente omnipresente para que funcione para todos".