Tu voz puede servir de identificador biométrico, igual que tu huella digital. ¿Es necesario que Apple la almacene en sus servidores?
Incluso en una era en la que la privacidad está desapareciendo, quienes usan la ayudante digital de Apple, Siri, comparten una preocupación específica. Las grabaciones de sus voces, haciendo preguntas que pueden ser muy personales, viajan por Internet a un servidor remoto de Apple para ser procesadas. Y se quedan guardadas allí; Apple no dice por cuánto tiempo.
Esa grabación de voz, al contrario que la mayoría de los datos que producen los teléfonos inteligentes y otros ordenadores, es un identificador biométrico. Una huella de voz –si se hace pública bien por accidente, bien por ataque informático o bien por una orden judicial- se puede asociar a una persona concreta. Y con el auge actual de las aplicaciones de reconocimiento de voz, Apple no es la única empresa que está recogiendo ese tipo de información.
Hay formas de conseguir que este identificador sea más privado. Los investigadores afirman que Apple y otros que desarrollan aplicaciones de voz como Siri podrían hacer parte del procesado de datos en el propio teléfono. Luego, en vez de enviar la grabación completa, podrían transmitir información específica que es más difícil de atribuir con certeza a un individuo.
“Quizá cualquier cosa que pueda identificarte debería quedarse en el teléfono”, afirma Prem Matarajan, vicepresidente ejecutivo en Raytheon BBN Technologies en Cambridge, Massachusetts (EE.UU.), un importante centro de investigación del reconocimiento de voz. Natarajan sostiene que quizá sería mejor que Apple “transmitiera características del habla y no el propio habla”.
Este método daría más trabajo al procesador del teléfono y a la batería, pero no mermaría la calidad del reconocimiento de voz. “Creo que puedo afirmar que no tener acceso a toda la señal de voz no supone un contratiempo significativo”, afirma Natarajan. Limitar la cantidad de datos biométricos que se comparten sería seguir el ejemplo de aparatos como Kinect de Microsoft, que ha sido diseñado, por motivos de seguridad, para guardar este tipo de datos en el propio aparato.
Trudy Muller, portavoz de Apple, confirma que las grabaciones de voz se almacenan cuando los usuarios hacen una pregunta en voz alta, como “¿Qué tiempo hace hoy?”. Según Muller “Estos datos solo se usan para el funcionamiento de Siri y para mejorar su capacidad de comprensión y reconocimiento”. Añadió que la empresa se toma la privacidad “muy en serio”, señalando que las preguntas y respuestas que Siri envía por Internet están encriptadas y que las grabaciones de tu voz no van ligadas a otro tipo de información que Apple haya generado sobre ti. (Pero Siri sí que carga tu lista de contactos, situación geográfica y lista de canciones almacenadas para poder responder a tus solicitudes).
Aunque las huellas de voz no son tan distintivas como las huellas digitales, pueden identificar a quien habla en numerosas circunstancias. El Departamento de Interior de Estados Unidos usa la huella de voz para identificar a los viajeros frecuentes apuntados a un sistema que permite cruces de fronteras más rápidos.
Como ejemplo de que las huellas de voz son importantes, podemos tomar el juicio por asesinato a Casey Anthony, la madre de Florida que fue absuelta el año pasado de la muerte de su hija de dos años, Caylee. En un punto del juicio, los fiscales destacaron que en el ordenador de la acusada se habían hecho búsquedas de términos como “cloroformo” y otros que podían incriminarla. La madre de Anthony testificó diciendo que la búsqueda la había hecho ella, que se equivocó al querer escribir “clorofila”. Si las búsquedas se hubieran hecho mediante voz a través de Siri, los fiscales –y el jurado- hubieran podido decidir quién había dicho “cloroformo”. (Apple no ha querido decir si ha recibido alguna orden judicial para obtener una huella de voz).
Mientras, si dices algo inapropiado o preguntas a Siri sobre una cuestión médica delicada y piratean los sistemas de Apple (o si un empleado malintencionado liberase los datos), la comunicación comprometedora no solo estaría disponible, sino que estaría con tu propia voz. Natarajan afirma que la biometría puede hacer que surjan nuevas preguntas relacionadas con la privacidad. Por ejemplo, alguien buscando la localización exacta de una manifestación en contra de un régimen represivo podría tener problemas si esos datos llegan a manos de ese gobierno. “Si tienes a un grupo de personas preguntando por manifestaciones, desgraciadamente tienes la biométrica de la voz para esas personas”, afirma.
Algunos observadores, entre ellos grandes empresas tecnológicas, también se hacen preguntas más amplias sobre Siri. El mes pasado Technology Review informó de que IBM había pedido a sus empleados que no usasen esta característica de sus teléfonos, una medida tomada, según la empresa, por la necesidad de proteger listas de contactos y otra información sensible de la empresa. Los expertos creen que a otras organizaciones debería preocuparles esto mismo. “Si yo dirigiera una agencia de inteligencia o una gran empresa, no permitiría el uso de este servicio entre mis empleados”, afirma Radu Sion, experto en informática de la Universidad Stony Brook (EE.UU.) e importante investigador sobre la seguridad de la computación en nube.
El sistema de reconocimiento de voz de Siri funciona de la siguiente manera: haces una pregunta o una petición y la grabación de la voz se envía a un servidor de Apple. Allí la grabación se descompone en un proceso denominado extracción, que transforma numéricamente la onda de sonido y extrae las características relevantes. Éstas se pasan por un motor de reconocimiento de voz para interpretar lo que estás diciendo y convertirlo en texto. A continuación Siri usa recursos que pueden incluir Internet, tu lista de contactos (“Llama a papá”), o tu situación geográfica (“¿Dónde está el tailandés más cercano?”) para responder a tu solicitud.
No existen razones por las que el trabajo inicial de extracción de características relevantes no pueda hacerse directamente en el propio teléfono, para que algunos elementos puedan quedarse en él. Los patrones de tono, por ejemplo, son importantes para reconocer a quien habla, pero no para reconocer lo que está diciendo. Desde una perspectiva tecnológica, “podrías enviar las partes sobre las que trabajará el sistema de reconocimiento, pero no la onda de sonido completa”, explica Natarajan. Y aunque esto no sea la solución perfecta, afirma que “mejoraría notablemente la privacidad y, lo que quizá sea más importante, la percepción de privacidad, porque no puedes reconstruir la señal de voz partiendo solo de sus características”.
James Glass, investigador sénior del Instituto de Tecnología de Massachusetts (EE.UU.) y director de su Grupo de Sistemas de Lenguajes Hablados, afirma que el procesado in situ, también conocido como reconocimiento de voz distribuido, se ha estudiado en profundidad. Pero avisa de que no ofrece una protección completa. “Los métodos biométricos que se dedican a la identificación de voz suelen usar representaciones parecidas a los que solo hacen reconocimiento del habla. Así que hacer el procesado in situ no serviría para que los datos fueran completamente anónimos, si ése es tu objetivo”.
Añade que la forma más fácil de hacer que una huella de voz resulte anónima es separar las grabaciones de otros datos, como por ejemplo el número de teléfono móvil. “Significaría que a los sistemas les costaría más personalizar tu voz y tus preguntas, pero habrá personas que prefieran esa opción si les proporciona una mayor privacidad”, afirma. “Esta es la opción que yo defendería, es parecida a cómo algunas aplicaciones piden permiso ahora para usar tu localización”.
Cuando vayan apareciendo más aplicaciones de voz en más marcos, crecerá la importancia de proteger los identificadores biométricos, según Andrew Sudbury, cofundador de Abine, una empresa de software de privacidad con sede en Boston (EE.UU.) que ayuda a los consumidores a bloquear el rastreo de sus actividades en línea. “Este momento es crucial, puesto que estamos ante un rápido crecimiento del uso del reconocimiento de voz en muchos sitios”, afirma. “Y cada vez será más fácil identificar a la gente por su voz de forma fiable”.
Efectivamente, uno de los motivos por los que Apple quizá quiera almacenar huellas de voz completas es para conservar la opción de proporcionar ese tipo de servicios. En teoría, un sistema de reconocimiento de voz podría saber que eres tú el que habla, no tu cónyuge o hijo y darte respuestas a medida. “Sería guay que llamases desde otro teléfono y te identificara”, afirma Natarajan.
Esto se conseguiría gracias a una gran base de datos con las voces de la gente. Natarajan avisa de que todas estas posibilidades solo son especulaciones aún, pero “toda innovación implica hacer cosas que nadie ha pensado aún”, afirma. “Yo también querría tener acceso a todos esos datos”.