Csi todo el millón de páginas más vistas del mundo incluye algún complemento de seguimiento del gigante. El informe también ha detectado una nueva técnica de rastreo basada en el audio
Si está leyendo este artículo en internet, alguna parte de Google probablemente ya lo sepa.
Esa es una de las lecciones que proporciona el mayor estudio hasta la fecha sobre la tecnología que rastrea los movimientos de los usuarios en la web. Cuando unos investigadores de la Universidad de Princeton (EEUU) registraron el uso del código de rastreo en el primer millón de páginas web más populares, encontraron código de Google en la mayoría de ellas.
Google Analytics, un producto que rastrea los usuarios que visitan las páginas web y que se integra con los sistemas de publicidad dirigida de la empresa, fue encontrado en casi el 70% de las páginas. DoubleClick, un sistema dedicado de servidores de anuncios de Google, fue detectado en casi el 50% de las páginas. Las cinco herramientas más encontradas son todas de propiedad de Google.
El nuevo estudio, que se realizó con una herramienta de fuente abierta, también desveló una sigilosa técnica nueva de rastreo empleada por algunas pequeñas empresas que se aprovecha de la manera en la que los navegadores procesan el audio.La técnica emplea esta información para componer una "huella digital" de cada ordenadores para permitir que sean rastreados por toda la web. Los investigadores dicen que la tecnología que emplearon para recopilar sus hallazgos podría ayudar a los reguladores y los desarrolladores de herramientas que bloquean el rastreo, como algunos bloqueadores de publicidad.
Los editores emplean el código de rastreo de Google, Facebook y otras muchas empresas para ayudarse a dirigir la publicidad a los usuarios. Cuando el código de una empresa está integrado en muchas páginas distintas, puede elaborar perfiles muy detallados de los usuarios mientras navegan. Así consiguen asignar un identificador único que perseguirá al usuario cada vez que se conecte.
Los investigadores y defensores de la privacidad afirman que esta práctica merece un minucioso examen.
Por ejemplo, un rastreador que sabe que usted ha leído recientemente artículos relacionados con el embarazo, la ropa infantíl y los abortos espontáneos podría identificar un anuncio en el que usted tenga muchas probabilidades de pinchar. Puesto que estos sistemas están automatizados, es probable que ningún humano haya visto los datos. Pero puede incomodar la idea de que esa información circule por una maraña de empresas y algoritmos fuera del control del propio usuario.
Las investigaciones han demostrado como el sistema de publicidad dirigida de Google puede emplear datos de forma discriminatoria. Por ejemplo, al dirigir anuncios para puestos ejecutivos de remuneración alta a hombres pero no a mujeres (ver Así te cataloga Google para decidir qué anuncios te muestra). Unos documentos filtrados por Edward Snowden indicaron que la Agencia de Seguridad Nacional estadounidense pinchó los sistemas de rastreo en línea de Google como manera de identificar los objetivos de sus labores de vigilancia.
El nuevo estudiofue realizado por el profesor adjunto de la Universidad de Princeton Arvind Narayanan y el alumno de postgrado Steven Englehardt. Analizaron ese millón de páginas web con un software desarrollado por la universidad, llamado OpenWPM, que ha sido publicado de forma gratuita. Visita automáticamente las páginas web con los navegadores Firefox, Chrome e Internet Explorer y registra cualquier tecnología de rastreo que detecte.
Narayanan dice que el estudio reveló motivos tanto para la preocupación como para la esperanza.
Por ejemplo, los investigadores descubrieron un nuevo truco mediante el cual algunas empresas envían sigilosamente una señal de audio al navegador del usuario. Las diferencias diminutas en el software y hardware hacen que su respuesta pueda emplearse para identificar el ordenador del usuario (inténtelo usted mismo aquí). "Cada vez se despliegan formas más creativas e intrusivas de identificar las huellas digitales", afirma Narayanan.
Pero añade que el dominio de Google y un puñado de gigantes más también podrían ayudar a los reguladores y ciudadanos a rastrear a los que nos rastrean. "Sólo un pequeño número de empresas ofrecen rastreadores realmente persistentes", explica Narayanan. "Esto sugiere que la supervisión externa y la presión pública podrían impulsar cambios positivos", añade.
La consolidación del dominio del rastreo web también debería facilitarles las cosas a los propietarios y responsables del desarrollo continuo de las herramientas que bloquean los rastreadores web. El estudio de Princeton probó una de estas herramientas, el complemento de navegador web Ghostery, y la calificaron de eficaz.