La próxima frontera para los grandes volúmenes de datos es el individuo.
El exdirector científico de Amazon.com, Andreas Weigend, que hoy dirige el Laboratorio de Datos Sociales de la Universidad de Stanford (Estados Unidos), me contó una anécdota sobre una vez en que se despertó de madrugada para tomar un vuelo desde Shanghai. Fue entonces cuando una aplicación que había comenzado a utilizar, Google Now, le dijo que su vuelo se había retrasado.
El software rastrea el correo de Gmail y el calendario de una persona, y también bases de datos como mapas y horarios de vuelo. Descubrió el fallo en sus planes de viaje y envió la advertencia de que no debía apresurarse. Cuando Weigend finalmente subió al avión, todos los demás pasajeros habían estado esperando durante horas a que llegara una pieza de repuesto.
Para Weigend, consultor y profesor de comportamiento del consumidor, estos episodios demuestran "el poder de una sociedad en la que tenemos 10 veces más datos". Si el último siglo se ha caracterizado por la capacidad de observar las interacciones de la materia física, con tecnologías como, por ejemplo, los rayos X o el radar, este siglose definirá por la capacidad de observar a la gente a través de los datos que comparten, según señala Weigend.
Los así llamados sistemas de anticipación, como Google Now, representan un ejemplo de lo que podríamos obtener como resultado. Ya estamos viendo las transformaciones que los grandes volúmenes de datos están causando en la publicidad y otras situaciones en las que millones de datos de actividad de personas pueden ser medidos a la vez. Hoy día, la ciencia de los datos está estudiando cómo poder ayudar a las personas. La recepción de actualizaciones oportunas de un vuelo de United Airways podría ser una de las aplicaciones más básicas. Pero podríamos ir más allá y contar con modelos estadísticos que nos digan qué trabajo aceptar, o que nos avisen de que podemos tener gripe incluso antes de caer enfermos.
A la cabeza de esta tendencia se encuentra una enorme cantidad de datos personales a disposición de los ordenadores. La cantidad de datos digitales que se crean a nivel mundial se duplica cada dos años, y la mayoría la generan los consumidores, en forma de descargas de películas, llamadas VoIP, correos electrónicos, lecturas de localización de teléfonos móviles, y así sucesivamente, según informa la consultora IDC. Sin embargo, solo aproximadamente el 0,5 por ciento de los datos llegan a analizarse.
"Hay tantos datos que te puedes permitir el lujo de adaptarlos al individuo", señala Patrick Wolfe, estadístico dedicado al estudio de redes sociales en el University College de Londres. "Estadísticamente, agrupar a la gente es lo que nos da la fuerza, pero la guinda del pastel es cuando individualizas los resultados".
Para las refinerías de datos de Silicon Valley, como por ejemplo Google, Facebook y LinkedIn, la fusión de grandes volúmenes de datos y datos personales ha sido uno de sus objetivos desde hace algún tiempo. Crea herramientas que los anunciantes pueden usar, y también crea productos que "enganchan" de forma bastante particular. Después de todo, ¿qué es más interesante que tú mismo? Facebook te sugiere amigos. Cuanto más datos le des a Google Now, mejor es el servicio.
La exposición de una mayor cantidad de datos personales parece inevitable. Con el gran aumento en las ventas de teléfonos inteligentes repletos de acelerómetros, cámaras y GPS, "la gente se ha instrumentado para recoger y transmitir datos de carácter personal", afirma Weigend. Y eso podría ser solo el comienzo. Una comunidad marginal de tecnófilos, conocida como el movimiento autocuantificado, ha estado equipando sus cuerpos con sensores, podómetros, e incluso monitores de glucosa implantados. Uno de sus miembros, Stephen Wolfram, creador del motor de búsqueda Wolfram Alpha, formará parte de la sección Business Reports de MIT Technology Review de este mes. Durante años, Wolfram ha participado en un proyecto masivo de autoseguimiento, catalogando correos electrónicos, pulsaciones de teclado e incluso sus movimientos físicos. Wolfram está interesado en aplicaciones predictivas, pero también en los conocimientos que los grandes volúmenes de datos pueden tener en el comportamiento personal, algo que él denomina como "analítica personal". La idea de Wolfram es que al igual que su motor de búsqueda intenta organizar todos los hechos acerca del mundo, "lo que tienes que hacer con la analítica personal es tratar de acumular conocimientos sobre la vida de una persona".
El problema, indica Wolfram, es que algunos de los datos más útiles no son capturados, al menos no de una manera que sea de fácil acceso. Parte del problema es técnico, y tiene que ver con una falta de integración. Sin embargo, muchos datos se almacenan por empresas privadas como Facebook, Apple y Fitbit, fabricante de un popular podómetro. Ahora, a medida que el valor de los datos personales se hace más evidente, están empezando a producirse conflictos. Los legisladores de California presentaron este año un proyecto de ley llamado "Right to Know" ("Derecho a Saber") que exigiría a las empresas a revelar a las personas la "información personal" que almacenan, en otras palabras, una copia digital de todo rastro de localización y observación de su dirección IP.
El proyecto forma parte de un movimiento social que exige privacidad y responsabilidad, pero también un acuerdo económico entre las personas que suministran los datos y las que los aplican. La gente quiere saber más acerca de los beneficios directos de los grandes volúmenes de datos, y la sección Business Reports de MIT Technology Review de este mes hace un seguimiento de la tecnología, las aplicaciones y las ideas de negocio con las que la industria está respondiendo.