Los enunciados de búsqueda no siempre son mejores que los métodos tradicionales de detección de tendencias.
Durante los últimos años, los ingenieros informáticos han promocionado los datos de búsqueda web como una forma de detectar nuevas tendencias--desde cambios en los precios de la vivienda y en los números de desempleo, hasta el próximo hit de taquilla o la ubicación de la próxima epidemia de gripe. Sin embargo, una investigación publicada este mismo día ofrece una visión más matizada de para qué tipo de predicciones son buenos estos datos, y por qué.
Un grupo de investigadores de Yahoo analizaron las consultas realizadas con el motor de búsqueda de la empresa y descubrieron que éstas no siempre son la mejor manera de detectar una tendencia. El equipo investigó el volumen de consultas de búsqueda relacionadas con unas películas, canciones, y videojuegos determinados desde hasta seis semanas antes de que cada uno de ellos saliera. El número total de búsquedas estuvo altamente relacionado con los ingresos obtenidos el primer fin de semana por las películas, las ventas de los videojuegos durante el primer mes, y la posición de las canciones en la lista Billboard.
A continuación, los investigadores compararon estos resultados con los obtenidos mediante métodos tradicionales. Para las películas, miraron el Hollywood Stock Exchange, un mercado de futuros para el comercio de los ingresos de taquilla de los próximos títulos, o las cifras que muestran el número de teatros en los que se ofrecerá la película. Para los juegos, los investigadores examinaron las calificaciones proporcionadas por la crítica. Para las canciones, miraron las críticas y también el rango actual y anterior del artista en la lista Billboard.
Las predicciones basadas en las búsquedas fueron sólo un poco mejores que estos métodos, y en ocasiones hasta peores. La investigación se ha publicado este mismo día en la revista Proceedings of the National Academy of Sciences.
Las predicciones basadas en las búsquedas fueron más precisas para los videojuegos. Esto puede ser debido a la falta de datos, señala Jake Hofman, uno de los investigadores de Yahoo involucrados en el estudio. "Los únicos indicadores tempranos de la calidad de un videojuego que no sea una secuela son las opiniones de los críticos", explica Hofmann. Los datos de búsqueda funcionan porque los datos tradicionales no están disponibles. Tanto para las películas como para las canciones, las predicciones basadas en búsquedas no ofrecieron ninguna mejora respecto a los métodos tradicionales.
En los últimos años, les datos de búsqueda han sido promovidos como una herramienta para detectar tendencias. En 2008, un equipo de investigadores de Google lanzó una herramienta, llamada Google Flu Trends, para predecir cuánta gente iba a padecer la gripe en diferentes lugares de todo el mundo, basándose en los búsquedas de "gripe", "influenza", y otros términos similares. Ellos encontraron que la herramienta podía predecir el número probable de casos en algunas partes de los Estados Unidos 10 días antes que los Centros para el Control y la Prevención de Enfermedades (CDC, por sus siglas en inglés).
Sin embargo, en ese momento, los CDC tenían un retraso de hasta dos semanas en la publicación de los informes del número de casos de gripe. La agencia está lanzando una nueva tecnología que va a reducir esta demora a una semana. Si la nueva tecnología funciona, es posible que las predicciones basadas en las búsquedas web no sean mejores que las cifras de los CDC.
Philip Polgreen, profesor asistente de medicina de la Universidad de Iowa, publicó un artículo en 2008 que mostraba una correlación entre los datos de búsqueda de Yahoo y los informes oficiales de la gripe. Polgreen explica que la intención del usuario es a menudo difícil de entender. Por ejemplo, una búsqueda sobre una enfermedad o un síntoma no significa necesariamente que el usuario está enfermo--podría ser que estuviera escribiendo un informe de investigación sobre el tema.
Un análisis publicado esta primavera por Justin Ortiz, un investigador clínico de la Universidad de Washington, sugiere que Google Flu Trends puede sobreestimar el número de personas enfermas de gripe cuando la cobertura de la gripe por la prensa es mayor, por ejemplo, durante la pandemia de la gripe H1N1 en el año 2009.
Sin embargo, a medida que haya más datos disponibles, algunos investigadores creen que será posible realizar mejores predicciones. "En los próximos cinco a 10 años, veo más y más empresas con este tipo de nanodatos--datos muy precisos con cientos de miles de millones de observaciones--en sus previsiones", afirma Erik Brynjolfsson, director del Centro para Negocios Digitales del MIT.
Brynjolfsson explica que las búsquedas web ofrecen predicciones más precisas en los casos en que la gente investiga antes de hacer una compra. Su investigación ha demostrado que se puede predecir un aumento en las ventas de casas a partir de los datos de búsquedas web. Cada aumento de un punto porcentual en el índice de búsquedas de viviendas prevé la venta de 121.400 casas más en el próximo trimestre.
Los investigadores de Yahoo señalan que los datos de búsqueda podrían ser particularmente útiles cuando una pequeña mejora en la exactitud de la predicción podría tener un gran impacto--por ejemplo, en el mundo financiero.
Las búsquedas web también podrían ser útiles para detectar cambios repentinos. Por ejemplo, los modelos estadísticos tienen dificultades para determinar cuándo empezará a decaer la popularidad de una canción que está subiendo en la lista Billboard. Sin embargo, las búsquedas web pueden detectar este cambio rápidamente. Estos puntos de inflexión pueden ser importantes también en la salud, la economía, y la investigación de mercados.