Las regiones con más desempleo son más activas en la red social por la mañana y sus microblogs contienen más faltas de ortografía
El comportamiento humano está estrechamente vinculado a la condición social y económica. Por ejemplo, la forma en que un individuo se desplaza por una ciudad está influenciada por su trabajo, sus ingresos y su estilo de vida.
Así que no es de extrañar que el estatus económico también pueda reflejarse en los patrones de comportamiento dentro de los medios sociales. De hecho, eso es exactamente lo que aseguran Alejandro Llorente y varios colegas desde la Universidad Autónoma de Madrid (España). El equipo acaba de mostrar que el patrón general de tuits a través de ciudades y comunidades autónomas en España revela detalles fascinantes sobre las tasas de desempleo en dichas áreas.
El equipo comenzó con una base de datos de 19,6 millones de tuits geolocalizados en España publicados entre noviembre de 2012 y junio de 2013. Llorente y compañía quisieron correlacionar estos tuits con regiones de actividad económica, pero éstas no son fáciles de determinar. La razón es que no se corresponden bien con las delimitaciones administrativas en España, que reflejan delimitaciones históricas y políticas, más que económicas.
Así que el equipo analizó la velocidad a la que se intercambiaban mensajes entre regiones utilizando un algoritmo estándar de detección en comunidades. Esto reveló 340 áreas independientes de actividad económica, que coinciden en gran parte con otras medidas de distribución geográfica y económica. "Este resultado muestra que la movilidad detectada a partir de los tuits geolocalizados y las comunidades obtenidas son una buena descripción de las áreas económicas", señalan.
Por último, analizaron los datos de desempleo en cada una de estas regiones y analizaron su base de datos para ver las correlaciones con la actividad de Twitter.
Los resultados muestran claras diferencias entre las regiones con alto y bajo desempleo. Por ejemplo, la tasa de tuiteo entre las 9 de la mañana y el mediodía de lunes a viernes es significativamente mayor en las zonas de alto desempleo. Estos tuits tienen más probabilidades de contener palabras como "empleo" y "desempleo". Y los mensajes también tienen más probabilidades de contener errores de ortografía, lo que quizás refleje un menor nivel de educación entre los desempleados.
"Demostramos que a partir del rastro digital que deja la red de microblogging Twitter pueden recuperarse características de comportamiento relacionadas con el desempleo", asegura Llorente.
Eso es importante ya que este tipo de análisis resulta rápido y fácil en comparación con métodos tradicionales de recolección de datos, como por ejemplo las encuestas. De hecho, las encuestas son tan caras que algunos países han considerado dejar de hacerlas en tiempos de dificultades económicas para ahorrar dinero.
La posibilidad de que los datos de Twitter puedan proporcionar una visión rápida y barata del desempleo es una alternativa interesante. Es más, permite a los gobiernos y a los políticos hacer un seguimiento de los cambios en la población, más o menos en tiempo real.
"La inmediatez de las redes sociales también puede permitir a los gobiernos medir y comprender mejor el efecto de las políticas, los cambios sociales y los desastres naturales o provocados por el hombre en el estatus económico de las ciudades casi en tiempo real", afirman Llorente y su equipo, y agregan que sus técnicas deberían poder aplicarse en cualquier lugar del mundo.
Trabajos como este muestran cómo está cambiando la naturaleza de la recopilación de datos económicos. Será interesante ver lo rápido que se adaptan los gobiernos y otras organizaciones.
Ref: arxiv.org/abs/1411.3140 : Social Media Fingerprints Of Unemployment