.

Otros

Los datos de movilidad basados en llamadas telefónicas no son fiables

1

La información geográfica empleada en análisis antropológicos está demasiado sujeta a sesgos ocultos

  • por The Physics Arxiv Blog | traducido por Lía Moya
  • 08 Septiembre, 2014

Los teléfonos móviles se han convertido en una de las herramientas más importantes para los antropólogos que quieren descubrir los secretos del comportamiento humano moderno. Cada llamada móvil o texto crea un registro que recoge la hora del día, la duración y el tipo de comunicación del mensaje, así como la torre de antena que gestionó la llamada.

Estos datos de millones de personas en todo el mundo a lo largo de meses y años, nos proporciona el relato más detallado del comportamiento humano reunido jamás. En concreto, los investigadores usan estos datos para estudiar cómo poblaciones enteras se mueven en una escala que va desde unos pocos kilómetros a miles de ellos. Demuestran cuándo trabaja la gente, cómo se trasladan y migran, cómo se propagan las enfermedades infecciosas e incluso cómo responden las poblaciones al conflicto armado y los desastres naturales.

Pero hay un problema. Este enorme interés ha creado una especie de fiebre del oro por los datos, y cada investigador analiza los datos de distintas formas, algo que dificulta la comparación de estudios en distintos países. Lo que es peor, estos análisis no han tenido en cuenta algunas limitaciones importantes de los datos móviles que pueden sesgar gravemente los resultados.

Ahora, Nathalie Williams de la Universidad de Washington en Seattle (EEUU) y algunos compañeros hacen un perfil de los problemas asociados con los datos móviles y afirman que muchos de ellos se podrían resolver usando una nueva definición de movilidad. Demuestran las ventajas de su nuevo enfoque usando una serie de datos de llamadas de teléfonos móviles de Ruanda hechas entre el 1 de junio de 2005 y el 31 de enero de 2009.

Una red de teléfono móvil está compuesto por una serie de torres de antena que cubren un área desde varios cientos de metros hasta diez kilómetros. Cuando un teléfono móvil hace una llamada, conecta con la torre de antena más cercana donde se guardan los datos sobre la llamada. Si alguien se mueve a la zona de influencia de otra torre, cualquier llamada desde allí se guardará en la nueva localización. Estudiar las distintas localizaciones desde donde llaman las personas ofrece una idea de su movilidad.

Un importante factor en este debate es cómo definir la movilidad. Los antropólogos creen que esta tiene dos dimensiones. La primera es la frecuencia de movimientos de las personas, es decir, la cantidad de veces que una persona va a algún sitio. La segunda dimensión es la distancia o cómo de lejos se traslada dicha persona. Cualquier medida significativa de la movilidad debe tener en cuenta estas dos dimensiones.

Los antropólogos que usan los datos de teléfonos móviles emplean toda una serie distinta de medidas de la movilidad. Por ejemplo, la cantidad de torres usadas por un individuo o la distancia en línea recta entre ellas. Lo más común es el radio de rotación, que se establece encontrando el centro geográfico de todas las torres usadas y cogiendo la media del cuadrado de todas las distancias de este centro a las torres.

Los problemas resultantes de este enfoque a veces son evidentes y veces sutiles. Un problema evidente es la distribución desigual de torres en el país. Habitualmente, la mayoría de las redes tienen una alta densidad de torres en las ciudades y una densidad mucho menor en las zonas rurales.

Con lo que surge inmediatamente un problema. Williams y su equipo consideran el ejemplo de Ruanda y su capital, Kigali, que tiene 50 torres en un radio de 5 kilómetros. Un individuo que viva en Kigali podría moverse regularmente sólo dentro de este disco de cinco kilómetros y usar numerosas torres de antena en el proceso. La movilidad de esta persona se consideraría alta, dada la cantidad de torres de antena que usa.

Pero tomemos otro individuo que vive en una zona rural con una única torre que cubre un radio de cinco kilómetros. Esa persona puede tener la misma movilidad que el habitante de la ciudad pero sólo usa una torre. Usando la misma medida, su movilidad sería baja.

Y el problema empeora. "Esta cuestión se agrava por el hecho de que las torres de antena están colocadas más frecuentemente en zonas urbanas con alta densidad de población, en áreas políticamente importantes como las capitales, o zonas ricas en las que hay una mayor penetración de los teléfonos móviles", afirman William y compañía. Lo que introduce un sesgo adicional.

Otro problema es que la cantidad de torres cambia a lo largo del tiempo. Según se expande la red móvil, el operador añade nuevas torres, a veces en regiones que no tienen cobertura, pero también para dividir zonas que ya cuentan con cobertura. "Como las medidas existentes usan las torres como puntos de referencia espacial, esto produce una situación de sesgo espacial y temporal en estas medidas", explican.

Otras dificultades derivan de la forma en que la gente usa los teléfonos. Si una persona hace más llamadas, estará registrada en más torres. "Alguien que use su teléfono con frecuencia probablemente tenga un índice de movilidad distinto, comparado con una persona con la misma trayectoria espaciotemporal pero menor frecuencia de llamadas", afirman William y compañía.

El equipo explica que muchos de estos problemas se pueden resolver o al menos mitigar usando una medida de movilidad completamente distinta. La idea es prescindir de la localización de las torres como puntos principales de referencia y usar en cambio un sistema de red de celdas colocadas encima del mapa del país.

En el caso de Ruanda el equipo optó por trabajar con 2040 celdas, cada una de 5 kilómetros de lado. Evidentemente algunas de estas celdas contará con una torre activa, algunas con varias y algunas con ninguna (en cuyo caso se tratan como cualquier otra forma de datos no disponibles).

Si alguien hace una llamada desde cualquiera de las torres que contiene una celda, se le registra en el centro de esa celda. Si hacen otra llamada desde otra torre dentro del mismo cuadrado, la localización no varía. Pero si su próxima llamada la gestiona una torre de la celda adyacente, se considera que se han movido.

Esto resuelve inmediatamente uno de los problemas más significativos. "El problema de la variación espacial en densidad de torres desaparece porque las celdas tienen un tamaño igual y no se superponen", afirman Williams y compañía.

Los investigadores hacen toda otra serie de sugerencias para mejorar cómo se gestionan los datos, por ejemplo dar por hecho que la gente viaja por los sistemas de carreteras establecidos entre una localización y otra y no en línea recta.

El resultado final es que el equipo tiene un dominio mucho más claro tanto del plano espacial de la movilidad, como de la frecuencia de los viajes. Es más, estas medidas son aplicables a una amplia gama de bases de datos móviles de países de todo el mundo. De repente, los análisis hechos en un lugar se pueden comparar inmediata y fácilmente con los análisis hechos en otro.

Es un objetivo loable y Williams y compañía van más allá aún. "Estas nuevas medidas abren vías de investigación completamente nuevas", afirman. Poder comparar datos de distintos sitios debería permitir a los investigadores indagar en cuestiones como cómo influye la movilidad de la población en la migración individual, cómo se producen las infecciones de tuberculosis o la participación de las mujeres en el mercado de trabajo. "La movilidad a nivel de población también puede relacionarse con características a nivel de población, como los índices de prevalencia del VIH, los índices de natalidad, las normas sociales, el bienestar económico o la participación política", añaden.

Aún más ambiciosa es la idea de que los patrones de movilidad de la gente cambian durante las emergencias. Se podría localizar incluso un terremoto o el estallido de una bomba en tiempo real usando este tipo de datos.

Desde luego tienen sentido que este tipo de análisis pueda compararse. Williams y compañía lo creen y ahora la única duda que queda es saber si todos los demás implicados en el análisis de series de datos móviles están de acuerdo.

Ref: arxiv.org/abs/1408.5420: Medidas de la Movilidad Humana Usando Registros de Teléfonos Móviles Potenciados con Datos GIS

Otros

  1. Robotaxis

    Las 10 Tecnologías Emergentes 2025: los coches sin conductor solicitados mediante 'apps' se extienden a más ciudades

  2. Combustible más limpio para aviones

    Las 10 Tecnologías Emergentes 2025: los combustibles alternativos fabricados a partir de desechos industriales o dióxido de carbono podrían ayudar a reducir las emisiones climáticas de la aviación

  3. Robots que aprenden rápido

    Las 10 Tecnologías Emergentes 2025: los avances de la IA han hecho que sea más rápido que nunca entrenar a los robots para realizar nuevas tareas