Las personas analfabetas se comunican con menos gente y envían y reciben menos SMS, unas características que un algoritmo de aprendizaje de máquinas ha aprendido a detectar
Uno de los Objetivos de Desarrollo del Milenio de Naciones Unidas consiste en erradicar la pobreza extrema para 2030. Es una tarea muy complicada, puesto que muchos factores contribuyen a la pobreza. Pero uno de los mas importantes son las 750 millones de personas analfabetas, de las cuales dos terceras partes son mujeres.
Existen bastantes organizaciones que podrían ayudar, siempre que sepan dónde colocar sus recursos, por lo que uno de los retos es identificar las zonas donde las tasas de alfabetismo son más bajas.
El método habitual consiste en realizar encuestas, pero esto lleva mucho tiempo y dinero y resulta difícil de repetir de forma regular. Y en cualquier caso, los datos procedentes del mundo en desarrollo a menudo ya están desfasados incluso antes de poder ser aprovechados de forma eficaz. Así que una manera más rápida y barata de mapear las tasas de alfabetismo sería muy bien recibida.
El investigador de Telenor Group Research en Fornebu (Noruega) Pål Sundsøy dice que ha averiguado cómo determinar la tasa de alfabetismo mediante registros móviles.
Su método consiste puramente en los cálculos. Empieza con una encuesta de hogar estándar de 76.000 usuarios móviles que residen en un país asiático en desarrollo sin identificar. La encuesta fue realizada por una agencia profesional para un operador móvil, y registra el número de móvil de cada encuestado y si sabe leer o no.
Encontes Sundsøy cruzó estos resultados con los registros de llamada del operador móvil, que proporcionaron datos como los números a los que el usuario había llamado o mensajeado, la duración de las llamadas, las compras inalámbricas de saldo, las ubicaciones de las torres móviles y más.
Con esta información, Sundsøy pudo averiguar dónde se encontraban físicamente los individuos cuando realizaron sus llamadas o mensajes, con quién se comunicaban, el número de mensajes de texto recibidos, a qué hora del día, y así sucesivamente. Esto le permitió construir una red social para cada usuario, al averiguar a quién llamaron, con cuánta frecuencia, y así sucesivamente.
Por último, empleó el 75% de los datos para buscar patrones asociados con usuarios analfabetos, con el uso de una variedad de técnicas de cálculo y aprendizaje de máquinas. Empleó el 25% restante a probar la viabilidad de emplear estos patrones para identificar personas analfabetas y zonas en las que exista una proporción más elevada de personas analfabetas.
Los resultados son interesantes. Sundsøy afirma que su algoritmo de aprendizaje de máquinas ha encontrado varios factores que parecen predecir el analfabetismo. El más potente es la ubicación donde la gente pasa la mayor parte de su tiempo. "Una explicación podría ser que el modelo capte regiones de bajo estatus económico, por ejemplo barrios marginales en los que la tasa de analfabetismo sea muy alta", explica Sundsøy.
Otro indicador del analfabetismo es la diferencia entre el número de mensajes recibidos y enviados. Eso podría deberse a que la gente no envía mensajes de texto a otras personas que saben que son analfabetas, señala Sundsøy.
Y la red social parece representar un indicador útil también. "Los analfabetos tienden a concentrar sus comunicaciones en unas pocas personas", apunta Sundsøy. Eso concuerda con otros trabajos que sugieren que el bienestar económico guarda una correlación con la diversidad de los contactos sociales.
En global, dice, su algoritmo de aprendizaje de máquinas puede detectar individuos analfabetos con una precisión sorprendente. "Al derivar características económicas, sociales y de movilidad para cada usuario móvil, predecimos el estatus individual de analfabetismo con una precisión del 70%", afirma, señalando que esto permite el mapeo de zonas con bajas tasas de alfabetismo.
Podría ser un truco útil para las agencias de ayuda que quieren destinar sus recursos a zonas con bajas tasas de alfabetismo. Sin embargo, querrán disponer de mejores pruebas de que funcione con otros conjuntos de datos y en otros lugares.
De demostrarse capaz, el potencial para mejorar vidas es inmenso. Los bajos niveles de alfabetismo dan paso a ciclos viciosos de pobreza. Las personas analfabetas son incapaces de rellenar solicitudes de trabajo, leer las etiquetas de los fármacos, escribir talones ni de equilibrar sus cuentas.
Esto aumenta sus probabilidades de sufrir de desempleo, de tener un mal estado de salud y de depender de programas de asistencia social o de caridad. Tampoco son capaces de ayudar a sus hijos a aprender a leer y escribir.
Poner fin a este ciclo representa un objetivo crucial.
Todo esto forma parte de una tendencia mayor de emplear registros móviles para estudiar a las poblaciones. Por ejemplo, los demógrafos han empleado esta técnica para mapear la distribución de riqueza en la Costa de Marfil en la costa este de África y dicen que el método algún día podría sustituir a los censos.
Si estos tipos de estudios pueden ser calibrados adecuadamente, serán una adición bienvenida al arsenal de los demógrafos. Una imagen en tiempo real del estado socioeconómico de una región les permitiría destinar los recursos cuando sean requeridos al emerger nuevos problemas. Eso será una potente herramienta.
Ref: arxiv.org/abs/1607.01337: Can Mobile Usage Predict Illiteracy in a Developing Country?