Las consultas sobre la enfermedad describen su expansión inicial aunque no son significativas en casos de reinfectados
A estas alturas el año pasado los Centros para el Control y Prevención de Enfermedades (CDC, por sus siglas en inglés) en Atlanta (EEUU) lanzaron un concurso para encontrar la mejor forma de predecir las características de la temporada de gripe 2013-2014 a base de datos recopilados de internet. Kyle Hickmann desde los Laboratorios Nacionales de Los Alamos en Nuevo México (EEUU) y su equipo acaban de revelar los resultados de su modelo, que ha utilizado datos en tiempo real de Wikipedia para pronosticar la información sobre el terreno que recopilan los CDC aproximadamente dos semanas más tarde.
Aseguran que su modelo tiene el potencial de transformar la previsión de la gripe desde magia negra a ciencia moderna, tan bien fundada como la predicción del tiempo.
La gripe se cobra entre 3.000 y 49.000 vidas cada año en EEUU, por lo que un pronóstico exacto podría tener un impacto significativo en la forma en que la sociedad se prepara para la epidemia. El método actual de seguimiento de los brotes de gripe está un poco anticuado. Se basa en un sistema voluntario en el que los funcionarios de salud pública reportan el porcentaje de pacientes que atienden cada semana con enfermedades similares a la gripe. Esto se define como el porcentaje de personas con una temperatura superior a 37,7 grados Celsius (100 Fahrenheit), tos y ninguna otra explicación que no sea la gripe.
Estas cifras dan una idea de la incidencia de la gripe en cualquier momento, aunque la precisión está claramente limitada. Por ejemplo, no toman en cuenta las personas con gripe que no buscan tratamiento, o las personas con síntomas similares a la gripe que buscan tratamiento pero no tienen la gripe.
Existe otro problema significativo. La red que informa sobre estos datos es relativamente lenta. Las cifras tardan alrededor de dos semanas en pasar a través del sistema, por lo que los datos siempre tienen dos semanas de antigüedad.
Por este motivo los CDC están interesados en buscar nuevas formas de controlar la propagación de la gripe en tiempo real. Google, en particular, ha utilizado el número de búsquedas de síntomas de gripe y parecidos a la gripe para pronosticar la gripe en varias partes del mundo. Este enfoque ha conseguido un éxito considerable, aunque también algunos fracasos desconcertantes. Sin embargo, uno de los problemas es que Google no permite el libre acceso a sus datos y esta falta de transparencia es una fuente potencial de problemas para este tipo de investigación.
Así que Hickmann y su equipo han recurrido a Wikipedia. Creen que la variación en el número de personas que acceden a artículos sobre la gripe es un indicador de la propagación de la enfermedad. Y puesto que Wikipedia da acceso libre a estos datos a cualquiera que esté interesado, se trata de una fuente totalmente transparente y con probabilidades de estar disponible en un plazo futuro previsible.
Hickman y su equipo utilizaron los datos de la gripe de artículos de años anteriores para entrenar a un algoritmo de aprendizaje automático a que detectara la vinculación con las cifras de enfermedades similares a la gripe recogidas por los CDC. A continuación, utilizaron el algoritmo para predecir los niveles de gripe en tiempo real durante la temporada de gripe del año pasado.
Los resultados son útiles para predecir la información sobre el terreno que los CDC distribuyen dos semanas más tarde. "Los registros de acceso a artículos de Wikipedia han demostrado una alta correlación con los registros históricos de enfermedades como la gripe y permiten una predicción precisa de datos de enfermedades similares a la gripe varias semanas antes de que esté disponibles", señala Hickmann.
Sin embargo hay que tener algo en cuenta. Uno de los problemas es que los pronósticos subestiman significativamente el tamaño de la cola de la temporada de gripe. Esto probablemente se debe a que las personas tienden a no volver a visitar los artículos de Wikipedia sobre la gripe si se reinfectan con otra cepa de la gripe, lo que supone una fuente significativa de enfermedad a finales de la temporada. "Puesto que nuestro modelo no tiene en cuenta la reinfección o las múltiples cepas de la gripe, la cola de la epidemia no puede predecirse bien después de que haya pasado el pico de la temporada de gripe", admiten.
Sin embargo, el trabajo es un paso importante hacia un sistema de predicción tan detallado y fundamentado como la predicción del tiempo. Una característica útil del método es que muestra en qué momento el modelo se desvía de la información recogida sobre el terreno. Esto permite que pueda ser ajustado en tiempo real para tener en cuenta las diferencias, al igual que ocurriría con un pronóstico del tiempo.
La previsión de enfermedades es una ciencia muy poco desarrollada aún, pero tiene el potencial de mejorar drásticamente el nivel de preparación mundial contra epidemias. Los cálculos aproximados con los que los médicos han tenido que trabajar hasta ahora a menudo conducen a niveles significativos de exceso o falta de preparación.
Parece que las cosas podrían cambiar. Y puesto que la temporada de gripe 2014-2015 se nos echa encima, cuanto antes mejor.
Ref: arxiv.org/abs/1410.7716 : Forecasting the 2013-2014 Influenza Season using Wikipedia