Con la publicación de los Archivos Nacionales de Estados Unidos se han liberado una gran cantidad de datos que pueden ser tratados con herramientas estadísticas. Si más gobiernos siguen la tendencia, la tecnología podría revolucionar cómo analizamos y entendemos la historia.
El estudio de la historia política está experimentando una revolución gracias a los registros electrónicos de la actividad gubernamental y la posibilidad de realizar cálculos con esta información de formas que no habían sido posibles hasta ahora. Los historiadores cuentan con acceso inmediato a noticias contemporáneas sobre los eventos globales más importantes, pero para entenderlas de una manera completa necesitan compararlas con los registros del gobierno, que pueden ser diferentes de maneras importantes y desconocidas. Éstos no suelen estar disponibles para el público hasta varios años después del hecho que analizan, y la gran cantidad de documentos que generan complica el proceso, ya que es fácil que los investigadores pasen por alto algo importante. Por lo tanto, una manera automatizada de buscar estos registros de eventos importantes sería increíblemente útil.
La minería de datos revela un gran aumento en la cantidad de comunicaciones durante la caída de Saigón (arriba), pero ningún cambio importante en la relación con Finlandia (abajo).
Yuanjun Gao y su equipo, de la Universidad de Columbia en Nueva York (EE. UU.), afirman haber desarrollado un paquete de herramientas estadísticas que cumple esta tarea. Gracias a la publicación de los Archivos Nacionales de Estados Unidos, han podido hacer pruebas con registros electrónicos del gobierno estadounidense y han comparado los resultados con los registros actuales.
Este trabajo ha sido posible porque, desde 1973, el Departamento de Estado de EE. UU. ha almacenado las comunicaciones clasificadas de manera electrónica. Una gran cantidad de los registros desde 1973 hasta 1977 están disponibles públicamente. Hay 1,4 millones de comunicaciones desclasificados, además de metadatos relacionados con 0,4 millones de documentos presentados a través de valijas diplomáticas. El tema del que habla cada uno de estos registros electrónicos está identificado con una serie de siglas. Por ejemplo, las comunicaciones asociadas al sur de Vietnam tienen la etiqueta “VS”, aquellas asociadas a la Asamblea General de la Organización de las Naciones Unidas (ONU) tienen la etiqueta “UNGA”, las de Finlandia “FI”, etcétera. Esto permite a los investigadores analizar la evolución de temas específicos sin conocer en detalle todos los mensajes.
Al distribuir la cantidad de mensajes a lo largo del tiempo, Gao y su equipo descubrieron unas tendencias interesantes. Por ejemplo, en abril de 1975, cuando se produjo la caída de Saigón (actualmente Ho Chi Minh, Vietnam), hubo un aumento en el número de comunicaciones relacionadas con el sur de Vietnam. En las comunicaciones con la asamblea general de la ONU se observan picos frecuentes cercanos a las fechas cuando tienen lugar las asambleas cada año. También se encontró un pico adicional entre abril y mayo del 1974, que corresponde a una reunión especial convocada por Argelia para hablar de sus demandas de apoyo para un “Nuevo Orden Económico Internacional”. Por otro lado, en las etiquetas asociadas a Finlandia entre 1973 y 1977 no se ve ningún pico o patrón particular, lo cual lleva a pensar en que el país mantuvo una etapa de estabilidad entonces.
Los picos importantes son fáciles de visualizar. Sin embargo, Gao ha desarrollado una serie de herramientas para percibirlos de manera automatizada y hacer una clasificación del significado de cada uno, comparándolos con el nivel de actividad normal en la época. Esto permite al equipo de crear un ranking de los 30 eventos más importantes que afectaron a Estados Unidos entre 1973 y 1977. No todos los picos corresponden, por supuesto, a importantes acontecimientos mundiales: los dos primeros se relacionan con asuntos administrativos, como por ejemplo, el transporte y cambios en el sistema de visados.
La lista, igualmente, tiene una gran variedad de otros hechos significativos, como la importancia que dio la administración del presidente Jimmy Carter a los derechos humanos; la visita no prevista del presidente de Egipto, Anwar Sadat, a Israel en el año 1977; la crisis de refugiados en Asia suroriental entre 1975 y 1976; la guerra de Yom Kippur en 1973 y la retirada de Portugal de Angola que comenzó en 1975, entre otros.
Esto proyecto de investigación es interesante y podría cambiar la manera en la que los historiadores y científicos sociales hacen su trabajo. Y esto el sólo el principio: estos métodos automatizados pueden mostrar también cómo los seres humanos utilizaron el sistema de etiquetado en la época, con qué frecuencia ocurrieron errores y si ciertos mensajes han desaparecido. Cuando más registros electrónicos sean publicados, otros investigadores podrán desarrollar maneras más avanzadas de hacer minería de datos con ellos. La historia política nunca será lo mismo.
Ref: arxiv.org/abs/1712.07319: Mining Events with Declassified Diplomatic Documents