
En las últimas tres semanas, la nueva administración presidencial de EE UU ha eliminado miles de páginas web gubernamentales sobre salud pública, justicia medioambiental e investigación científica. Esto responde a la presión del gobierno para suprimir información relacionada con la diversidad y la llamada «ideología de género», así como al mayor escrutinio sobre las prácticas de diversas agencias federales.
La página web de la Agencia de los Estados Unidos para el Desarrollo Internacional (USAID) está caída, al igual que otras vinculados a la agencia, como childreninadversity.gov (para niños en situaciones de adversidad). También han desaparecido miles de webs de la Oficina del Censo, los Centros para el Control y la Prevención de Enfermedades y la Oficina de Programas de Justicia.
«Nunca habíamos visto algo así», afirma David Kaye, profesor de Derecho en la Universidad de California en Irvine (EE UU) y ex Relator Especial de la ONU sobre libertad de opinión y expresión. «Creo que nadie sabe con certeza qué está pasando. Lo que sí vemos es la desaparición de sitios web gubernamentales y bases de datos de gran interés público, incluido el sitio completo de USAID», observa el docente.
Mientras los sitios web gubernamentales desaparecen, un grupo de organizaciones trabaja para archivar la mayor cantidad de datos e información posible antes de que se pierdan definitivamente. Su objetivo es conservar un registro de lo que se ha perdido para que científicos e historiadores puedan acceder a él en el futuro.
En general, los archivos de datos se consideran neutrales, pero las recientes acciones de la administración han impulsado a algunos miembros de la comunidad de preservación a alzar la voz.
«Las acciones de la actual administración son un ataque a la misión de los científicos«, afirma Margaret Hedstrom, profesora emérita de Información en la Universidad de Michigan (EE UU).
Varias organizaciones están trabajando para recopilar la mayor cantidad de datos posible. Uno de los proyectos más destacados es End of Term Web Archive, una coalición no partidista formada por diversas entidades que busca hacer una copia de todos los datos gubernamentales al final de cada mandato presidencial. Este archivo permite a los ciudadanos proponer sitios web o conjuntos de datos específicos para su conservación.
«Lo único que podemos hacer es recopilar lo que se ha publicado, archivarlo y garantizar que sea accesible al público en el futuro«, afirma James Jacobs, bibliotecario de información gubernamental de la Universidad de Stanford (EE UU) y uno de los responsables del Archivo EdT.
Otras organizaciones están adoptando un enfoque más centrado en la recopilación de datos específicos. Es el caso del Proyecto de Datos Medioambientales Abiertos (OEDP, por sus siglas en inglés), que se dedica a recolectar información relacionada con el clima y la justicia medioambiental. «Tratamos de hacer un seguimiento de lo que se elimina», señala Katie Hoeberling, directora de iniciativas políticas del OEDP. «No puedo decir con certeza cuánto de lo que antes estaba disponible sigue estando, pero hemos observado, especialmente en las últimas dos semanas, un ritmo acelerado en la eliminación de datos», añade.
Además de hacer un seguimiento de los cambios, OEDP realiza copias de seguridad de los datos más relevantes. De hecho, este proceso comenzó en noviembre, con el objetivo de recopilar datos al final del mandato del expresidente Biden. Sin embargo, los esfuerzos se han intensificado en las dos últimas semanas. «Las cosas estaban mucho más tranquilas antes de la toma de posesión. Fue el segundo día de la nueva administración cuando se cayó la primera plataforma. En ese momento, todos se dieron cuenta de que había que seguir trabajando en esta lista de conjuntos de datos», explica Cathy Richards, tecnóloga del OEDP.
Este tipo de trabajo es fundamental: el gobierno estadounidense posee datos internacionales y nacionales de un valor incalculable relacionados con el clima. «Son depósitos irremplazables de información climática crucial», afirma Lauren Kurtz, directora ejecutiva del Fondo de Defensa Legal de la Ciencia del Clima. «Por lo tanto, manipularlos o eliminarlos implica la pérdida irreversible de datos esenciales. Es realmente trágico», alerta la experta.
Al igual que OEDP, Catalyst Cooperative se esfuerza por garantizar que los datos relacionados con el clima y la energía se almacenen y sean accesibles para los investigadores. Ambas organizaciones forman parte de Public Environmental Data Partners, una coalición de entidades dedicadas a preservar los datos medioambientales federales. «Hemos intentado identificar los conjuntos de datos que sabemos que nuestras comunidades utilizan para tomar decisiones sobre la electricidad que debemos adquirir o para planificar la resistencia en nuestras infraestructuras», explica Christina Gosnell, cofundadora y presidenta de Catalyst.
Archivar puede ser una tarea compleja: no existe una forma sencilla de almacenar todos los datos del gobierno de Estados Unidos. «Diversas agencias y departamentos federales gestionan la conservación y el archivo de datos de maneras muy diferentes», señala Gosnell. Además, no hay ninguna entidad que tenga una lista completa de todos los sitios web gubernamentales existentes.
Esta mezcla de datos significa que, además de utilizar rastreadores web, herramientas diseñadas para capturar instantáneas de sitios web y datos, los archivadores a menudo deben extraer información de manera manual. En ocasiones, un conjunto de datos está protegido detrás de una dirección de inicio de sesión o un captcha para evitar que herramientas de extracción accedan a él. Los rastreadores web también pueden pasar por alto características clave de un sitio. Por ejemplo, muchos incluyen enlaces a otras piezas de información que no se capturan en un proceso de extracción. Otras veces, la extracción no funciona debido a problemas relacionados con la estructura del sitio web. Por ello, contar con una persona que verifique el trabajo del rastreador o que capture los datos manualmente suele ser la única forma de asegurar que la información se recopila correctamente.
Además, existen dudas sobre si la extracción de datos es suficiente. La restauración de sitios web no suele ser un proceso fácil. «Recuperar y restaurar los datos es extraordinariamente difícil y costoso. Es como drenar la sangre de un cuerpo y esperar que siga funcionando. Las reparaciones y los intentos de recuperación son a veces insuperables cuando necesitamos lecturas continuas de datos» afirma Hedstrom.
«Todo este trabajo de archivo de datos es solo una solución temporal«, explica Gosnell. «Si los conjuntos de datos se eliminan y dejan de actualizarse, nuestros datos archivados se volverán cada vez más obsoletos y, por lo tanto, ineficaces para respaldar decisiones a lo largo del tiempo», apostilla la presidenta de Catalyst.
Estos cambios pueden percibirse a largo plazo. «No verás el impacto hasta dentro de diez años, cuando notes que hay una brecha de cuatro años de datos«, dice Jacobs.
Muchos documentalistas digitales subrayan la importancia de comprender nuestro pasado. «Todos podemos pensar en nuestras propias fotos familiares que nos han pasado y lo valiosos que son esos documentos. Esa cadena de conexión con el pasado es realmente fundamental», comenta Trevor Owens, director de investigación del Instituto Americano de Física y exdirector de servicios digitales de la Biblioteca del Congreso.
«Es nuestra biblioteca, nuestra historia», asegura Richards. «Estos datos son financiados por los contribuyentes, así que no queremos que todo ese conocimiento se pierda cuando podemos conservarlo, almacenarlo, aprovecharlo y seguir aprendiendo de él», sentencia la tecnóloga del OEDP.