.

Ms Tech | Pixabay

Tecnología y Sociedad

'Web scrapping', la técnica para denunciar injusticias y que es delito a la vez

1

La película 'Juegos de guerra' hizo que las autoridades de EE. UU. crearan una ley contra la piratería informática que convirtió el raspado web en un crimen. Pero, como periodista, afirmo que es una de las herramientas más poderosas que tengo para identificar responsabilidades de empresas y gobiernos

  • por Lam Thuy Vo | traducido por Ana Milutinovic
  • 21 Diciembre, 2020

Como periodista con algunas nociones de informática, me resulta fácil encontrar información en páginas web y redes sociales para algún reportaje. Lo único que tengo que hacer es escribir unas líneas de código, introducirlas en la red y abrir páginas web para descargar los datos disponibles públicamente en ellas. Este proceso se llama web scraping, o raspado web. 

Pero, cada vez que comienzo a investigar alguna historia que requiere web scraping me paro a pensar: "¿Vale la pena ir a la cárcel por esto?"

No me refiero a hackear las amuralladas bases de datos de la CIA, sino de usar el código informático para reunir información a la que puedo acceder libremente como cualquier usuario de internet, como, por ejemplo, las publicaciones abiertas de Instagram o los tuits que usan un determinado hashtag.

Mi preocupación no es infundada. La vagamente escrita Ley de Delito y Fraude Informático de EE. UU. convierte en un posible delito el acceso a este tipo de información de manera programada. La ley, que ya tiene varias décadas, se introdujo después de que los legisladores vieran la película Juegos de guerra (título original: WarGames) de 1983 y decidieran que Estados Unidos necesitaba una ley contra la piratería. Así fue como prohibieron que cualquier persona usara un ordenador "sin autorización o sobrepasara el acceso autorizado". 

Si bien la ley pudo haber tenido buenas intenciones y se ha utilizado para denunciar a quienes descargan algo que no deberían, también atrapa en su amplia red a muchas otras personas, incluidos profesores universitarios, investigadores, y periodistas. 

¿Qué significa "sobrepasar el acceso autorizado" en la era de las redes sociales? ¿Un empleado que tiene acceso a una base de datos de revistas de investigación para su trabajo y las usa para fines privados sobrepasa el acceso autorizado? ¿Comete un delito una reportera como yo que busca información mediante procesos automatizados y su propia cuenta de Facebook?

Hasta ahora, las interpretaciones de la ley han variado de un caso judicial a otro, en función de los distintos jueces para una mejor definición de lo que significa exactamente sobrepasar el acceso autorizado a la información. Pero, pronto El Tribunal Supremo de Estados Unidos se pronunciará sobre esta ley por primera vez, en el caso Van Buren contra Estados Unidos. El sargento de policía Nathan Van Buren tenía acceso a bases de datos confidenciales para su trabajo y vendió la información que encontró a un tercero. El tribunal escuchó los argumentos iniciales el 30 de noviembre y podría comunicar su decisión pronto.

Es posible rastrear muchas irregularidades corporativas a través de las plataformas en las que llevamos gran parte de nuestras vidas, desde los precios injustos en Amazon hasta los discursos de odio en Facebook. Y la enorme huella digital que los seres humanos producimos online, de la cual casi toda está disponible públicamente, puede ayudarnos a cubrir las lagunas en los datos e investigar áreas que, de otro modo, serían difíciles de entender.

Como señaló la artista y experta en tecnología Mimi Onuoha en su conmovedora obra The Library of Missing Datasets: "Lo que ignoramos revela más que aquello a lo que prestamos atención. Es ahí donde encontramos indicios culturales y cotidianos de lo que se considera importante. Los espacios que hemos dejado en blanco revelan nuestros sesgos sociales ocultos e indiferencias".

La recopilación de datos es costosa y complicada, pero también es una herramienta importante para descubrir y revelar las injusticias sistémicas. Qué datos consideramos lo suficientemente importantes para reunir es un asunto que a menudo se deja en manos de poderosas entidades (gobiernos y corporaciones) que no siempre tienen en cuenta a las personas más vulnerables de la sociedad.

Si los funcionarios del Gobierno chino no quieren publicar información sobre los campamentos donde retienen a las minorías musulmanas, entonces quizás los investigadores puedan usar la información de los mapas de Google para mostrar el alcance de este problema. Si los perpetradores no admiten sus crímenes de guerra, pero, publican sobre ellos en las redes sociales, los fiscales y los investigadores de derechos humanos aún pueden construir casos en su contra. 

¿Deberían las empresas como Facebook tener el recurso legal para paralizar una investigación académica? ¿Debería haber una exención cuando el web scraping es la única forma de recopilar datos que ayudan a los investigadores, profesores universitarios y periodistas a diagnosticar los males de nuestra sociedad?

Twitter podría haber creado un camino a seguir. Teniendo en cuenta su papel en la difusión de desinformación en torno a las elecciones estadounidenses de 2016, la empresa decidió crear un acceso especial a los datos específicamente para académicos e investigadores. Aunque la empresa aún desaprueba el scraping, este paso indica que reconoce la importancia de los datos. 

Quizás los legisladores también lo hagan. 

*Lam Thuy Vo es periodista sénior en 'BuzzFeed News', donde ha publicado artículos sobre desinformación, odio en línea y responsabilidad relacionada con la plataforma. Su libro 'Mining Social Media' fue publicado por No Starch Press a fines de 2019.

Tecnología y Sociedad

Los avances tecnológicos están cambiando la economía y proporcionando nuevas oportunidades en muchas industrias.

  1. El éxodo a Bluesky marca el inicio de la era de las redes sociales descentralizadas

    Bluesky ha ganado terreno como alternativa a X, especialmente tras las últimas elecciones en EE UU. Sin embargo, este fenómeno no refleja el ascenso de un servicio ni el declive de otro, sino una tendencia hacia la descentralización

    Una persona entra a Bluesky desde su teléfono móvil
  2. La herramienta de Google DeepMind para "leer la mente" de la inteligencia artificial

    Un equipo de Google DeepMind ha creado Gemma Scope, una herramienta diseñada para desentrañar los procesos internos de una IA y comprender cómo llega a sus conclusiones. Este avance abre la puerta a algoritmos más transparentes y alineados con las expectativas humanas

    Google DeepMind tiene una nueva herramienta para explorar la IA
  3. El fundador de Oculus habla sobre la apuesta de EE UU por la realidad mixta en el campo de batalla

    El proyecto norteamericano de gafas militares está cuestionado, pero Palmer Luckey cree que los cascos dotados con IA y realidad aumentada serán clave en los ejércitos del futuro