Tecnología y Sociedad
Meta abre datos públicos de Facebook e Instagram a los investigadores entre críticas por su opacidad
Todavía hay mucho que desconocemos sobre el impacto de las redes sociales. Nick Clegg, presidente de Asuntos Globales de Meta, espera que las nuevas herramientas lanzadas por la empresa empiecen a cambiar la situación, según ha explicado a ‘MIT Technology Review’
Esta semana, Meta ha anunciado un el lanzamiento de un nuevo producto de transparencia, la Biblioteca de Contenido y API de Meta. Estas nuevas herramientas permitirán a determinados investigadores acceder a los datos públicos disponibles en Facebook e Instagram con el objetivo de ofrecer una visión más global sobre lo que ocurre en las plataformas.
La medida llega en un momento en el que las empresas de redes sociales se enfrentan a presiones públicas y normativas para aumentar la transparencia sobre el funcionamiento de sus productos -en concreto, los algoritmos de recomendación- y el impacto que tienen. Los investigadores académicos llevan tiempo reclamando un mejor acceso a los datos de las plataformas de redes sociales, incluida Meta. Esta nueva biblioteca es un paso hacia una mayor visibilidad de lo que ocurre en sus plataformas y el efecto que los productos de Meta tienen en las conversaciones online, la política y la sociedad en general.
Nick Clegg, presidente de Asuntos Globales de Meta, aseguró en una entrevista que las herramientas "son muy importantes", ya que, en muchos sentidos, proporcionan "el acceso más completo a los contenidos disponibles públicamente a través de Facebook e Instagram de todo lo que hemos construido hasta la fecha". La Biblioteca de Contenido y API también ayudará a la empresa a cumplir los nuevos requisitos y obligaciones normativas sobre intercambio de datos y transparencia, como señala la empresa en un post publicada el 21 de noviembre.
La Biblioteca de Contenido y API (interfaces de programación de aplicaciones) asociadas a ella se lanzaron como versión beta por primera vez hace varios meses, y permiten a los investigadores acceder a datos casi en tiempo real sobre páginas, publicaciones, grupos y eventos en Facebook, y cuentas de creadores y empresas en Instagram. También la cantidad de reacciones, comentarios y visualizaciones, así como el número de veces que ha sido compartida una publicación. Aunque todos estos datos son públicos, pues cualquiera puede ver las publicaciones, reacciones y comentarios en Facebook; la nueva biblioteca facilita a los investigadores la búsqueda y el análisis de estos contenidos a gran escala.
Meta afirma que, para proteger la privacidad de los usuarios, estos datos solo serán accesibles a través de una "sala blanca" virtual y no podrán descargarse. El acceso estará limitado a investigadores autorizados, que deberán solicitarlo a través de una organización independiente.
Además de la nueva Biblioteca de Contenido y API, Meta anunció nuevas asociaciones para ampliar la investigación de 2022 sobre las conexiones entre las redes sociales y la movilidad económica.
Los anuncios se han producido pocos días después de que The Information comunicara que la empresa estaba disolviendo su equipo de IA responsable para distribuir a los investigadores por otras partes de la organización, esto desató el escepticismo sobre su compromiso con la seguridad de los usuarios. Clegg no hizo comentarios sobre la reestructuración del equipo de IA.
Esperanzas de una investigación significativa
Los investigadores han tenido una relación tensa con las empresas de redes sociales con anterioridad, sobre todo cuando se trata de acceder a datos que las plataformas no quieren hacer públicos. En 2021, por ejemplo, Facebook envió una carta de cese y desistimiento a los investigadores del Proyecto de Transparencia de la Universidad de Nueva York (EE UU), que investigaba la orientación de la publicidad política en la plataforma a través del web scraping, y según la empresa, esto violaba la privacidad de los usuarios.
Clegg ha manifestado su deseo de que el producto permita una investigación que, ante todo, sea "significativa", y destacó la actual falta de consenso entre los investigadores sobre las repercusiones exactas de los medios sociales. Una investigación que, sin duda, se ha visto dificultada por la falta de datos públicos de las empresas de medios sociales.
En esencia, la nueva biblioteca es una base de datos accesible a través de una interfaz similar a un motor de búsqueda, o mediante una API en la que los investigadores pueden codificar sus propias consultas para obtener grandes cantidades de datos. Por ejemplo, los investigadores podrían requerir ver todos los mensajes públicos en inglés sobre IA generativa del 14 de febrero de 2023, ordenados del más al menos visto.
Las recientes medidas de los reguladores, en especial en la Unión Europea, pueden haber presionado a Meta con mandatos de mayor transparencia. La Ley de Servicios Digitales (DSA, por sus siglas en inglés) de la UE, que entró en vigor en agosto, exige que las grandes plataformas del tamaño de Meta proporcionen acceso a los datos en tiempo real a los investigadores que estudian "la detección, identificación y comprensión de los riesgos sistémicos en la Unión [Europea]". Otros esfuerzos reguladores en Australia, Brasil, EE UU y otros países han intentado imitar estos requisitos. Las empresas tecnológicas suelen cumplir las normas más estrictas, normalmente establecidas por la UE en lo que se conoce como “efecto Bruselas”, en todos los países donde operan para evitar la fragmentación de sus productos.
Los esfuerzos políticos se han dirigido a equilibrar las demandas de mayor transparencia con las preocupaciones sobre la protección de la privacidad. Clegg afirma que Meta ha intentado alcanzar ese equilibrio, en parte a través del proceso de solicitud.
Los investigadores que deseen acceder a la Biblioteca de Contenido y API tienen que enviar información sobre su institución y sus temas de investigación al Consorcio Interuniversitario para la Investigación Política y Social, una organización independiente de la Universidad de Michigan (EE UU). Meta afirma que el objetivo principal de esta comprobación es proporcionar un control de seguridad sobre los grupos que utilizan los datos y sus intereses financieros, no analizar las cuestiones a investigar.
Sin embargo, el proceso de solicitud ya ha levantado algunas cejas. Smitha Milli, investigadora postdoctoral en Cornell Tech (Nueva York, EE UU) y estudiosa del impacto de las redes sociales, expone: "Mi principal pregunta es: ¿por qué no es accesible para todo el mundo?". Especialmente porque la biblioteca solo contiene datos de acceso público. Milli señala la importancia de tener en cuenta la cantidad de tiempo que el proceso de solicitud añadirá al ciclo de la investigación, y añade que podría ser "muy limitante".
Meta afirmó que el acceso a la Biblioteca de Contenido y API estaba limitado para proteger la privacidad de los usuarios. "Hay una gran diferencia entre que los datos estén disponibles públicamente en la plataforma frente a que se pueda acceder a ellos mediante programación de forma que pueda accederse a un gran volumen de esos datos", aseguró Kiran Jagadeesh, responsable de Producto de Meta.
Milli señala que los investigadores quieren tener acceso a información sobre el funcionamiento de los algoritmos de recomendación y lo que la gente ve en sus feeds individuales, así como formas de realizar experimentos en las plataformas. No está claro cómo progresará en esos frentes el último producto de Meta, aunque Clegg explicó que los investigadores pueden emparejar la Biblioteca de Contenido y API con otros proyectos, como las tarjetas de sistemas de recomendación. Según Clegg, su combinación daría "una imagen mucho más rica de lo que nunca fue posible".
Lena Frischlich, profesora del Centro de Democracia Digital de la Universidad del Sur de Dinamarca, probó la versión beta de la Biblioteca de Contenido y API y señaló que su equipo vio útil el acceso a contenidos multimedia, como los reels en Instagram, los eventos en Facebook, y los nuevos datos sobre el recuento de visualizaciones.
Aunque el nuevo producto es "un paso importante hacia una mayor transparencia", Frischlich también afirmó que solo es un paso. "El acceso a los datos sigue estando restringido en cierto modo", ya que no todos los países están incluidos en la base de datos y solo se permite el acceso a los investigadores de las instituciones académicas cualificadas.
Clegg espera que en última instancia la nueva herramienta conduzca a una mejor investigación sobre el papel de los medios sociales en la población, por múltiples razones. "Creo que hay una especie de sentido social de la responsabilidad", afirmó Clegg, que añadió: "También existe un interés propio en disipar parte de la hipérbole que rodea a los medios sociales y tener el debate basado algo más en los hechos".