Las técnicas de minería de datos revelan cuentas de Twitter falsas que dan la impresión de corresponder a un amplio movimiento político.
Los investigadores han encontrado pruebas de que las campañas políticas y grupos de intereses especiales están utilizando decenas de cuentas de Twitter falsas para crear la impresión de una amplia expresión política de base. Un equipo de la Universidad de Indiana utilizó técnicas de extracción de datos y de análisis de redes para detectar esta actividad.
"Creemos que esta técnica debe ser común", señala Filippo Menczer, profesor asociado de la Universidad de Indiana y uno de los principales investigadores del proyecto. "Donde haya un montón de ojos mirando la pantalla, siempre habrá spammers; así que ¿por qué no de política?"
Este trabajo de investigación ha recibido el apodo de proyecto Truthy, una referencia a la palabra "truthiness" inventada por el cómico Stephen Colbert, que se define como una creencia que se considera verdad, independientemente de los hechos o la lógica. Su objetivo era descubrir la campañas organizadas de propaganda o de desprestigio que se hacían pasar por un brote de opinión general espontáneo en Twitter--una táctica conocida como base falsa, o "astroturf".
Los investigadores se basaron mayoritariamente en técnicas de análisis de redes, en las que se genera un mapa de las conexiones entre los diferentes miembros de una red. Utilizados desde hace muchos años en las matemáticas y las ciencias, el análisis de redes es cada vez más utilizado para estudiar internet y las redes sociales. El grupo recibió avisos de usuarios de Twitter sobre mensajes y cuentas sospechosas, y seguidamente llevó a cabo el análisis de su red para entender cómo estaban vinculadas estas cuentas. También siguieron los "memes"--palabras clave o enlaces Web-- que de repente sufrían un gran pico en su uso. Si los memes provenían de muchas cuentas de normalmente sin ninguna otra conexión, seguramente eran legítimas. Sin embargo, si provenían de una red relativamente pequeña de cuentas estrechamente relacionadas, era más probable que se trataran de Astroturfs.
Menczer explica que el grupo de investigación descubrió varias cuentas que enviaban mensajes duplicados y hacían retweets de mensajes desde las mismas pocas cuentas en una red estrechamente vinculada. Por ejemplo, dos cuentas ya cerradas, llamadas @PeaceKaren_25 y @HopeMarie_25, enviaron 20 mil tweets similares, la mayoría de ellos con vínculos a, o promocionando, el portal web gopleader.gov del líder de la minoría en el congreso, John Boehner.
En otro caso, se usaron 10 cuentas diferentes para enviar miles de mensajes, muchos de ellos duplicados ligeramente modificados para evitar ser detectados como spam. Todos los tweets enlazaban a artículos en un portal web conservador llamado Freedomist.com.
"Si escucha el mismo mensaje de diferentes fuentes que usted piensa que son independientes, es mucho más probable que se lo crea", destaca Bruno Gonçalves, otro investigador del proyecto. Los mensajes repetidos también pueden aparecer como temas de "tendencia" en Twitter, e incluso puede influir los resultados de búsqueda de Google. Gonçalves comenta que actualmente los investigadores están trabajando para automatizar el proceso de identificación de contenido sospechoso exclusivamente mediante el estudio de la topología de la red.
La inspiración para el proyecto fue un artículo publicado en julio de 2010 por Panagiotis Takis Metaxas y Eni Mustafaraj del Wellesley College. Ellos estudiaron las elecciones especiales de 2008 para un escaño senatorial por Massachusetts entre la demócrata Martha Coakley y el republicano Scott Brown, y encontró que muchas cuentas de Twitter repetían los mismos tweets negativos, en lo que al parecer fue un intento exitoso de influir en los resultados de búsqueda en tiempo real de Google por el nombre o candidato.En un caso, una red de nueve cuentas de Twitter, creadas con 13 minutos de diferencia la una de la otra, enviaron 929 mensajes en aproximadamente dos horas, en forma de respuestas a titulares de cuentas reales con la esperanza de que estos usuarios hicieran retweet a los mensajes. Las cuentas falsas probablemente estaban controladas por un programa que elegía al azar un usuario de Twitter al que responder y incluía un mensaje y un enlace web. Aunque Twitter cerró las cuentas poco después, los mensajes consiguieron llegar a 61.732 usuarios.
Bernardo Huberman, quien estudia computación social en los laboratorios de HP en Palo Alto, California, no está seguro de que tales trucos sucios consigan gran cosa. En un estudio que utilizó con éxito la actividad de Twitter para predecir la popularidad de las películas, se encontró con que las campañas legítimas en Twitter de los estudios de cine fueron en gran medida ineficaces en comparación con la opinión honesta de las masas. Para realmente influir en la opinión, es necesario llegar a millones de personas, no sólo a unos pocos miles, afirma él. "Sí, es evidente que la gente está haciendo esto. ¿qué es lo nuevo?", pregunta él.
Sin embargo, Menczer piensa que el Astroturf de Twitter podría motivar a votar, no votar, o influenciar en el voto de sus lectores con opiniones afines. "El coste es casi cero", destaca él. "Por el coste de un anuncio en la televisión, se podría pagar a 10 personas que hicieran esto a tiempo completo."