STEPHANIE ARNETT / MIT TR | ENVATO

Inteligencia Artificial

La nueva batalla de la publicidad programática: webs basura generadas por IA

Más de 140 marcas se anuncian en sitios de granjas de contenido de baja calidad, y el problema está creciendo rápidamente

por Tate Ryan-Mosley | traducido por
05 Julio, 2023

Se está popularizando el uso de chatbots de IA para llenar sitios web basura con texto generado por IA para atraer a anunciantes de pago, según un nuevo informe de la organización de investigación de medios NewsGuard, compartido en exclusiva con MIT Technology Review.

Más de 140 grandes marcas están pagando por anuncios que terminan en sitios poco fiables creados por IA, probablemente sin que sean conscientes de ello. El 90% de los anuncios de grandes marcas encontrados en estos sitios de noticias generados por IA fueron facilitados por Google, a pesar de que las políticas de la compañía prohíben a los sitios colocar anuncios facilitados por Google en páginas que incluyan "contenido spam creado automáticamente". Esta práctica amenaza con acelerar la llegada de un internet plagado de fallos y spam, invadido por contenidos generados por inteligencia artificial, además de malgastar ingentes cantidades de dinero en publicidad.

La mayoría de las empresas que se anuncian en internet pujan automáticamente por los espacios publicitarios a través de una práctica denominada "publicidad programática". Los algoritmos colocan anuncios en varios sitios web según complejos cálculos que optimizan el número de veces que un anuncio puede atraer al público objetivo de la empresa. Como resultado, las grandes marcas acaban pagando por anuncios en webs de los que nunca habían oído hablar, sin apenas supervisión humana.

Para aprovecharse de ello, han surgido granjas de contenidos en las que personas mal pagadas producen contenidos de baja calidad para atraer ingresos publicitarios. Este tipo de sitios web ya tienen un nombre: sitios "hechos para la publicidad". Utilizan tácticas como clickbait, vídeos de reproducción automática y anuncios emergentes para sacar el máximo dinero posible a los anunciantes. En una encuesta reciente, la Asociación Nacional de Anunciantes descubrió que el 21% de las impresiones publicitarias de su muestra iban a parar a este tipo de webs. El grupo calcula que cada año se malgastan en todo el mundo unos 13.000 millones de dólares (algo más de 11.900 millones de euros) en estos sitios.

Ahora, la IA generativa ofrece una nueva forma de automatizar el proceso de granja de contenidos y crear más sitios basura con menos esfuerzo, algo que da lugar a lo que NewsGuard denomina "sitios web de noticias poco fiables generados por inteligencia artificial". Un sitio marcado por NewsGuard producía más de 1.200 artículos al día.

Algunos de estas nuevas webs son más sofisticados y convincentes que otros, con imágenes generadas por inteligencia artificial y biografías de autores falsos. El problema está creciendo rápidamente. NewsGuard, que evalúa la calidad de las webs en internet, afirma que descubre unas 25 nuevas webs generadas por inteligencia artificial cada semana. Ha encontrado 217 en 13 idiomas desde que empezó a rastrear el fenómeno en abril.

NewsGuard tiene una forma inteligente de identificar estos sitios web basura escritos por IA. Como muchos de ellos también se crean sin supervisión humana, suelen estar plagados de mensajes de error típicos de los sistemas generativos de IA. Por ejemplo, un sitio llamado CountyLocalNews.com tenía mensajes como "Lo siento, no puedo cumplir esta petición porque va en contra de los principios éticos y morales. Como modelo lingüístico de IA, es mi responsabilidad proporcionar información objetiva y fidedigna".

La IA de NewsGuard busca estos fragmentos de texto en los sitios web. A continuación, un analista humano los revisa.

Ganar dinero de la basura

"Parece que la publicidad programática es la principal fuente de ingresos de estos sitios web generados por IA", afirma Lorenzo Arvanitis, analista de NewsGuard que ha estado rastreando el contenido web generado por IA. "Hemos identificado cientos de empresas de Fortune 500 y marcas conocidas y destacadas que se anuncian en estos sitios y que los están apoyando sin saberlo".

MIT Technology Review examinó la lista de casi 400 anuncios individuales de más de 140 grandes marcas que NewsGuard identificó en los sitios generados por IA. Estos servían anuncios programáticos, entre los que se encontraban empresas de muchos sectores diferentes, como el financiero, el minorista, el automovilístico, el sanitario y el de comercio electrónico. El coste medio de un anuncio programático era de 1,21 dólares (1,11 euros) por cada mil impresiones en enero de 2023. Las marcas no suelen revisar todas las colocaciones automáticas de sus anuncios, aunque les cuesten dinero.

El producto de publicidad programática de Google, llamado Google Ads, es el mayor espacio de intercambio y obtuvo 168.000 millones de dólares (unos 154.000 millones de euros) en ingresos publicitarios en 2023. En el pasado, la empresa ha sido objeto de críticas por publicar anuncios en granjas de contenidos, a pesar de que sus propias políticas prohíben colocar anuncios facilitados por Google en páginas con "contenido spam generado automáticamente". Alrededor de una cuarta parte de los sitios marcados por NewsGuard contenían anuncios programáticos de grandes marcas. De los 393 anuncios de grandes marcas encontrados en sitios generados por IA, 356 eran de Google.

"Tenemos políticas estrictas que rigen el tipo de contenido que puede monetizarse en nuestra plataforma", explicó Michael Aciman, responsable de Comunicación de Google, a MIT Technology Review en un correo electrónico. "Por ejemplo, no permitimos que se publiquen anuncios junto a contenidos nocivos, spam o de escaso valor, ni contenidos que hayan sido copiados exclusivamente de otras webs. Al aplicar estas políticas, nos centramos en la calidad del contenido más que en cómo se ha creado, y bloqueamos o eliminamos los anuncios si detectamos infracciones."

La mayoría de las aplicaciones de intercambio de anuncios y plataformas ya tienen políticas contra la publicación de anuncios en las granjas de contenido. Sin embargo, "no parecen aplicar de manera uniforme estas políticas", dice Krzysztof Franaszek, fundador de Adalytics, empresa de análisis forense digital y verificación de anuncios, que añade: "Muchos de estos intercambios de anuncios siguen publicando anuncios en sitios [hechos para la publicidad] incluso si parecen estar violando las políticas de calidad".

Google asegura que la presencia de contenido generado por IA en una página no es una infracción inherente. "También reconocemos que los malos actores siempre están cambiando su enfoque y pueden aprovechar la tecnología, como la IA generativa, para eludir nuestras políticas y sistemas de aplicación", afirma Aciman.

Una nueva generación de sitios de desinformación

NewsGuard dice que la mayoría de los sitios generados por IA se consideran de "baja calidad" pero "no difunden desinformación". Sin embargo, la dinámica económica de las granjas de contenidos incentiva la creación de webs basadas en clickbait que suelen estar plagados de basura y desinformación. Ahora que las IA pueden hacer lo mismo a mayor escala, amenaza con agravar el problema de la desinformación.

Por ejemplo, un sitio escrito con IA, MedicalOutline.com, tenía artículos que difundían desinformación perjudicial para la salud con titulares como "¿Puede el limón curar la alergia cutánea?"; "¿Cuáles son los 5 remedios naturales para el TDAH?"; y "¿Cómo se puede prevenir el cáncer de forma natural?". Según NewsGuard, en el sitio se insertaron anuncios de nueve grandes marcas, entre ellas el banco Citigroup, el fabricante de automóviles Subaru y la empresa de bienestar GNC. Los anuncios se publicaban a través de Google.

Adalytics confirmó a MIT Technology Review que los anuncios de Medical Outline parecían haberse publicado a través de Google a partir del 24 de junio. Durante el fin de semana nos pusimos en contacto con Medical Outline, Citigroup, Subaru y GNC para obtener sus comentarios, pero las marcas aún no han respondido.

Después de que MIT Technology Review señalara a Google los anuncios en Medical Outline y otros sitios, Aciman explicó que Google había retirado los anuncios que se estaban publicando en muchos de los sitios "debido a violaciones generalizadas de la política". Los anuncios seguían visibles en Medical Outline el 25 de junio.

"Los hallazgos de NewsGuard arrojan luz sobre la preocupante relación entre Google, las empresas de tecnología publicitaria y la aparición de una nueva generación de sitios de desinformación que se hacen pasar por sitios de noticias y granjas de contenidos posibles gracias a la IA", afirma Jack Brewster, editor empresarial de NewsGuard. "La naturaleza opaca de la publicidad programática ha convertido a las grandes marcas en partidarios involuntarios, inconscientes de que sus dinero publicitario financia indirectamente estos sitios poco fiables generados por IA".

Franaszek afirma que aún es pronto para saber cómo afectarán los contenidos generados por IA al panorama de la publicidad programática. Al fin y al cabo, para que esos sitios ganen dinero, siguen necesitando atraer a seres humanos a sus contenidos, y actualmente no está claro si la IA generativa facilitará esa tarea. Es posible que algunos sitios sólo reciban un par de miles de visitas al mes y ganen unos pocos dólares.

"El coste de la generación de contenidos es probablemente inferior al 5% del coste total de funcionamiento de una web [hecho para la publicidad], y es poco probable que la sustitución de mano de obra extranjera de bajo coste por una IA cambie significativamente esta situación", afirma Franaszek.

De momento, no hay soluciones fáciles, sobre todo teniendo en cuenta que la publicidad sustenta todo el modelo económico de Internet. "Lo que hay que recordar es que los anuncios programáticos -y los anuncios dirigidos en general- son un elemento fundamental de la economía de Internet", afirma Hodan Omaar, asesor principal de Política de IA en la Information Technology and Innovation Foundation, un think tank de Washington DC.

"Si los responsables políticos prohibieran el uso de este tipo de servicios publicitarios, los consumidores se enfrentarían a un internet radicalmente distinto: más anuncios menos relevantes, contenidos y servicios online de menor calidad y más muros de pago", afirma Omaar.

"La política no debería centrarse en deshacerse por completo de los anuncios programáticos, sino en cómo garantizar que haya mecanismos más sólidos para atrapar la propagación de la desinformación, ya sea directa o indirecta".

Esta noticia se ha actualizado para aclarar las políticas publicitarias de Google

Inteligencia Artificial

La nueva batalla de la publicidad programática: webs basura generadas por IA

Ganar dinero de la basura

Una nueva generación de sitios de desinformación

Al habla con la IA: el reto de lograr voces más diversas e inclusivas

Estos robots aprendieron a superar obstáculos reales desde un entorno virtual gracias a la IA

Por qué la IA podría comerle la tostada a la computación cuántica