.

Otros

Así se viralizan los contenidos en Facebook

1

La rápida replicación inicial y la moda son elementos clave, según demuestra un algoritmo capaz de predecir estos fenómenos masivos

  • por The Physics Arxiv Blog | traducido por Francisco Reyes
  • 26 Marzo, 2014

Una de las características que definen el contenido social es la forma en que las imágenes, el vídeo y el texto se comparten entre una gran cantidad de usuarios. Inevitablemente, algunos contenidos se hacen más populares que otros y esto lleva a cascadas en las que una publicación puede ser compartida una y otra vez una enorme cantidad de veces. Aunque la mayoría de piezas de medios de comunicación se comparten sólo unas pocas veces, algunas son compartidas en millones de ocasiones.

Por tanto, existe mucho interés en saber cómo predecir la popuralidad de algo en comparación con un contenido que no tenga tirón. A nivel general, es fácil pensar que predecir la popularidad de los contenidos es casi imposible. Eso se debe a que depende de muchos factores difíciles de medir, como la naturaleza de los contenidos y la conectividad de las personas que lo ven.

Varios equipos han afirmado haber encontrado la forma de predecir la viralidad final de un contenido mediante el análisis de su popularidad instantes después de su publicación. Sin embargo, puesto que no existe una forma fiable de hacer esto en internet, puedes juzgar por ti mismo lo bien o mal que funcionan estos mecanismos.

Hoy día contamos con una opinión diferente sobre el tema de la previsibilidad gracias al trabajo de Justin Cheng desde la Universidad de Stanford en California (EEUU), además de un par de investigadores en Facebook y la Universidad de Cornell (EEUU). Nos muestran por qué la popularidad es tan difícil de predecir usando el método convencional de estudiar las primeras etapas de la popularidad.

Al mismo tiempo, muestran que las diversas características de una cascada se pueden predecir con una exactitud notable, y que esto se puede utilizar para predecir con éxito el comportamiento futuro de las cascadas una vez que han comenzado. El resultado es una visión mucho más profunda de la naturaleza de las cascadas de lo que en un principio podría pensarse.

Cheng y su equipo han llegado a estas conclusiones mediante el análisis del modo en que varias fotografías fueron compartidas en Facebook durante un período de 28 días después de ser subidas inicialmente en junio de 2013. Observaron más de 150.000 fotos que, en total, fueron compartidas más de 9 millones de veces. A partir de los datos supieron qué personas (nodos) volvieron a compartir cada fotografía y en qué momento, y esto les permitió reconstruir exactamente las redes por las que se distribuyeron las publicaciones compartidas.

Hasta ahora, el método usado por el resto de investigadores ha consistido en observar cómo comienzan las grandes cascadas para después intentar utilizar esa información y detectar grandes cascadas en el futuro, con resultados dispares. Cheng y su equipo siguen un enfoque diferente. Toman como partida una foto que se haya vuelto a compartir digamos k veces. A continuación, determinan la probabilidad de que esta foto sea compartida el doble de veces. En otras palabras, su tarea consiste en predecir si la cascada se duplicará en tamaño.

Es una buena pregunta ya que la distribución del tamaño de la cascada sigue un cierto tipo de ley de poder. Esta ley asegura que, en el caso de las cascadas de un tamaño determinado, una mitad se duplicará mientras que la otra mitad no. Así que a la hora de decidir si una cascada determinada se duplicará, una estimación aleatoria produce la respuesta correcta aproximadamente la mitad de las veces.

La cuestión es si es posible distinguir características del conjunto de datos que permitan a un algoritmo de aprendizaje de máquinas mejorar dicha respuesta. Así que Cheng y su equipo usan una porción de sus datos para entrenar a un algoritmo de aprendizaje de máquinas y hacer que busque características de las cascadas que las hagan predecibles.

Estas características incluyen el tipo de imagen, ya sea un primer plano o al aire libre, si tienen título, el número de seguidores que tiene el cartel original, la forma de la cascada, ya sea un gráfico simple de estrella o estructuras más complejas, y finalmente la rapidez con la que se produce la cascada, su velocidad.

Después de haber entrenado al algoritmo, lo usaron para ver si podía hacer predicciones sobre otras cascadas. Comenzaron con imágenes que habían sido compartidas sólo cinco veces, así que la cuestión era si finalmente se compartirían más de 10 veces.

Esto resulta ser sorprendentemente predecible. "Para esta tarea, hacer una estimación al azar obtuvo un rendimiento de 0,5, mientras que nuestro método logra un rendimiento sorprendentemente alto: una precisión de clasificación de 0.795", señalan.

Algunas de las características de la cascada son mejores que otras como indicadores de predicción. De hecho, el rendimiento temporal de la cascada, la rapidez con que se propaga, es el mejor indicador de todos. Algo se propaga rápidamente en un principio es probable que se propague más.

Otro factor importante son los temas mencionados en el título asociado con una imagen, por ejemplo si tiene interés periodístico o está asociado con un meme actual.

El equipo también asegura que es más fácil hacer una predicción a medida que aumenta el número de veces que el contenido es compartido. "Esto demuestra que cuanta más información, mejor: cuanto mayor sea el número de publicaciones compartidas observadas, mejor es la predicción", señalan.

Y es ahí donde las iniciativas anteriores han fracasado en gran medida: siempre empiezan con muy poca información.

Por supuesto, este trabajo tiene limitaciones. La más obvia es que se hizo sólo con fotos compartidas en su totalidad dentro de Facebook. Puede que la forma de compartir en Facebook sea diferente a otros lugares de internet, y que las fotos sean tratadas de forma diferente a los enlaces a noticias, por ejemplo.

Pero Cheng y su equipo confían en que gran parte de lo que encontraron será útiles en otros lugares. "A pesar de estas limitaciones, creemos que los resultados dan ideas generales que serán de utilidad en otros ámbitos", afirman.

Y es tan interesante que otros investigadores podrían continuar la labor. El equipo se ha topado con una rica veta de información sobre la naturaleza de las cascadas en las redes sociales. Y aún hay mucho por explorar en ese sentido.

Ref: arxiv.org/abs/1403.4608 : Can Cascades be Predicted?

Otros

  1. Robotaxis

    Las 10 Tecnologías Emergentes 2025: los coches sin conductor solicitados mediante 'apps' se extienden a más ciudades

  2. Combustible más limpio para aviones

    Las 10 Tecnologías Emergentes 2025: los combustibles alternativos fabricados a partir de desechos industriales o dióxido de carbono podrían ayudar a reducir las emisiones climáticas de la aviación

  3. Robots que aprenden rápido

    Las 10 Tecnologías Emergentes 2025: los avances de la IA han hecho que sea más rápido que nunca entrenar a los robots para realizar nuevas tareas