Cadenas de bloques y aplicaciones
El emoji: la piedra Rosetta de los algoritmos para descifrar el sarcasmo en Twitter
Entender el sarcasmo detrás de ciertas publicaciones en redes sociales podría ayudar a la inteligencia artificial a combatir el racismo, el abuso y el acoso
El sarcasmo reina en Twitter. Sólo hay que deslizarse por el timeline para encontrar montones de comentarios sarcásticos, muchos de ellos apuntando directamente a la cabeza de alguien.
Afortunadamente, un equipo de investigadores del Instituto Tecnológico de Massachusetts (MIT, EEUU) ha desarrollado un algoritmo que analiza tuits y detecta el sarcasmo, el subtexto emocional en general, mejor que la mayoría de los humanos.
El análisis y la detección de los sentimientos detrás de las intervenciones en redes sociales ya se utiliza para monitorizar la actitud del público frente a marcas y productos. También para identificar señales que podrían indicar las próximas tendencias de los mercados financieros. Pero entender con mayor precisión el significado de los tuits y otro tipo de comentarios en redes sociales podría ayudar a los ordenadores a detectar automáticamente las muestras de abuso y odio en la red, a frenarlas y erradicarlas. Comprender en mayor profundidad Twitter también podría facilitar investigar cómo fluye la información y la capacidad de influir de la misma a través de la red. Además, a medida que las máquinas se vuelven más inteligentes, la capacidad de sentir emoción podría convertirse en una característica importante de la comunicación entre humanos y máquinas.
El objetivo inicial de los investigadores del MIT era desarrollar un sistema capaz de detectar mensajes racistas en Twitter. Sin embargo, pronto se dieron cuenta de que el significado de muchos mensajes no podía entenderse correctamente sin tener en cuenta un elemento omnipresente: el sarcasmo.
El algoritmo utiliza aprendizaje profundo, una técnica muy popular de aprendizaje automático basada en entrenar una red neuronal simulada muy grande para que sea capaz de reconocer patrones a partir de una gran cantidad de datos. El secreto para entrenar ese algoritmo está en unos elementos que se han colado de lleno en nuestra forma de comunicar: los emojis. Estos caracteres con forma de imagen se utilizan como etiquetas del contenido emocional de los mensajes. Los investigadores los utilizaron para ayudar al sistema a leer el sentimiento de los tuits en general. Una vez lograron esa ventaja, los utilizaron para identificar el sarcasmo.
"En la red, no podemos usar la entonación de nuestra voz o lenguaje corporal para contextualizar lo que decimos, así que utilizamos los emoji", explica el profesor asociado del MIT Media Lab Iyad Rahwan, quien ha desarrollado el algoritmo con uno de sus estudiantes, Bjarke Felbo. "La red neuronal aprendió la conexión entre cierto tipo de lenguaje y un emoji", apunta Rahwan.
Para entrenar el algoritmo, llamado DeepMoji, los investigadores recogieron 55.000 millones de tweets, de los que seleccionaron 1.200 millones que contenían una combinación de 64 emoji populares. Primero, entrenaron el sistema para predecir qué emoji se usaría con un mensaje en particular, dependiendo de si éste era un mensaje feliz, triste, humorístico, etc. Después de eso, se enseñó al sistema a identificar el sarcasmo a partir de una base de datos existente con ejemplos ya etiquetados. La utilidad de los emoticonos quedó clara: el algoritmo que había sido entrenado usándolos desde un principio era mucho mejor en la detección de contenido sarcástico que el que no lo había sido. Los investigadores indican que harán público el algoritmo para que cualquiera pueda utilizarlo
Para probar la eficacia de DeepMoji, los investigadores lo pusieron a prueba con varios ejemplos de referencia para comprobar cómo detectaba el sentimiento y la emoción subyacentes de un texto. El resultado fue que el nuevo algoritmo funciona mucho mejor que los mejores algoritmos existentes.
También lo probaron con humanos. El equipo reclutó voluntarios a través de la web de colaboración abierta Mechanical Turk y, de nuevo, verificaron que DeepMoji era mejor que las propias personas para detectar el sarcasmo y otras emociones en Twitter: un 82% de precisión del algoritmo contra un 76% de los voluntarios humanos.
Foto: El sitio web DeepMoji puede generar automáticamente un emoji para un tweet.
"Puede que esté aprendiendo toda las jergas existentes en la red", dice Felbo, el estudiante que ha participado en el diseño y desarrollo de los algoritmos. "La gente tiene usos muy interesantes del lenguaje [en Twitter], digámoslo así".
Los investigadores han lanzado el sitio web DeepMoji para mostrar esa parte emoji del sistema. En él, se puede agregar automáticamente un emoticono adecuado para un trozo de texto. En general, parece que funciona bastante bien, aunque cuando se trata de introducir el infame "covfefe" tweet de Donald Trump, el algoritmo se muestra tan desconcertado como todo el mundo.
El sitio web también permite a los usuarios contribuir a la investigación anotando sus propios tweets con emociones. Esta es una parte importante del trabajo, dice Rahwan. Por lo general, los investigadores tienen voluntarios que etiquetan los comentarios y mensajes de otras personas con la emoción que ellos mismos perciben, lo que proporciona una medida menos directa. "Estos puntos de referencia no captan lo que los psicólogos consideran el sentimiento verdadero", explica.
El director del Instituto de Ciencias Sociales Cuantitativas de la Universidad de Harvard y experto en minería de redes sociales sobre el significado, Gary King, dice que el uso de emoji como un medio de entrenamiento para los algoritmos es una idea inteligente. Sin embargo, se pregunta si realmente es valioso identificar los matices sarcásticos si son tan sutiles que ni la mayoría de las personas los perciben. "Si el sarcasmo es tan enrevesado que ni un lector humano probablemente lo entienda, entonces realmente no importa", indica.
Sin embargo, el estudio refleja el hecho de que los ordenadores están mejorando gradualmente en la detección de la emoción humana. El análisis del sentimiento en textos ya es una técnica ampliamente utilizada que, por ejemplo, puede ayudar a las empresas a determinar si un cliente está particularmente enfadado a partir del contenido de correo electrónico o de un chat .
Puede cada vez sea más común que los ordenadores intenten descifrar nuestras emociones: imagina, tal vez, un compañero de trabajo robótico que perciba cuándo sus colegas están frustrados o cuándo sueltan un comentario sarcástico.
"Si las máquinas van a cooperar con nosotros, entonces tendrán que entendernos, e interpretar nuestras emociones es realmente difícil", dice Rahwan.