Cadenas de bloques y aplicaciones
Cómo Urban Dictionary está transformando la lengua y la cultura popular
Un estudio podría demostrar que las definiciones de Urban Dictionary y otros diccionarios 'online' no solo describen la realidad, sino que pueden crearla. ¿Podemos fiarnos de los términos definidos por usuarios anónimos?
Urban Dictionary es un sitio web de crowdsourcing que registra nuevas palabras y sus significados. Comenzó su andadura en 1999 como una parodia de Dictionary.com y se ha convertido en un importante recurso en internet. Para muestra, un botón: unos jueces en Reino Unido usaron el sitio en 2005 para entender la jerga usada por dos raperos involucrados en un caso.
Parte del atractivo de Urban Dictionary es su tono informal, que permite tanto definiciones como descripciones de palabras y opiniones, que a veces pueden llegar a ser ofensivas. La web caza nuevas palabras rápidamente y registra muchas de las variaciones que surgen con el tiempo, y un sistema de votación permite a los usuarios mostrar su apoyo o su rechazo, creando un ranking basado en la popularidad de los términos. Hoy en día, millones de usuarios confían en el sitio para mantenerse actualizados con la jerga, el uso común de las palabras y la cultura popular.
Por supuesto, Urban Dictionary tiene sus defectos. En ausencia de guías de estilo, editores y moderadores, el contenido puede ser impreciso y vago. Además, se sabe poco sobre los usuarios que publican nuevas palabras y si las entradas reflejan cambios reales en el idioma o solo los que afectan a un pequeño subconjunto de personas. Teniendo esto en cuenta, ¿cuánta calidad podemos decir que tiene Urban Dictionary a la hora de captar nuevas palabras? ¿Es mejor que los métodos convencionales para producir diccionarios en línea?
Hoy recibimos una respuesta gracias al trabajo de Dong Nguyen y sus colegas en el Instituto Alan Turing en Londres (Reino Unido), que compara el Urban Dictionary y su contenido con Wiktionary, otro diccionario basado en la colaboración masiva o crowdsourcing. "Hasta donde sabemos, este es el primer estudio sistemático de Urban Dictionary en esta escala", afirman.
Wiktionary es una comparación interesante porque aporta una perspectiva mucho más formal para el crowdsourcing. Se trata de un sitio hermano de Wikipedia, dirigido por la misma organización, Wikimedia. Esta web registra solo definiciones de palabras y ofrece unas pautas concretas sobre cómo deben crearse. También guía a los usuarios sobre lo que constituye exactamente una definición y hay unos moderadores que editan el contenido, controlan el vandalismo y ayudan a generar contenidos de alta calidad. Como era de esperar, Wiktionary también se ha convertido en un importante recurso en línea que cada vez más investigadores utilizan para el procesamiento de lenguaje natural (ver Microsoft logra que una máquina entienda el lenguaje natural mejor que un humano), entre otras aplicaciones.
Nguyen y su equipo comenzaron a analizar el contenido del Urban Dictionary. Afirman que cuenta con 2.661.625 definiciones registradas de 1.620.438 palabras y frases. La mayoría de las palabras tienen una sola definición, pero algunas tienen más de mil. La palabra con el mayor número de definiciones es 'emo', con 1.204 significados. Y la definición principal es esta:
- Una palabra terriblemente mal interpretada y mal utilizada. En la cultura contemporánea se utiliza como un término amplio para describir a una multitud de niños y adolescentes que se alisan el cabello, se ponen el pelo en la cara, lo tiñen de negro y usan ropa ajustada. Por desgracia, esto es completamente inexacto. La música 'emo' real existía a finales de los ochenta y era un subgénero del punk rock hardcore; después de todo, 'emo' es un acortamiento de 'hardcore punk rock emotivo'. La gente en las primeras bandas emo se vestía como la gente común, chicos y chicas normales que simplemente tocaban música que disfrutaban. Tristemente, desde la fundación y existencia de Hot Topic, el término 'emo' se ha caracterizado incorrectamente por un poco más de una década. Tienes que preguntarte cómo se sienten las bandas originales acerca de las difamaciones y el malentendido masivo y el mal uso de su forma original.
Por el contrario, Wiktionary cuenta con cinco definiciones para 'emo':
- Un estilo particular del 'hardcore punk rock'.
- Un individuo o grupo de personas asociadas a esa subcultura y estilo musical.
- Cualquier forma de rock alternativo creado con guitarras que sea particular o notablemente emocional.
- Un individuo o grupo de personas asociadas con una moda o estereotipo de ese estilo de rock.
- Una persona joven que se considera demasiado emocional o estereotípicamente 'emo'.
La palabra con el siguiente número más alto de definiciones en Urban Dictionary es 'amor', con 1.140. Las otras palabras en el top 10 por número de definiciones son: 'dios', 'Urban Dictionary', 'chode', 'historia de Canadá', 'sexo', 'escuela', 'coño' y 'scene'. En términos de popularidad, los votos a favor superan ligeramente a los votos a la baja. Pero, según Nguyen y compañía, "hay una amplia variación entre las definiciones, con algunas que cuentan con diez veces más votos positivos que negativos y otros al revés".
El equipo también compara la cobertura léxica de Urban Dictionary y Wiktionary. Resulta que la coincidencia es sorprendentemente pequeña: el 72% de las palabras en Urban Dictionary no están registradas en Wiktionary. Sin embargo, el equipo señala que muchas palabras en Urban Dictionary son relevantes solo para un pequeño subconjunto de usuarios. Muchos son apodos o nombres propios como 'Dan Taylor', definido como "un hombre maravilloso que cocina el mejor estofado de ternera en todo el mundo". Estos términos suelen tener un solo significado.
Para estudiar palabras más comunes, el equipo comparó solo aquellas palabras que tienen dos o más definiciones. En ese caso, la coincidencia es mucho mayor: solo el 25% de las definiciones aparecen únicamente en Urban Dictionary. Por ejemplo, la palabra 'phased' ('gradual') aparece en ambos diccionarios como algo que se hace poco a poco, en distintas fases. En cambio, Urban Dictionary también incluye otros significados, como "una palabra que se usa cuando preguntas a alguien si quiere pelear" y "la fase en la que estás 'zumbado' cuando no estás borracho, pero tampoco sobrio".
En este análisis muchas más palabras aparecen solo en Wiktionary, alrededor del 69% de ellas. Nguyen y su equipo señalan que muchos de estos términos son entradas enciclopédicas como 'acacetin' (un metabolito de las plantas), 'dramaturgo' y 'sonetos de Shakespeare'. Esto lleva al equipo a una conclusión clara: "en general, podemos decir que la superposición entre los dos diccionarios es pequeña", concluyen.
Los significados de Urban Dictionary también incluyen opiniones, a diferencia de las de Wiktionary. Una definición de 'cerveza' es esta: "posiblemente lo mejor que jamás se haya inventado. LO DIGO EN SERIO." Para determinar qué proporción de definiciones son opiniones, el equipo hizo que los usuarios que alimentan este diccionario online evaluaran cada significado para determinar si era una opinión o una descripción y si estaban familiarizados con él. Así, descubrieron que hasta el 50% de las definiciones para nombres propios eran opiniones, y que los usuarios no estaban familiarizados con la mayoría de estos usos. También encontraron definiciones como 'el café': "una persona que es tosida encima".
Además, los usuarios descubrieron que gran parte del contenido de Urban Dictionary era ofensivo y que este contenido tendía a obtener votos más bajos."También descubrimos que las palabras con más definiciones solían ser más familiares para los usuarios, lo que sugiere que el contenido de Urban Dictionary refleja en cierta medida las tendencias más amplias en el uso del lenguaje", afirman Nguyen y compañía.
Este trabajo proporciona una ventana única a un sitio web que ha llegado a jugar un papel importante en la cultura popular. Por ello, debería establecer un marco teórico para otros estudios que podrían plantear si los diccionarios en línea no solo registran el cambio lingüístico, sino que lo impulsan, como sugieren algunos lingüistas. Tal vez algún día tengamos una respuesta.
Ref: arxiv.org/abs/1712.08647 : “Emo, Love, and God: Making Sense of Urban Dictionary, a Crowd-Sourced Online Dictionary”