Adjetivos asociados con términos masculinos y femeninos en las novelas preseleccionadas para los Premios Man Booker

Computación

El 'big data' revela que las novelas están llenas de sesgos de género

Un análisis de los resúmenes de los libros nominados al Premio Man Booker revela que las mujeres suelen describirse con términos como 'guapa', 'soltera' y 'bonita', y suelen tener profesiones de menor nivel que los hombres como 'enfermera', 'maestra' y muy comúnmente, 'prostituta'

por Emerging Technology From The Arxiv | traducido por Mariana Díaz
16 Agosto, 2018

El sesgo de género es un problema para toda la sociedad. Cuando más salta a la vista es en casos de discriminación deliberada, pero también se produce mediante un sesgo inconsciente generalizado. De esta forma, la discriminación sexista se va impregnando en nuestra cultura, nuestros lugares de trabajo e incluso nuestro lenguaje, a veces de formas de las que ni siquiera somos conscientes.

El primer paso para cambiar la situación consiste en identificar dónde se producen los sesgos. Y es aquí donde la ciencia emergente de la lingüística computacional está resultando útil.

Esta disciplina relativamente nueva utiliza la extracción de datos y el aprendizaje automático para estudiar datos de texto. Gracias a ella, estamos empezando a descubrir sesgos en todas partes, desde en artículos de Wikipedia hasta en el lenguaje en sí.

[Imagen: Adjetivos asociados con términos masculinos y femeninos en las novelas preseleccionadas para los premios Man Booker.]

Ahora, el equipo de la investigadora del centro de investigación de IBM Nishtha Madaan ha dado un paso más allá. La responsable afirma que han utilizado la técnica para descubrir un sesgo de género importante en los libros nominados al Premio Man Booker, uno de los galardones literarios más importantes del mundo, otorgado cada año a la mejor novela original escrita en inglés.

Su enfoque es relativamente sencillo. Madaan y su equipo han analizado todos los libros preseleccionados para el premio entre 1969 y 2017, unas 275 novelas en total. En lugar de analizar el texto de la novela, el equipo estudió la descripción de los libros publicada en Goodreads. Este catálogo virtual propiedad de Amazon ofrece acceso gratuito a descripciones, reseñas y calificaciones de más de 400 millones de libros.

El siguiente paso fue analizar cómo estas descripciones retrataban a hombres y mujeres, y la respuesta ha resultado ser bastante incómoda. "El análisis revela la omnipresencia de los prejuicios y estereotipos de género en los libros sobre diferentes características como la ocupación, las presentaciones y las acciones asociadas a los personajes del libro", explican Madaan y su equipo.

Para empezar, estos libros mencionan mucho menos a mujeres que a hombres, en promedio alrededor de 15 veces frente a 30 para los hombres.

Además, ambos géneros se describen de manera muy diferente. Para mostrar cómo, Madaan y su equipo extrajeron los adjetivos más asociados con personajes masculinos y femeninos en el texto. Luego crearon nubes de palabras para mostrar qué términos aparecen más a menudo para cada sexo.

Estas nubes de palabras se muestran en el gráfico de la imagen superior, y no hace falta dar un premio por adivinar qué gráfico corresponde a cada género. Más allá de algunos adjetivos comunes, mientras que el de los hombres está dominado por términos como 'brillante', 'salvaje', 'viejo', 'volátil', 'rico, y 'famoso', entre otros; el de las mujeres está compuesto por adjetivos como 'hermosa', 'soltera', 'solitaria', 'bonita' y 'guapa'.

El equipo también ha analizado los estereotipos en función de la profesión de los personajes. Las principales ocupaciones para los hombres son: doctor, médico, cirujano, psicólogo, profesor, científico, comercial, director, etcétera. Por el contrario, las principales ocupaciones para las mujeres son: maestra, profesora, enfermera, puta, prostituta, esposa infantil, novia infantil, etcétera.

"Al analizar las profesiones de hombres y mujeres descrubrimos los roles de mayor nivel se asignan a los hombres, mientras que los roles de menor nivel se asignan a las mujeres", explican Madaan y su equipo.

Sin embargo, hay algunos indicios que parecen sugerir un cambio positivo. El equipo dice que en los últimos años, algunos de los libros nominados son las mujeres desempeñan un papel central en el texto. Estos incluyen: Do not Say We Have Nothing de Madeleine Thien, How to be Both de Ali Smith, We Are All Completely Beside Ourselves por Karen Joy Fowler, entre otros.

Es un trabajo interesante pero tiene algunas deficiencias. La más significativa es que el equipo no describe claramente los datos que ha reunido, el tamaño de esta base de datos, cuándo o quién la escribió. Eso hace que el trabajo sea difícil de evaluar.

Por ejemplo, puede ser que las descripciones de los libros no estén escritas por los propios autores, sino por un corresponsal de Goodreads. Por lo tanto, el sesgo podría provenir de este corresponsal en lugar de reflejar el libro. Los autores no parecen haber explorado esta posibilidad.

Y, por supuesto, los autores de los libros podrían argumentar que sus novelas exploran el sesgo y su impacto en la sociedad. Por esta razón, las novelas deben reflejar este sesgo en el texto. Y también podrían alegar que nunca fue su intención producir una novela de género neuto, por ejemplo.

Sin embargo, el trabajo demuestra el potencial de explorar el sesgo laboral culturalmente significativo. De hecho, los autores ya han utilizado esta técnica para explorar el sesgo en los guiones de las películas de Bollywood, y han encontrado estereotipos de género importantes, particularmente con respecto a las ocupaciones.

El equipo también está desarrollando un mecanismo para eliminar el sesgo. No está claro si será muy útil para las novelas preseleccionadas para el premio Man Booker. Pero sin duda sirve para resaltar un problema que indudablemente necesita más atención.

Ref: arxiv.org/abs/1807.10615 : Judging a Book by its Description: Analyzing Gender Stereotypes in the Man Bookers Prize Winning Fiction

Computación

El 'big data' revela que las novelas están llenas de sesgos de género

Google anuncia un hito hacia la computación cuántica sin errores

El vídeo es el rey: bienvenido a la era del contenido audiovisual

Esta empresa quiere superar a Google e IBM en la carrera cuántica con un superordenador de fotones