.

Otros

Este algoritmo rapea mejor que los propios humanos

1

DeepBeat analiza las rimas del rap para generar otras de mayor calidad y frecuencia, aunque su coherencia aún no es tan buena

  • por The Physics Arxiv Blog | traducido por Francisco Reyes
  • 22 Mayo, 2015

La antigua habilidad de crear y representar rimas habladas está más viva que nunca gracias al inexorable aumento en la popularidad del rap. Esta forma de arte se distingue de la poesía hablada común en que se hace siguiendo un ritmo, a menudo con música de fondo.

Los artistas sobresalen en este campo. El profesor de inglés de la Universidad de Colorado (EEUU), Adam Bradley, describe el rap con toda clase de elogios. Rapear, dice, es un arte que requiere "intrincadas estructuras de sonido y rima, para crear algunos de los poemas más escrupulosamente formales compuestos hoy día".

La naturaleza altamente estructurada del rap hace que sea especialmente bueno para el análisis informático. Y eso plantea una cuestión interesante: si los ordenadores pueden analizar letras de rap, ¿también pueden generarlas?

Una respuesta afirmativa nos llega gracias al trabajo de Eric Malmi en la Universidad de Aalto en Finlandia. Su equipo ha entrenado a un algoritmo de aprendizaje de máquinas para reconocer las características destacadas de varias frases de rap y luego elegir otra frase que rime de la misma forma sobre el mismo tema. El resultado es un algoritmo que produce letras de rap capaces de rivalizar con las generadas por humanos en cuanto a complejidad de rima.

En el rap hay varias formas de rima pero la más común, y la que ayuda a distinguirlo de otras formas de poesía, se llama rima asonante. Es la repetición de sonidos vocálicos similares como en las palabras "crazy" y "baby", que comparten dos sonidos vocálicos similares. (Esto se diferencia de la consonancia, que utiliza sonidos consonantes similares, como en "pitter patter" y también es distinta de la rima perfecta, en la que las palabras comparten el mismo sonido final, como en "slang" y "gang").

Debido a su prevalencia en el rap, Malmi y su equipo se centraron exclusivamente en la forma asonante que aparece en las letras. Pero también asumieron una forma altamente estructurada de verso consistente en 16 frases, cada una de las cuales equivale a un compás musical y que, por tanto, está hecha de cuatro tiempos. Normalmente, aunque no siempre, las frases riman al final.

Para entrenar a su algoritmo de aprendizaje de máquinas, comenzaron con una base de datos de más de 10.000 canciones de más de 100 artistas de rap.

Detectar las rimas asonantes no es difícil. Las primeras palabras deben convertirse en fonemas (suponiendo una pronunciación típica de inglés americano). Después encontrar rimas es simplemente una cuestión de explorar los fonemas y buscar vocales que suenen de forma similar ignorando sonidos y espacios de consonantes.

Esto sugiere inmediatamente una forma de clasificación de la complejidad de las letras. Malmi y su equipo buscan secuencias de sonidos vocálicos que coincidan en aproximadamente las dos frases anteriores. A continuación definen la "densidad de rima" como el promedio de todas las secuencias más largas de la letra.

Esta medida les ha permitido clasificar a todos los artistas de rap en su base de datos según su densidad de rima. Los tres raperos que encabezan la lista son Inspectah Deck, Rakim y Redrama. A Rakim, en particular, se le conoce por sus rimas multisilábicas.

Curiosamente, el rapero Eminem, que también es famoso por sus rimas multisilábicas, tiene un puesto sorprendentemente bajo en la lista. Eso se debe probablemente a que Eminem a menudo consigue sus rimas "doblando" las palabras, un truco que esta técnica no permite.

Sin embargo, esta métrica es una medida interesante de la habilidad para rimar de un rapero, y el equipo puede usarla para comparar sus raps automatizados con los generados por humanos.

Después le dan una tarea a su algoritmo de aprendizaje de máquinas, llamado DeepBeat. Tras analizar la base de datos, su objetivo es analizar una secuencia de frases de una letra de rap y luego elegir la siguiente frase de una lista con frases elegidas al azar de otras canciones, además de la frase real.

Lo hace sorprendentemente bien. "Conseguimos un 82% de precisión a la hora de separar la verdadera frase siguiente de una frase elegida al azar", afirman Malmi y sus colaboradores.

No está nada mal e inmediatamente sugiere una forma de generar canciones automáticamente. Malmi y sus colegas empiezan con una frase de letra de rap y le piden al ordenador que busque en la base de datos otra frase sobre el mismo tema que rime bien. Después se repite este proceso para la frase siguiente y así sucesivamente.

Los resultados son bastante reveladores. Aquí está uno generado por DeepBeat sobre el tema del amor, en inglés:

For a chance at romance I would love to enhance
But everything I love has turned to a tedious task
One day we gonna have to leave our love in the past
I love my fans but no one ever puts a grasp
I love you momma I love my momma - I love you momma
And I would love to have a thing like you on my team you take care
I love it when it's sunny Sonny girl you could be my Cher
I'm in a love affair I can't share it ain't fair
Haha I'm just playin' ladies you know I love you.
I know my love is true and I know you love me too
Girl I'm down for whatever cause my love is true
This one goes to my man old dirty one love we be swigging brew
My brother I love you Be encouraged man And just know
When you done let me know cause my love make you be like WHOA
If I can't do it for the love then do it I won't
All I know is I love you too much to walk away though

Es impresionante. Cada una de estas frases está tomada de otra canción de rap. Por ejemplo la frase final es de "Love the way you lie" de Eminem. Juntas, forman una letra original.

Además, este y otros raps generados po DeepBeat tienen una densidad rítmica significativamente más alta que la de cualquier rapero humano. "DeepBeat supera a los mejores raperos humanos en un 21% en términos de duración y frecuencia de las rimas de las letras producidas", señalan.

Donde DeepBeat tiene problemas es en la coherencia de la narración, algo que no sorprende puesto que pone casi toda su atención en la rima. Seguro que ya se encargará de eso en el futuro.

Ref: arxiv.org/abs/1505.04771: DopeLearning: A Computational Approach to Rap Lyrics Generation

Otros

  1. Robotaxis

    Las 10 Tecnologías Emergentes 2025: los coches sin conductor solicitados mediante 'apps' se extienden a más ciudades

  2. Combustible más limpio para aviones

    Las 10 Tecnologías Emergentes 2025: los combustibles alternativos fabricados a partir de desechos industriales o dióxido de carbono podrían ayudar a reducir las emisiones climáticas de la aviación

  3. Robots que aprenden rápido

    Las 10 Tecnologías Emergentes 2025: los avances de la IA han hecho que sea más rápido que nunca entrenar a los robots para realizar nuevas tareas