El programa de composición de canciones combina aprendizaje estadístico y reglas explícitas, un enfoque que podría aplicarse a otros campos como la traducción y el diagnóstico médico
La cancioncilla de piano que hay más abajo, que asciende alegremente para terminar con un final melódico, se parece un poco a una canción publicitaria compuesta para la última campaña de pasta de dientes.
De hecho, esta canción fue compuesta por un programa musical de inteligencia artificial (IA) desarrollado por Google. Y sus últimas composiciones demuestran que la combinación entre un potente enfoque de aprendizaje automático y unas sencillas reglas musicales puede generar obras creativas que suenan increíblemente humanas.
La composición musical es una forma enigmática de creatividad humana. Ya existen programas de composición musical, pero normalmente siguen un conjunto específico de reglas y tienden a producir canciones que suenan rígidas y mecánicas. Lo mismo puede decirse del software que recomienda música en función de los hábitos de reproducción del usuario (ver Las máquinas son cada día más inteligentes, pero aún no pueden con la música). Enseñar a los ordenadores a ser más creativos musicalmente podría demostrar nuevas formas para que las máquinas colaboren en otras tareas de imaginación, desde el diseño de productos hasta la redacción de textos elocuentes.
Google ha ya había presentado su cancionero de inteligencia artificial, que forma parte de un proyecto llamado Magenta y está dirigido a impulsar la creatividad artificial (ver Google logra la creatividad artificial con una máquina que compone música). Una gran red neuronal es alimentada con decenas de miles de canciones y se entrena para predecir la próxima nota de una secuencia. Tal red también puede generar música nueva cuando se le proporciona un punto de partida, aunque los resultados tienden a carecer de estructura y gracia.
El investigador científico de Google Douglas Eck, que lidera el desarrollo del compositor musical artificial junto a la becaria Natasha Jaques, descubrió recientemente una manera de lograr que los sistemas de composición produzcan canciones mucho más elegantes y pegadizas. Emplean un enfoque conocido como el aprendizaje reforzado para añadir sencillos principios de la teoría musical (evitar repetir una estrofa demasiadas veces, no definir un ritmo demasiado lento ni demasiado rápido, y así sucesivamente) al proceso de aprendizaje. La red recibe una recompensa cada vez que produce una secuencia de notas que no sólo se parezca a los patrones vistos en canciones anteriores, sino que también se adhiera a las reglas musicales que se le haya proporcionado.
"Son reglas sencillas sacadas de un libro de texto de composición musical", explica Eck. El responsable continúa: "La combinación de estas reglas con el aprendizaje reforzado, y la variación del mundo real, que proviene de miles de composiciones humanas, nos proporciona canciones tan pegadizas que de alguna manera nos ponen los pelos de punta".
El nuevo enfoque, descrito en un trabajo de investigación y una actualización de blog, desde luego parece mejorar la generación automatizada de música. Otro fragmento demuestra que, además, el sistema también puede funcionar sin unas reglas marcadas. La obra resultante parece excesivamente simple, repetitiva y mecánica. Eck y Jaques también realizaron un estudio de usuario y descubrieron que la gente prefiere con creces las composiciones realizadas con la nueva técnica.
Eck dice que la capacidad de incrustar reglas en el aprendizaje reforzado resultará útil en muchas áreas, como la robótica, los sistemas de recomendaciones y las traducciones automatizadas.
"No hay razón para que las máquinas no puedan ser curiosas y creativas", asegura el profesor de la Universidad de Lugano (Suiza) Jürgen Schmidhuber, que realizó una investigación pionera sobre el tipo de redes neuronales utilizadas por los investigadores de Google, y que ha experimentado con la creatividad a través del aprendizaje reforzado. Schmidhuber añade que el enfoque podría tener un abanico de aplicaciones prácticas más allá de la música. "Uno podría imaginarse combinaciones similares de [redes neuronales] y sistemas expertos basados en reglas para los diagnósticos médicos", sugiere.
El aprendizaje reforzado permite enseñar a las máquinas hacer cosas que resultarían difíciles de lograr mediante la instrucción explícita. La técnica fue empleada por AlphaGo, un programa desarrollado por investigadores de Google para jugar al antiguo juego de mesa Go. Mientras que las reglas de Go son sencillas, resulta difícil explicar qué hay que hacer para jugar bien, y los jugadores normalmente desarrollan una aptitud intuitiva forjada a base de muchas horas de práctica. Pero a veces podría ser útil poder proporcionar instrucciones explícitas a un sistema de aprendizaje de máquinas.
El profesor de psicología de la Universidad de Quebec (Canadá) Stevan Harnad, que ha estudiado la creatividad artificial, dice que el trabajo de Magenta es impresionante pero añade que aún queda mucho camino por recorrer antes de que se les pueda atribuir el mérito a los ordenadores de una creatividad real que rivalice con la humana. "Los algoritmos de aprendizaje profundo son muy prometedores, pero hasta ahora no han replicado la capacidad creativa humana común, por lo que resulta un poco prematuro esperar que sean creativos", concluye.
De hecho, como señala Harnad, incluso composiciones como las que genera el equipo de Google a menudo suenan mecánicas tras escucharlas varias veces.