Una investigación logra clasificar la música mediante sus archivos digitales, algo muy útil para recomendaciones como las de Spotify
Para los matemáticos, los detalles de un mensaje son irrelevantes. Lo único que importa es que el menaje se pueda considerar como un conjunto ordenado de símbolos. Hace mucho que los matemáticos saben que este conjunto está gobernado por unas leyes básicas detalladas por Claude Shannon en su teoría matemática de la comunicación.
El trabajo de Shannon revolucionó la forma en la que los ingenieros contemplaban la comunicación y tuvo consecuencias de gran alcance en otras áreas también. El lenguaje incluye la transmisión de información de un individuo a otro, y la teoría de la información proporciona una ventana por la que estudiar y entender su naturaleza. En la computación, los datos son transmitidos desde una ubicación a otra y la teoría de la información proporciona una piedra angular que permite que esto se haga de la forma más eficiente. Y en la biología, la reproducción se puede considerar como la transmisión de información genética de una generación a la siguiente.
La música también se puede considerar como la transmisión de información de una ubicación a otra, pero los científicos han tenido menos éxito en la aplicación de la teoría de la información para caracterizar la música y estudiar su naturaleza.
Hoy, eso cambia gracias al trabajo de Gerardo Febres y Klaus Jaffé de la Universidad Bolívar de Venezuela. Han encontrado una manera de utilizar la teoría de la información para desmenuzar la naturaleza de ciertos tipos de música y para clasificar de forma automática distintos géneros musicales, una tarea famosamente difícil dentro de la informática.
La música es tan difícil de estudiar porque no se traduce fácilmente a un conjunto ordenado de símbolos. A menudo consiste en muchos instrumentos que tocan distintas notas a la vez. Cada uno puede tener varias calidades de timbre, volumen y así.
Captar todo esto en un conjunto de símbolos, junto con cualquier interpretación que le añada el músico, es una tarea complicada. No ha evitado que lo intenten los investigadores, aunque con un grado limitado de éxito.
Febres y Jaffé abordan este problema de un modo sencillo mediante un estándar común para digitalizar la música llamado MIDI (musical instrument digital interface). Un archivo MIDI es una representación digital de una pieza de música que puede ser leída por un amplio abanico de ordenadores, reproductores de música e instrumentos electrónicos.
Cada fichero contiene datos sobre el tono y la velocidad musical, el volumen, el vibrato y así de una pieza musical. Esto permite que la música creada en un sitio se reproduzca de forma precisa en otro lugar.
Pero un fichero MIDI en sí es simplemente una serie ordenada de 0 y 1, y esto les proporcionó a Febres y Jaffé una manera de analizarlo mediante la teoría estándar de la información. De hecho, simplemente abrieron cada fichero como un documento de texto (.txt) y leyeron la secuencia resultante de símbolos aparentemente asignados al azar.
La belleza de la teoría de la información es que las herramientas desarrolladas para comprimir los mensajes enviados a Marte o para analizar los componentes de un idioma se pueden aplicar igualmente a cualquier conjunto de símbolos. Y eso es precisamente lo que han hecho Febres y Jaffé.
Empezaron por comprimir cada conjunto de símbolos hasta el mínimo número necesario para generar la música original. Este conjunto de base entonces les permitió medir la entropía o contenido de información asociado con cada pieza de música.
Pero también estudiaron la manera en la que esta entropía varió en el tiempo. De hecho, estudiaron cómo esta entropía de segundo orden varió en 450 piezas de 71 compositores y 15 períodos o estilos distintos de música.
Para su sorpresa, descubrieron que el mismo género compartía valores similares para esta entropía de segundo orden. Al mismo tiempo, este tipo de análisis muestra cómo han evolucionado los géneros musicales con el paso del tiempo.
Es un trabajo interesante que proporciona una nueva manera fascinante para estudiar la música. Existen algunas limitaciones, por supuesto. Mientras que algunos géneros musicales son claramente identificables por este método, otros estilos aparentemente distintos se solapan.
Por ejemplo, la música Raga de Venezuela y la India ocupan regiones únicas en este espacio de parámetros. Varios compositores clásicos también ocupan regiones específicas y por tanto tienen el potencial de ser identificados por este método.
Pero por lo general, la música rock y la música clásica se solapan fuertemente, dificultando que sean identificados de forma automática. Puede que futuros trabajos mejoren las cosas, quizás al aumentar el tamaño de la base de datos por ejemplo.
No obstante, Febres y Jaffé han logrado un avance significativo con el uso de una técnica que debería ser ampliamente aplicable. Su próximo trabajo, si eligen seguir adelante, sería encontrar una manera de aplicar su método, quizás para sistemas de recomendaciones musicales, antes de que otros se unan a la fiesta.
Ref: arxiv.org/abs/1510.01806: Music Viewed by Its Entropy Content: A Novel Window for Comparative Analysis