This research addresses the automatic generation of jazz drum solos using Transformer models, a relatively unexplored field where the drum has traditionally played a secondary role. The study focuses on developing and evaluating a model capable of emulating rhythmic solos characteristic of jazz. To this end, two datasets were created: one comprising 200 drum solos in MIDI format, representative of different jazz eras and styles, and another synthetic dataset expanded to 2000 entries through algorithmic modifications. These publicly available datasets constitute a valuable resource for future research in musical generation and computational analysis. The implemented model, based on DistilGPT-2, was trained with different configurations of token size (500 and 1000) and training epochs (6, 9, and 12). The results showed that the configuration with 500 tokens and 6 epochs achieved the best performance, with a 50% efficacy in generating solos classified as authentic by expert evaluators. However, qualitative evalua- tion revealed limitations in aspects such as structural coherence and musical expressiveness, where human-generated solos outperformed the AI-generated ones in style and consistency. In contrast, the generated solos stood out in originality, suggesting that artificial intelligence can contribute novel ideas, albeit with less stylistic cohesion. The main identified limitations include the uneven distribution of historical data, the model’s constraints in capturing expressive nuances, and the limitations in evaluation protocols. As future work, it is proposed to expand and balance the dataset, explore hybrid architectures combining Transformers with explicit musical knowledge, and optimize evaluation methods by integrating computational style metrics. The results of this study represent a significant ad- vancement in the integration of artificial intelligence into musical creation, while underscoring the complexity of emulating the artistic and expressive richness of professional musicians. Keywords: Jazz, drums, solos, Transformer, AI.
En esta investigación se aborda la generación automática de solos de batería de jazz utilizando modelos Transformer, un campo poco explorado, donde tradicionalmente la batería ha ocupado un rol secundario. El estudio se centra en desarrollar y evaluar un modelo capaz de emular solos rítmicos propios del jazz. Para ello, se crearon dos bases de datos: una con 200 solos de batería en formato MIDI, representativos de distintas épocas y estilos del jazz, y otra sintética ampliada a 2000 entradas mediante modificaciones algorítmicas. Estas bases de datos, disponibles públicamente, constituyen un recurso valioso para futuras investigaciones en generación musical y análisis computacional. El modelo implementado, basado en DistilGPT-2, fue entrenado con diferentes configuraciones de tamaño de token, 500 000, y épocas de entrenamiento; 6, 9 y 12. Los resultados mostraron que la configuración con 500 tokens y 6 épocas alcanzó el mejor rendimiento, con un 50 % de eficacia en la generación de solos clasificados como auténticos por evaluadores expertos. Sin embargo, la evaluación cualitativa reveló limitaciones en aspectos como la coherencia estructural y la expresividad musical, donde los solos humanos superaron a los generados en estilo y coherencia. En contraste, los solos generados destacaron en originalidad, sugiriendo que la inteligencia artificial puede aportar ideas novedosas, aunque con menor cohesión estilística. Las principales limitaciones identificadas incluyen la distribución desigual de los datos históricos, las restricciones del modelo para capturar matices expresivos y las limitaciones en los protocolos de evaluación. Como trabajo futuro, se propone expandir y equilibrar la base de datos, explorar arquitecturas híbridas que combinen Transformers con conocimiento musical explícito, y optimizar los métodos de evaluación integrando métricas computacionales de estilo. Los resultados de este estudio representan un avance significativo en la integración de la inteligencia artificial en la creación musical, aunque subrayan la complejidad de emular la riqueza artística y expresiva de los músicos profesionales. Palabras clave: Jazz, batería, solos, Transformer, inteligencia artificial, generación musical, MIDI, evaluación cualitativa.
Beziehungen
Beschreibungen
| Attributname | Werte |
| Creador |
|
| Mitwirkende |
|
| Tema |
|
| Editor |
|
| Idioma |
|
| Stichwort |
|
| Año de publicación |
|
| Tipo de Recurso |
|
| Derechos |
|
| División académica |
|
| Línea académica |
|
| Licencia |
|