Reconocimiento de géneros musicales aplicando técnicas de aprendizaje maquinal

Ramírez Gómez, Miguel Ángel

Reconocimiento de géneros musicales aplicando técnicas de aprendizaje maquinal Public Deposited

La intersección entre la música, el aprendizaje maquinal y el procesamiento de señales ha permitido abordar un amplio rango de tareas como la identificación automática de canciones, instrumentos, género o artista. En particular, la identificación de géneros musicales es una técnica que utiliza la mayoría de los sistemas de reproducción de música digital para gestionar las canciones que los mecanismos guardan. Dado el gran número de piezas musicales que se pueden almacenar, la localización de una canción en particular puede llegar a ser complicada si el conjunto no se encuentra organizado adecuadamente; la generación de listas de reproducción requieren de sistemas que categoricen con un alto grado de confianza las canciones a elegir. Un Sistema de Reconocimiento de Géneros Musicales (SRGM) requiere de un conjunto de elementos musicales, una selección de características que describan los géneros musicales y un método de clasificación. La tarea se dificulta por la limitada disponibilidad de los datos (canciones) para su uso en investigación debido a aspectos de propiedad intelectual. En este proyecto se comparó el rendimiento de diferentes métodos de aprendizaje maquinal para definir un SRGM, incluyendo los basados en la teoría de la creencia profunda. Se utilizó la base de datos Million Songa Dataset (MSD) para la experimentación y se eligieron los géneros musicales a reconocer con base en criterios establecidos previamente. Se llevó a cabo un procesamiento para generar un vector de atributos de menor dimensión con las características más relevantes de la base de datos. Se analizaron y experimentaron diferentes técnicas de aprendizaje maquinal como K-medias, perceptrón, máquinas de soporte vectorial y redes de creencia profunda. Se encontró que las características timbre, pitches e intensidad fueron las que ofrecieron buenos resultados; en particular los primeros 4 coeficientes del timbre así como la aplicación de la media a los vectores de características mejoraron los resultados en la clasificación en varios casos. El sistema que mejores resultados ofreció fue el compuesto por una red de creencia profunda con los atributos de medias y varianzas normalizadas de pitch, timbre e intensidad sobre un conjunto de 6 géneros musicales como clases. El uso de atributos tomados de una base de datos descriptiva como lo es MSD permitió aprecia el aporte de las características acústicas al reconocimiento de géneros, lo cual da la idea de seguir con la experimentación en datos directos de audio.

Des relations

Dans l'ensemble administratif:	Tesis Posgrado

Descriptions

Nom d'attribut	Valeurs
Creador	Ramírez Gómez, Miguel Ángel
Contributeurs	Martínez Trinidad, José Francisco Martínez Licona, Fabiola Margarita Martínez Licona, Alma Edith
Tema	Organización de la información Sistemas de almacenamiento y recuperación de información -- Música Information storage and retrieval systems -- Music Information organization Tecnología de la información Metadata Information technology Mineria de datos Metadatos Data mining
Editor	Universidad Autónoma Metropolitana
Idioma	spa
Identificador	https://doi.org/10.24275/uami.4j03cz86x
Mot-clé	Géneros musicales Aprendizaje maquinal
Año de publicación	2016
Tipo de Recurso	info:eu-repo/semantics/masterThesis
Derechos	Acceso Abierto
División académica	Ciencias Basicas e Ingenieria
Línea académica	Ciencias y Tecnologias de la Informacion
Licencia	Atribucion-NoComercial 4.0 Internacional (CC BY-NC 4.0)

Analytics

Dernière modification: 12/15/2023

Citations:

EndNote | Zotero | Mendeley

Articles

La vignette	Titre	Date de téléchargement	Visibilité	actes
	UAMI17282.pdf	2021-02-17	Public	Download