Reconocimiento de emociones utilizando técnicas de aprendizaje maquinal Público Deposited

La señal de habla se caracteriza por su alta variabilidad, pues su producción queda condicionada por la ubicación y movimiento de los elementos en la cavidad oral y el rostro, y por variantes en parámetros como el acento regional, la condición social o el estilo personal. La expresión de emociones es otro de los elementos que enriquecen la comunicación humana, incluso se ha establecido que las palabras por sí mismas no aportan el significado completo del mensaje para un escucha, por lo que el análisis de los componentes paralingüísticos como la prosodia, la calidad de la voz, el ritmo e incluso las emociones con las que son dichas las palabras se ha vuelto importante. Con esto en mente, es que este trabajo aborda el problema del análisis y reconocimiento de emociones a partir de la señal del habla, utilizando técnicas de extracción de datos y aprendizaje maquinal. Con este fin se utilizaron métodos de computación afectiva, los cuales, desde la perspectiva de la interacción hombre-máquina, se enfocan en la detección, análisis y reconocimiento automático de las emociones a partir del comportamiento humano. Otra área importante es la biología, ésta nos dice que el cerebro funciona de forma profunda, dicha naturaleza, a la que llamaremos jerárquica, proviene de la observación de que generalmente las capas superiores representan conceptos cada vez más abstractos. Este paradigma profundo, plantea la hipótesis de que, con el fin de aprender las representaciones de alto nivel de los datos, se necesita una jerarquía de representaciones intermedias. Al mismo tiempo se ha sugerido que las arquitecturas profundas, son mucho más eficientes en términos de los elementos computacionales requeridos, que las arquitecturas simples o de poca profundidad, incluyendo los Modelos Ocultos de Markov, las Redes Neuronales con una sola capa oculta y las Máquinas de Soporte Vectorial entre otras. Es por esto, que el objetivo principal fue desarrollar un sistema de reconocimiento de emociones a partir de la señal del habla, mediante el uso de Redes de Creencia Profunda y Máquinas Restringidas de Boltzmann que clasificará señales de audio caracterizadas por un grupo de elementos propuestos. Para evaluar este sistema se desarrollaron distintos experimentos, que permitieron realizar una comparación con otros clasificadores ampliamente utilizados. Los resultados mostraron que nuestra propuesta se desempeña comparativamente mejor. De los resultados también se desprende una primera aproximación a la interpretación del funcionamiento de los distintos niveles de abstracción en la arquitectura profunda que hemos utilizado. La idea general detrás de la interpretación, es que si conocemos los mecanismos que intervienen en la clasificación de emociones mediante sistemas profundos, podremos determinar los parámetros y características que resulten convenientes para resolver el problema y con ello aumentar el desempeño del clasificador.

Relaciones

En Conjunto Administrativo:

Descripciones

Nombre del atributoValores
Creador
Colaboradores
Tema
Editor
Idioma
Identificador
Palabra Clave
Año de publicación
  • 2013
Tipo de Recurso
Derechos
División académica
Línea académica
Licencia
Última modificación: 12/12/2023
Citaciones:

EndNote | Zotero | Mendeley

Elementos