Síntesis estadística paramétrica de voz Pubblico Deposited

La síntesis estadística paramétrica de voz es una técnica de producción de voces artificiales que utiliza como modelo matemático dominante los Modelos Ocultos de Markov sobre una representación paramétrica del habla. Esto permite que una voz pueda ser codificada utilizando parámetros espectrales, de frecuencia fundamental y de duración de sus unidades fon éticas, para luego entrenar los modelos matemáticos que permitan producir nuevas frases, con ventajas significativas sobre otros procedimientos de síntesis de voz, tales como su mayor flexibilidad y menor requerimiento en almacenamiento. En este trabajo se presenta el desarrollo teórico, la adaptación a nivel lingüístico y computacional y una propuesta de extensiva de experimentación y evaluación de voces artificiales producidas a partir de síntesis estadística paramétrica de voz, en una variante de español latinoamericano. Para este fin se han definido una serie de contextos de implementación y se han adaptado y desarrollado aplicaciones computacionales como aportes a distintos niveles, desde la extracción de información hasta la evaluación de resultados. Esto ha permitido plantear una gran cantidad de experimentos para estudiar la influencia de diversos factores a la calidad de voces obtenidas. Los principales aportes del proyecto son: La documentación de los elementos teóricos y prácticos para la creación de voces utilizando las síntesis estadística paramétrica. De acuerdo con el estudio de referencias realizado, este documento constituye el primer aporte a la documentación de ambos aspectos. En segundo lugar la creación de programas para la extracción y análisis de parámetros y para la evaluación de resultados, además de las aplicaciones desarrolladas para probar las voces en situaciones reales. En tercer lugar la incorporación de parámetros acústicos como elementos de evaluación de voces sintetizadas, así como pruebas de significancia estadísticas entre estos y voces originales para evaluar la calidad de los resultados. Y finalmente, se han identificado áreas de potencial desarrollo a partir de la incorporación de métodos heurísticos y otros de inteligencia computacional para mejorar los procesos de creación de voces y su evaluación.

Le relazioni

In Impostazione amministrativa:

descrizioni

nome attributoValori
Creador
Contributori
Tema
Editor
Idioma
Identificador
Parola chiave
Año de publicación
  • 2014
Tipo de Recurso
Derechos
División académica
Línea académica
Licencia
Ultima modifica: 12/13/2023
citazioni:

EndNote | Zotero | Mendeley

Elementi