Síntesis estadística paramétrica de voz Público Deposited

La síntesis estadística paramétrica de voz es una técnica de producción de voces artificiales que utiliza como modelo matemático dominante los Modelos Ocultos de Markov sobre una representación paramétrica del habla. Esto permite que una voz pueda ser codificada utilizando parámetros espectrales, de frecuencia fundamental y de duración de sus unidades fon éticas, para luego entrenar los modelos matemáticos que permitan producir nuevas frases, con ventajas significativas sobre otros procedimientos de síntesis de voz, tales como su mayor flexibilidad y menor requerimiento en almacenamiento. En este trabajo se presenta el desarrollo teórico, la adaptación a nivel lingüístico y computacional y una propuesta de extensiva de experimentación y evaluación de voces artificiales producidas a partir de síntesis estadística paramétrica de voz, en una variante de español latinoamericano. Para este fin se han definido una serie de contextos de implementación y se han adaptado y desarrollado aplicaciones computacionales como aportes a distintos niveles, desde la extracción de información hasta la evaluación de resultados. Esto ha permitido plantear una gran cantidad de experimentos para estudiar la influencia de diversos factores a la calidad de voces obtenidas. Los principales aportes del proyecto son: La documentación de los elementos teóricos y prácticos para la creación de voces utilizando las síntesis estadística paramétrica. De acuerdo con el estudio de referencias realizado, este documento constituye el primer aporte a la documentación de ambos aspectos. En segundo lugar la creación de programas para la extracción y análisis de parámetros y para la evaluación de resultados, además de las aplicaciones desarrolladas para probar las voces en situaciones reales. En tercer lugar la incorporación de parámetros acústicos como elementos de evaluación de voces sintetizadas, así como pruebas de significancia estadísticas entre estos y voces originales para evaluar la calidad de los resultados. Y finalmente, se han identificado áreas de potencial desarrollo a partir de la incorporación de métodos heurísticos y otros de inteligencia computacional para mejorar los procesos de creación de voces y su evaluación.

Relaciones

En Conjunto Administrativo:

Descripciones

Nombre del atributoValores
Creador
Colaboradores
Tema
Editor
Idioma
Identificador
Palabra Clave
Año de publicación
  • 2014
Tipo de Recurso
Derechos
División académica
Línea académica
Licencia
Última modificación: 12/13/2023
Citaciones:

EndNote | Zotero | Mendeley

Elementos