Diseño de un codificador decodificador de voz y audio bajo un esquema unificado

Sauceda Peña, Daniel Edgar

Diseño de un codificador decodificador de voz y audio bajo un esquema unificado Público Deposited

Las tecnologías para la codificación de señales acústicas han seguido dos paradigmas fundamentales, para las señales de voz se ha utilizado la codificación basada en la predicción lineal, mientras que para el audio (dominado por la música) se ha utilizado el enfoque basado en transformadas. Por cuestiones de practicidad, y con la finalidad de hacer eficiente la codificación de señales acústicas, se ha planteado la necesidad de un codificador unificado capaz de obtener las tasas de bit más bajas posibles para secuencias de audio con contenido mixto. Dicho codificador debe tener la capacidad de distinguir los segmentos de voz o audio y utilizar el esquema de codificación más adecuado. Uno de los principales retos en el diseño de un codificador unificado radica en la distinción entre las señales acústicas de entrada. Esta etapa es de muy alta importancia ya que determinar ‘a el tipo de tecnología de codificación que se utilizar ‘a. El trabajo que aquí se presenta plantea el desarrollo de un módulo de decisión cuyo objetivo es determinar si una señal de entrada al sistema tiene las características que la definen como una señal acústica de voz o de audio mediante una técnica innovadora basada en la transformada continua wavelet y la identificación de cordilleras. El presente proyecto consta de tres partes fundamentales: una investigación sobre las tecnologías actuales, el desarrollo del código y una fase de pruebas. En primer término, se realizó una investigación bibliográfica donde se consultaron las publicaciones relacionadas con el tema de clasificación de señales acústicas, reconocimiento de patrones y particularmente sobre los modelos de codificación unificada. Durante la etapa de desarrollo del código, se analizó el comportamiento de varios segmentos de señales acústicas, se incluyeron segmentos de habla, voz cantada a capella, instrumentos solos, conjuntos de instrumentos y sonidos ambientales como lluvia. La etapa de análisis consistió en observar el comportamiento de las señales acústicas al aplicar la transformada continua wavelet.

El desarrollo del proyecto mostró que es posible distinguir entre las señales de voz y audio mediante el análisis asistido por la transformada continua wavelet y la detección de cordilleras asociadas a esta transformada. Al identificar características propias a cada tipo de señal acústica fue posible establecer un algoritmo de programación enfocado a distinguirlas de manera automática. Motivación La demanda por servicios de difusio’n en línea (streaming) tiene un incremento exponencial, esto es una consecuencia de la penetración de los dispositivos tecnológicos en la mayoría de la población. Los proveedores de servicios de Internet establecen cuotas altas y topes en la cantidad de información que cada usuario tiene derecho a descargar. El contenido multimedia representa la aplicación que más ancho de banda demanda. Derivado de las condiciones descritas, se establece como una necesidad fundamental hacer un uso eficiente del ancho de banda disponible. Las tecnologías enfocadas en la codificación multimedia, especialmente el audio, han desarrollado nuevas técnicas para reducir la tasa de bit. Originalmente la voz y el audio (generalmente representado por la música) han seguido dos paradigmas de codificación distintos, ambos con una alta eficiencia en la compresión de los datos. Ante la posibilidad de contar con dos tecnologías que permiten hacer el uso más eficiente del canal de comunicación, se plantea la necesidad de un codificador-decodificador capaz de adaptarse a la señal de entrada de una forma automática y así, garantizar siempre la tasa de bit más baja en contenidos mixtos, es decir, que a veces transmitan solo voz y en otras ocasiones solo audio. El paradigma que se plantea se le conoce como USAC (por sus siglas en ingles). Objetivo Desarrollar un algoritmo con base en la transformada wavelet capaz de clasificar las señales acústicas en dos tipos, voz y audio como parte de un codificador unificado. Justificación La eficiencia en el uso del ancho de banda disponible para la transmisión de tramas de audio constituye un objetivo primordial en la industria. Se puede utilizar un clasificador como un módulo de decisión previo a la codificación de señales acústicas. Si se conoce el tipo de señal a priori se puede elegir la tecnología de codificación más adecuada para la señal de entrada y así obtener una tasa de bit más baja.

Relaciones

En Conjunto Administrativo:	Tesis Posgrado

Descripciones

Nombre del atributo	Valores
Creador	Sauceda Peña, Daniel Edgar
Colaboradores	Prieto Guerrero, Alfonso Goddard Close, John Charles Henry Suárez Guerra, Sergio
Tema	Signal processing Procesamiento de señales Sound-waves Ondas sonoras Speech processing systems Sistemas de procesamiento del habla
Editor	Universidad Autónoma Metropolitana
Idioma	spa
Identificador	https://doi.org/10.24275/uami.1v53jx18g
Palabra Clave	Decodificador de voz Audio Esquema unificado
Año de publicación	2013
Tipo de Recurso	info:eu-repo/semantics/masterThesis
Derechos	Acceso Abierto
División académica	Ciencias Basicas e Ingenieria
Línea académica	Ciencias y Tecnologias de la Informacion
Licencia	Atribucion-NoComercial 4.0 Internacional (CC BY-NC 4.0)

Analytics

Última modificación: 12/13/2023

Citaciones:

EndNote | Zotero | Mendeley

Elementos

Miniatura	Título	Fecha de subida	Visibilidad	Acciones
	UAMI16119.pdf	2021-08-11	Público	Download