Representaciones tiempo-frecuencia para el análisis de sonidos torácicos Público Deposited

La importancia del estudio de los sonidos generados en el tórax ha sido tal que, hace un par de siglos, Laennec mismo clasificó los eventos acústicos generados por la ventilación de los pulmones que escuchaba e intentó relacionarlos con los hallazgos anatómicos y patológicos que encontraba tras la autopsia. Aún en nuestros días, el médico usualmente describe estas señales acústicas mediante adjetivos relacionados con sonidos que le resulten cotidianos. Así, sólo la experiencia y el acuerdo mutuo han permitido cierto grado de uniformidad en la descripción de estos sonidos. Las enfermedades del sistema cardiovascular y del sistema respiratorio han incrementado su incidencia alrededor del mundo, a tal punto que actualmente éstas se encuentran entre las 10 principales causas de morbi-mortalidad a nivel mundial. Es por ello que la auscultación del tórax con el estetoscopio constituye una técnica de aplicación sencilla desde el primer contacto con el paciente, no invasiva y de bajo costo, que posibilita la detección oportuna de algunos padecimientos cardio-respiratorios. Más aún, el campo de estudio de los sonidos cardiacos y de los sonidos respiratorios ha sido favorecido por el rápido crecimiento tecnológico y de procesamiento digital de señales, a tal grado que muchas de las limitaciones presentes en la auscultación torácica mediante el estetoscopio han sido superadas con la ayuda de métodos computarizados para la adquisición, procesamiento, análisis y visualización de los sonidos torácicos, entendidos como todas aquellas variaciones de presión acústicas que caen dentro del espectro audible y que se relacionan con eventos mecánicos fundamentales tales como la contracción cardiaca, el flujo sanguíneo, la mecánica respiratoria y el flujo en vías aéreas. Estos eventos funcionales generan sonidos que por la parte cardiovascular incluyen a los sonidos cardiacos (S1-S4), los murmullos y los soplos; en tanto que por la parte respiratoria corresponden a los sonidos ventilatorios normales, los sonidos adventicios y los sonidos producidos por los músculos respiratorios. La complejidad de las estructuras biológicas de la cavidad torácica se ve reflejada en la complejidad de los sonidos que estas emiten. Estos sonidos, entre los que se cuentan los respiratorios y los cardiacos, son no estacionarios, lo que nos indica que poseen diversas estructuras e información cambiantes en el tiempo. Esta característica ha complicado la determinación de los mecanismos que dan génesis a algunos de ellos, aunque se han realizado desarrollos importantes, tanto en la fonocardiografía como en la fononeumografía, gracias a la creciente aplicación de técnicas de procesamiento digital de señales, tales como el análisis espectral, el reconocimiento de patrones y el análisis tiempo-frecuencia. La principal motivación del análisis tiempo-frecuencia radica en que los espectros variantes en el tiempo existen en la naturaleza y por lo tanto debe entenderse su descripción y sus propiedades. La necesidad del análisis tiempo-frecuencia tiene sus semillas en el análisis clásico de las señales en los dominios temporal y espectral, y en particular en la comprensión de que el análisis aislado en estos dominios no es suficiente para describir completamente la naturaleza de estas señales, y que para ello se requiere obtener una distribución que represente la energía o la intensidad de la señal simultáneamente en el tiempo y en la frecuencia. En otras palabras se requiere una técnica de procesamiento capaz de tomar la información unidimensional de la señal y proporcionar simultáneamente el contenido en frecuencia, duración e intensidad de cada uno de sus componentes bien delimitados en una región del plano tiempo-frecuencia. En el campo de los sonidos respiratorios el análisis tiempo-frecuencia ha sido una herramienta valiosa, y se han realizado diversos esfuerzos por encontrar una representación tiempo-frecuencia adecuada para analizarlos, e incluso para propósitos de reconocimiento automático de patrones. Desafortunadamente, en el campo de los sonidos respiratorios la herramienta clásica de análisis tiempo-frecuencia continúa siendo el espectrograma, cuya principal desventaja es su inherente compromiso entre su resolución temporal y su resolución espectral, el cual puede derivar en resultados pobres en registros de corta duración. Y a pesar de algunos esfuerzos por aplicar otras técnicas de representación tiempo-frecuencia para analizar los sonidos respiratorios, aún no se ha realizado una comparación cuantitativa entre la técnica clásica y otras de más reciente desarrollo. Así, el principal objetivo de esta tesis es realizar una comparación cuantitativa de diversas representaciones tiempo-frecuencia para el análisis de sonidos respiratorios, objetivo motivado por los prometedores resultados obtenidos en el campo de los sonidos cardiacos. Las representaciones tiempo-frecuencia empleadas en esta tesis provienen de una gran variedad de técnicas de estimación, técnicas que podrían clasificarse de la forma siguiente: a) a) la clase general de distribuciones bilineales invariantes a corrimientos (el espectrograma, la distribución Wigner-Ville, y la distribución Choi-Williams), b) método de la reasignación (espectrograma reasignado), c) modelado autorregresivo variante en el tiempo (algoritmo de Burg, algoritmo de mínimos cuadrados recursivo, algoritmo de mínimos cuadrados recursivo con factor de olvido variable, y el filtro de Kalman), d) la clase afín de distribuciones (el escalograma), y e) descomposición de la señal en funciones base (el espectro de HilbertHuang). En general, el cómputo de una representación tiempo-frecuencia mediante cada técnica depende de diferentes parámetros tales como el tipo y longitud de la ventana, o el orden del modelo. Como consecuencia, el desempeño de cada técnica tiempo-frecuencia dependerá de la adecuada selección de dichos parámetros. Así, tanto para la selección de parámetros como para la comparación de las diversas representaciones tiempo-frecuencia se emplearon señales de sonidos simulados, dado que su representación tiempo-frecuencia ideal se conoce de antemano, permitiendo la obtención de medidas de desempeño. Posteriormente, la técnica de análisis tiempo-frecuencia resultante fue aplicada a señales de sonidos torácicos reales adquiridos. Las señales de sonido torácicos consideradas en esta tesis incluyen a los dos primeros sonidos cardiacos (S1 y S2), sonidos respiratorios adventicios discontinuos (estertores crepitantes) y discontinuos (estertores sibilantes), así como sonidos pulmonares y traqueales normales. Las representaciones tiempo-frecuencia ideales ofrecen una referencia contra la cual comparar el desempeño de los diversos métodos tiempo-frecuencia; sin embargo, para algunas señales no se contó con dicha referencia, por lo que el conocimiento obtenido de las señales previas resultó valioso. Los índices empleados para evaluar el desempeño de las representaciones son: la correlación bidimensional central, aplicada de forma local (rpromedio) y global (r), el error cuadrático medio normalizado (NRMSE) y la correlación (rFI) de la frecuencia instantánea estimada mediante el primer momento en el tiempo del centroide de la representación, y la resolución tiempo-frecuencia (resTF). Previo a la selección de las representaciones tiempo-frecuencia, cada una de estas fue adecuada tanto en dimensiones como en valores de intensidad, y su contenido visualizado adecuadamente mediante el diseño de una paleta de colores. Las señales de sonidos respiratorios normales y adventicios se obtuvieron de dos bases de datos conformadas por los laboratorios de Fisiología Humana e Investigación en Procesamiento de Señales e Imágenes Biomédicas (LIPSIB) de la Universidad Autónoma Metropolitana Unidad Iztapalapa (UAM-I). La primera de ellas conformada por registros de pacientes con neumopatías intersticiales difusas (NID) y cuya adquisición se realizó en el Instituto Nacional de Enfermedades Respiratorias (INER); y la segunda conformada por registros de sujetos sanos y no fumadores adquirida en una cámara subamortiguada en la UAM-I. Además, se adquirieron registros cardíacos de un sujeto sano sin antecedentes de cardiopatías en el INER. Ejemplos de los resultados obtenidos se presentan a continuación. Para el primer sonido cardiaco simulado: espectrograma reasignado (r=0.6545, rpromedio=0.7750, resTF=0.0002), espectro de Hilbert-Huang (r=0.5321, rpromedio=0.7668, resTF=5.75x10-7), y espectrograma clásico (r=0.4303, rpromedio=0.7450, resTF=0.0037). Para el segundo cardiaco simulado: espectro de Hilbert-Huang (r=0.6226, rpromedio=0.7258, NRMSE=0.1225, rFI=0.9925, resTF=8.39x10-7), espectrograma reasignado (r=0.6825, rpromedio=0.6914, NRMSE=0.1771, rFI=0.9842, resTF=2.11x10-5), y espectrograma clásico (r=0.4743, rpromedio=0.6239, NRMSE=0.1742, rFI=0.9851, resTF=0.0074). Para la sibilancia simulada: espectro de Hilbert-Huang (r=0.9247, rpromedio=0.9521, NRMSE=0.0601, rFI=0.9982, resTF=2.47x10-6), espectrograma reasignado (r=0.8821, rpromedio=0.9163, NRMSE=0.1400, rFI=0.9903, resTF=5.83x10-5), y espectrograma clásico (r=0.5300, rpromedio=0.8851, NRMSE=0.0074, rFI=1, resTF=0.0029). Además de estos valores cuantitativos, los resultados de esta tesis corroboraron algunas propiedades y características de las técnicas tiempo-frecuencia empleadas, y mostraron además las dificultades que sufre cada una de ellas para la estimación del espectro variante en el tiempo. De acuerdo a los índices de desempeño empleados, para diferentes señales resultaron diferentes representaciones tiempo-frecuencia como las más adecuadas, y además cada índice de desempeño señaló diferentes representaciones tiempo-frecuencia para una misma señal. Es decir, debido a las diferentes estructuras de las señales torácicas analizadas se encontró que diferentes representaciones tiempo-frecuencia resultaban más adecuadas para cada una señal particular, aunque en general destacan el Espectro de HilbertHuang, el espectrograma reasignado y la representación paramétrica obtenida por el método de Burg. Sin embargo, el espectro de Hilbert-Huang resulta, debido a las características de su método de descomposición, y al margen de sus limitantes, la técnica de análisis tiempofrecuencia más adecuada y prometedora para el análisis de los sonidos respiratorios normales y adventicios de entre aquellas comparadas en este estudio.

Relaciones

En Conjunto Administrativo:

Descripciones

Nombre del atributoValores
Creador
Colaboradores
Tema
Editor
Idioma
Identificador
Palabra Clave
Año de publicación
  • 2010
Tipo de Recurso
Derechos
División académica
Línea académica
Licencia
Última modificación: 10/05/2022
Citaciones:

EndNote | Zotero | Mendeley

Elementos