Detección de Eventos Sonoros en Señales de Música Usando Procesos Gaussianos



Título del documento: Detección de Eventos Sonoros en Señales de Música Usando Procesos Gaussianos
Revue: TecnoLógicas
Base de datos: PERIÓDICA
Número de sistema: 000400997
ISSN: 0123-7799
Autores: 1
1
1
Instituciones: 1Universidad Tecnológica de Pereira, Programa de Ingeniería Eléctrica, Pereira, Risaralda. Colombia
Año:
Periodo: Jul-Dic
Número: 31
Paginación: 93-122
País: Colombia
Idioma: Español
Tipo de documento: Artículo
Enfoque: Aplicado, descriptivo
Resumen en español En este artículo se propone una metodología para detectar eventos sono-ros en señales de música usando procesos Gaussianos. En el algoritmo presen-tado, las señales de audio de entrada son transformadas a un espacio tiempo-frecuencia utilizando la Transformada de Tiempo Corto de Fourier para obtener el espectrograma, cuya dimensión es posteriormente reducida pasando de la frecuencia en escala lineal en Hertz a la escala logarítmica en Mel por medio de un banco de filtros triangulares. Finalmente, se clasifica entre “evento” y “no evento” cada uno de los espectros de tiempo corto contenidos en el espectrograma en escala Mel por medio de un clasificador binario basado en procesos Gaussianos. Como parte del proceso de evaluación, se compara el desempeño de la metodología propuesta con el desempeño de algunas técnicas ampliamente utilizadas para detectar eventos en este tipo de señales. Para tal fin, se implementa en MATLAB® cada una de estas técnicas y se ponen a prueba utilizando dos bases de datos compuestas por segmentos de audio de diferente complejidad; definida por el tipo y cantidad de instrumentos tocados al mismo tiempo. Los resultados indican que la metodología propuesta supera el desempeño de las técnicas hasta ahora planteadas, presentando un mejo-ramiento en la medida F de 1,66 % para la base de datos uno y de 0,45 % para la base de datos dos
Resumen en inglés In this paper we present a new methodology for detecting sound events in music signals using Gaussian Processes. Our method firstly takes a time-frequency representation, i.e. the spectrogram, of the input audio signal. Secondly the spectrogram dimension is reduced translating the linear Hertz frequency scale into the logarithmic Mel frequency scale using a triangular filter bank. Finally every short-time spectrum, i.e. every Mel spectrogram column, is classified as “Event” or “Not Event” by a Gaussian Processes Classifier. We compare our method with other event detection techniques widely used. To do so, we use MATLAB® to program each technique and test them using two datasets of music with different levels of complexity. Results show that the new methodology outperforms the standard approaches, getting an improvement by about 1.66 % on the dataset one and 0.45 % on the dataset two in terms of F-measure
Disciplinas: Ciencias de la computación,
Arte
Palabras clave: Procesamiento de datos,
Música,
Clasificación de señales,
Procesos gaussianos,
Aprendizaje de máquinas,
Detección de eventos,
Espectrograma
Keyword: Computer science,
Arts,
Data processing,
Music,
Signal classification,
Gaussian processes,
Machine learning,
Event detection,
Spectrogram
Texte intégral: Texto completo (Ver PDF)