Speaker verification system based on articulatory information from ultrasound recordings



Título del documento: Speaker verification system based on articulatory information from ultrasound recordings
Revista: Dyna (Medellín)
Base de datos:
Número de sistema: 000536554
ISSN: 0012-7353
Autores: 1
2
1
Instituciones: 1Universidad Industrial de Santander, Bucaramanga. Colombia
2Universidad Santiago de Cali Facultad de Ingenierías, Cali. Colombia
Año:
Periodo: Abr-Jun
Volumen: 87
Número: 213
Paginación: 9-16
País: Colombia
Idioma: Inglés
Resumen en español Los sistemas actuales de verificación de hablantes (VH) pueden verse afectados por variaciones inesperadas durante la fase de validación, tales como ruido de entorno o cambios en el esfuerzo vocal. En este trabajo se evalúa la información articulatoria del movimiento de la lengua como medio para mejorar el desempeño de los sistemas de verificación del hablante. Se utilizó una base de datos en español, donde además de las señales de voz, también se adquiere información articulatoria con un sistema de ultrasonido. Se proponen dos grupos de características para representar la información articulatoria y el desempeño obtenido es comparado con un SVH entrenado únicamente con información acústica. Los resultados muestran que las características propuestas contienen gran cantidad de información discriminativa y altamente asociada a la identidad de los hablantes, además que se pueden emplear para complementar y mejorar SVH existentes como por ejemplo combinando dicha información con coeficientes cepstrales.
Resumen en inglés Current state-of-the-art speaker verification (SV) systems are known to be strongly affected by unexpected variability presented during testing, such as environmental noise or changes in vocal effort. In this work, we analyze and evaluate articulatory information of the tongue's movement as a means to improve the performance of speaker verification systems. We use a Spanish database, where besides the speech signals, we also include articulatory information that was acquired with an ultrasound system. Two groups of features are proposed to represent the articulatory information, and the obtained performance is compared to an SV system trained only with acoustic information. Our results show that the proposed features contain highly discriminative information, and they are related to speaker identity; furthermore, these features can be used to complement and improve existing systems by combining such information with cepstral coefficients at the feature level.
Palabras clave: Procesamiento de señales del habla,
Verificación de hablantes,
Parámetros articulatorios,
Ultrasonido,
I-vectors,
GMMs
Keyword: Speech processing,
Speaker verification,
Articulatory parameters,
Ultrasound,
I-vectors,
GMMs
Texto completo: Texto completo (Ver HTML) Texto completo (Ver PDF)