Verificação de Locutores Independente de Texto: uma Análise de Robustez a Ruído

  • Hector N. B. Pinheiro UFPE
  • Tsang Ing Ren UFPE
  • George D. da C. Cavalcanti UFPE

Resumo


Este trabalho foca no desenvolvimento de sistemas de verificação de locutores independente de texto, cujo principal desafio provém das chamadas incompatibilidades que podem ocorrer na aquisição dos sinais de voz. As técnicas propostas para suavizá-las são chamadas de técnicas de compensação e três são os domínios onde elas podem operar: no processo de extração de características do sinal, na construção dos modelos dos locutores e no cálculo do score final do sistema, utilizado na autenticação. Esse trabalho apresenta uma vasta revisãao da literatura do desenvolvimento de sistemas de verificação independentes de texto, das técnicas de compensação de características, modelos e scores. Na fase de experimentação, uma análise comparativa das principais técnicas propostas na literatura é apresentada. Além disso, duas técnicas de compensação são propostas, uma do domínio de modelagem e outra do domínio dos scores, que por suas vezes apresentaram desempenhos superiores às principais técnicas da literatura.

Referências

Campbell, W. M., Sturim, D. E., and Reynolds, D. A. (2006). Support vector machines using GMM supervectors for speaker verification. IEEE Signal Processing Letters, 13(5):308–311.

Ming, J., Hazen, T. J., Glass, J. R., and Reynolds, D. A. (2007). Robust speaker recognition in noisy conditions. IEEE Transactions on Audio, Speech, and Language Processing, 15(5):1711–1723.

Pinheiro, H. N., Ren, T. I., Cavalcanti, G. D., Jyh, T. I., and Sijbers, J. (2013). Type-2 fuzzy GMM-UBM for text-independent speaker verification. In International Conference on Systems, Man, and Cybernetics (SMC), pages 4328–4331. IEEE.

Pinheiro, H. N., Ren, T. I., Cavalcanti, G. D., Jyh, T. I., and Sijbers, J. (2014). Type-2 fuzzy GMMs for robust text-independent speaker verification in noisy environments. In International Conference on Pattern Recognition (ICPR), pages 4531–4536. IEEE.

Pinheiro, H. N. B. (2015). Verificação de Locutores Independente de Texto: uma Análise de Robustez a Ru´ıdo. Dissertação (Mestrado em Ciência da Computação) - Centro de Informática, Universidade Federal de Pernambuco, Recife, Brazil.

Pinheiro, H. N. B., Vieira, S. R. F., Ren, T. I., Cavalcanti, G. D. C., and Mattos Neto, P. S. G. (2016). Type-2 fuzzy GMM for text-independent speaker verification under unseen noise conditions. In International Conference on Acoustics, Speech and Signal Processing (ICASSP).

Reynolds, D. A., Quatieri, T. F., and Dunn, R. B. (2000). Speaker verification using adapted gaussian mixture models. Digital signal processing, 10(1):19–41.

Tsang, R., Gabriel, D., Pinheiro, H. N., and Cavalcanti, G. D. (2012). Speaker verification using type-2 fuzzy gaussian mixture models. In International Conference on Systems, Man, and Cybernetics (SMC), pages 2336–2340. IEEE.
Publicado
04/07/2016
PINHEIRO, Hector N. B.; REN, Tsang Ing; CAVALCANTI, George D. da C.. Verificação de Locutores Independente de Texto: uma Análise de Robustez a Ruído. In: CONCURSO DE TESES E DISSERTAÇÕES (CTD), 29. , 2016, Porto Alegre. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2016 . p. 375-380. ISSN 2763-8820. DOI: https://doi.org/10.5753/ctd.2016.9134.