Verificação de Locutores Independente de Texto: uma Análise de Robustez a Ruído
Resumo
Este trabalho foca no desenvolvimento de sistemas de verificação de locutores independente de texto, cujo principal desafio provém das chamadas incompatibilidades que podem ocorrer na aquisição dos sinais de voz. As técnicas propostas para suavizá-las são chamadas de técnicas de compensação e três são os domínios onde elas podem operar: no processo de extração de características do sinal, na construção dos modelos dos locutores e no cálculo do score final do sistema, utilizado na autenticação. Esse trabalho apresenta uma vasta revisãao da literatura do desenvolvimento de sistemas de verificação independentes de texto, das técnicas de compensação de características, modelos e scores. Na fase de experimentação, uma análise comparativa das principais técnicas propostas na literatura é apresentada. Além disso, duas técnicas de compensação são propostas, uma do domínio de modelagem e outra do domínio dos scores, que por suas vezes apresentaram desempenhos superiores às principais técnicas da literatura.
Referências
Ming, J., Hazen, T. J., Glass, J. R., and Reynolds, D. A. (2007). Robust speaker recognition in noisy conditions. IEEE Transactions on Audio, Speech, and Language Processing, 15(5):1711–1723.
Pinheiro, H. N., Ren, T. I., Cavalcanti, G. D., Jyh, T. I., and Sijbers, J. (2013). Type-2 fuzzy GMM-UBM for text-independent speaker verification. In International Conference on Systems, Man, and Cybernetics (SMC), pages 4328–4331. IEEE.
Pinheiro, H. N., Ren, T. I., Cavalcanti, G. D., Jyh, T. I., and Sijbers, J. (2014). Type-2 fuzzy GMMs for robust text-independent speaker verification in noisy environments. In International Conference on Pattern Recognition (ICPR), pages 4531–4536. IEEE.
Pinheiro, H. N. B. (2015). Verificação de Locutores Independente de Texto: uma Análise de Robustez a Ru´ıdo. Dissertação (Mestrado em Ciência da Computação) - Centro de Informática, Universidade Federal de Pernambuco, Recife, Brazil.
Pinheiro, H. N. B., Vieira, S. R. F., Ren, T. I., Cavalcanti, G. D. C., and Mattos Neto, P. S. G. (2016). Type-2 fuzzy GMM for text-independent speaker verification under unseen noise conditions. In International Conference on Acoustics, Speech and Signal Processing (ICASSP).
Reynolds, D. A., Quatieri, T. F., and Dunn, R. B. (2000). Speaker verification using adapted gaussian mixture models. Digital signal processing, 10(1):19–41.
Tsang, R., Gabriel, D., Pinheiro, H. N., and Cavalcanti, G. D. (2012). Speaker verification using type-2 fuzzy gaussian mixture models. In International Conference on Systems, Man, and Cybernetics (SMC), pages 2336–2340. IEEE.