Uso de Alinhadores Forçados para Avaliação Automática em Larga Escala de Fluência em Leitura
Resumo
A utilização de sistemas para reconhecimento automático de fala (ASR) tem crescido bastante nos últimos anos. No entanto, não existem muitos trabalhos que utilizam técnicas de ASR para a avaliação de fluência em leitura na alfabetização. A utilização da transcrição como único meio de avaliação traz alguns problemas por mascarar a pronúncia incorreta de algumas palavras. Assim, este trabalho propõe o uso de algoritmos de alinhamento forçado em conjunto com o sistema de ASR. Os resultados mostram que a abordagem proposta alcança resultados mais rápidos e com acurácia 22.11% maior em uma base real de áudios provenientes de avaliações de oralidade, mostrando-se a alternativa mais aplicável para a avaliação em larga escala.
Palavras-chave:
Alinhadores Forçados, Avaliação Automática, Fluência em Leitura, ASR, Algoritmos de Alinhamento
Referências
Campos, A. and Freitas, J. (2016). Reconhecimento automatico de fala (asr) e aquisição de segunda língua: Práticas de pronúncia do inglês no aplicativo móvel babbel. ?Simposio Internacional de Educação e Comunicação, Aracaju.
Carchedi, L. C., Barrere, E., and Souza, J. (2018). Abordagem colaborativa para apoio à avaliação do ensino de português. In Brazilian Symposium on Computers in Education(Simposio Brasileiro de Informática na Educação-SBIE) , volume 29, page 1593.
Celestino, P. G. (2019). A oralidade infantil e desenvolvimento cognitivo a partir da prática docente. Revista Internacional de apoyo a la inclusion, logopedia, sociedad y ?multiculturalidad, 5(1).
Claus, F., Gamboa-Rosales, H., Petrick, R., Hain, H.-U., and Hoffmann, R. (2013). A survey about asr for children.
Demenko, G., Wagner, A., and Cylwik, N. (2010). The use of speech technology in foreign language pronunciation training. Archives of Acoustics, 35(3):309–329.
Eskenazi, M. (1996). Detection of foreign speakers’ pronunciation errors for second language training-preliminary results. In Spoken Language, 1996. ICSLP 96. Proceedings., Fourth International Conference on, volume 3, pages 1465–1468. IEEE.
Ferreira, M.V.G. and de Souza, J.F. (2017). Use of automatic speech recognition systems for multimedia applications. In Proceedings of the 23rd Brazilian Symposium on Multimedia and the Web, pages 33–36. ACM.
Fuchs, L.S., Fuchs, D., Hosp, M.K., and Jenkins, J.R. (2001). Oral reading fluency as an indicator of reading competence: A theoretical, empirical, and historical analysis. Scientific studies of reading, 5(3): 239–256.
Hoy, M.B. (2018). Alexa, siri, cortana, and more: An introduction to voice assistants. Medical reference services quarterly, 37(1): 81–88.
Hudson, R.F., Lane, H.B., and Pullen, P.C. (2005). Reading fluency assessment and instruction: What, why, and how? The Reading Teacher, 58(8): 702–714.
Liao, H., Pundak, G., Siohan, O., Carroll, M.K., Coccaro, N., Jiang, Q.-M., Sainath, T.N., Senior, A., Beaufays, F., and Bacchiani, M. (2015). Large vocabulary automatic speech recognition for children. In Sixteenth Annual Conference of the International Speech Communication Association.
Litman, D., Strik, H., and Lim, G.S. (2018). Speech technologies and the assessment of second language speaking: Approaches, challenges, and opportunities. Language Assessment Quarterly, 15(3): 294–309.
McAuliffe, M., Socolof, M., Mihuc, S., Wagner, M., and Sonderegger, M. (2017). Montreal forced aligner: Trainable text-speech alignment using kaldi. In Interspeech, pages 498–502.
MEC (2018). Base nacional comum curricular. [link]. Acessado: 30-01-2019.
Moreno, P.J., Joerg, C., Thong, J.-M.V., and Glickman, O. (1998). A recursive algorithm for the forced alignment of very long audio segments. In Fifth International Conference on Spoken Language Processing.
Neri, A., Cucchiarini, C., and Strik, H. (2006). ASR corrective feedback on pronunciation: Does it really work?
Neri, A., Cucchiarini, C., and Strik, W. (2003). Automatic speech recognition for second language learning: how and why it actually works. In Proc. ICPhS, pages 1157–1160.
Soares, E., Carchedi, L.C., Gomes Jr, J., Barrère, E., and Souza, J. (2018). Avaliação automática da fluência em leitura para crianças em fase de alfabetização. In Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação - SBIE), volume 29, page 11.
Thomson, R.I. (2011). Computer assisted pronunciation training: Targeting second language vowel perception improves pronunciation. Calico Journal, 28(3): 744.
Yeung, G. and Alwan, A. (2018). On the difficulties of automatic speech recognition for kindergarten-aged children. Proc. Interspeech 2018, pages 1661–1665.
Yu, D. and Deng, L. (2016). AUTOMATIC SPEECH RECOGNITION. Springer.
Carchedi, L. C., Barrere, E., and Souza, J. (2018). Abordagem colaborativa para apoio à avaliação do ensino de português. In Brazilian Symposium on Computers in Education(Simposio Brasileiro de Informática na Educação-SBIE) , volume 29, page 1593.
Celestino, P. G. (2019). A oralidade infantil e desenvolvimento cognitivo a partir da prática docente. Revista Internacional de apoyo a la inclusion, logopedia, sociedad y ?multiculturalidad, 5(1).
Claus, F., Gamboa-Rosales, H., Petrick, R., Hain, H.-U., and Hoffmann, R. (2013). A survey about asr for children.
Demenko, G., Wagner, A., and Cylwik, N. (2010). The use of speech technology in foreign language pronunciation training. Archives of Acoustics, 35(3):309–329.
Eskenazi, M. (1996). Detection of foreign speakers’ pronunciation errors for second language training-preliminary results. In Spoken Language, 1996. ICSLP 96. Proceedings., Fourth International Conference on, volume 3, pages 1465–1468. IEEE.
Ferreira, M.V.G. and de Souza, J.F. (2017). Use of automatic speech recognition systems for multimedia applications. In Proceedings of the 23rd Brazilian Symposium on Multimedia and the Web, pages 33–36. ACM.
Fuchs, L.S., Fuchs, D., Hosp, M.K., and Jenkins, J.R. (2001). Oral reading fluency as an indicator of reading competence: A theoretical, empirical, and historical analysis. Scientific studies of reading, 5(3): 239–256.
Hoy, M.B. (2018). Alexa, siri, cortana, and more: An introduction to voice assistants. Medical reference services quarterly, 37(1): 81–88.
Hudson, R.F., Lane, H.B., and Pullen, P.C. (2005). Reading fluency assessment and instruction: What, why, and how? The Reading Teacher, 58(8): 702–714.
Liao, H., Pundak, G., Siohan, O., Carroll, M.K., Coccaro, N., Jiang, Q.-M., Sainath, T.N., Senior, A., Beaufays, F., and Bacchiani, M. (2015). Large vocabulary automatic speech recognition for children. In Sixteenth Annual Conference of the International Speech Communication Association.
Litman, D., Strik, H., and Lim, G.S. (2018). Speech technologies and the assessment of second language speaking: Approaches, challenges, and opportunities. Language Assessment Quarterly, 15(3): 294–309.
McAuliffe, M., Socolof, M., Mihuc, S., Wagner, M., and Sonderegger, M. (2017). Montreal forced aligner: Trainable text-speech alignment using kaldi. In Interspeech, pages 498–502.
MEC (2018). Base nacional comum curricular. [link]. Acessado: 30-01-2019.
Moreno, P.J., Joerg, C., Thong, J.-M.V., and Glickman, O. (1998). A recursive algorithm for the forced alignment of very long audio segments. In Fifth International Conference on Spoken Language Processing.
Neri, A., Cucchiarini, C., and Strik, H. (2006). ASR corrective feedback on pronunciation: Does it really work?
Neri, A., Cucchiarini, C., and Strik, W. (2003). Automatic speech recognition for second language learning: how and why it actually works. In Proc. ICPhS, pages 1157–1160.
Soares, E., Carchedi, L.C., Gomes Jr, J., Barrère, E., and Souza, J. (2018). Avaliação automática da fluência em leitura para crianças em fase de alfabetização. In Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação - SBIE), volume 29, page 11.
Thomson, R.I. (2011). Computer assisted pronunciation training: Targeting second language vowel perception improves pronunciation. Calico Journal, 28(3): 744.
Yeung, G. and Alwan, A. (2018). On the difficulties of automatic speech recognition for kindergarten-aged children. Proc. Interspeech 2018, pages 1661–1665.
Yu, D. and Deng, L. (2016). AUTOMATIC SPEECH RECOGNITION. Springer.
Publicado
11/11/2019
Como Citar
GOMES JR., Jorão; SILVA, Warley Almeida; DE SOUZA, João Victor; BARRÈRE, Eduardo; DE SOUZA, Jairo Francisco.
Uso de Alinhadores Forçados para Avaliação Automática em Larga Escala de Fluência em Leitura. In: SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO (SBIE), 30. , 2019, Brasília/DF.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2019
.
p. 61-70.
DOI: https://doi.org/10.5753/cbie.sbie.2019.61.
