Identificação de silabação em áudios de leitura de crianças em anos iniciais
Resumo
Este artigo aborda a detecção automática de silabação em áudios de crianças em fase de alfabetização, que é um desafio da avaliação de fluência em leitura. Nesse contexto, o reconhecimento automático da fala (ASR) permite processar os áudios de forma rápida e objetiva, gerando métricas acústicas sobre a duração das sílabas e a duração dos intervalos entre elas. Assim, propõe-se neste trabalho a aplicação de heurísticas que usam essas características para classificar automaticamente a silabação. Os resultados obtidos alcançaram acurácia de 0,87 em uma base de validação, o que destaca que a classificação automática da silabação pode ser aplicada na avaliação de fluência.Referências
Almeida Silva, W., Carchedi, L., Gomes Jr, J., Souza, J., Barrere, E., and Souza, J. (2021). A framework for large-scale automatic fluency assessment. International Journal of Distance Education Technologies, 19.
Baevski, A., Zhou, H., Mohamed, A., and Auli, M. (2020). wav2vec 2.0: A framework for self-supervised learning of speech representations. CoRR, abs/2006.11477.
Boháč, M., Matějů, L., Rott, M., and Šafařík, R. (2016). Automatic syllabification and syllable timing of automatically recognized speech – for czech. In Sojka, P., Horák, A., Kopeček, I., and Pala, K., editors, Text, Speech, and Dialogue, pages 540–547, Cham. Springer International Publishing.
Carchedi, L., Barrére, E., and de Souza, J. (2021). Avalia online: um sistema para avaliação em larga escala de testes de fluência de leitura. In Anais do XXXII Simpósio Brasileiro de Informática na Educação, pages 01–11, Porto Alegre, RS, Brasil. SBC.
Crystal, T. H. and House, A. S. (1990). Articulation rate and the duration of syllables and stress groups in connected speech. The Journal of the Acoustical Society of America, 88 1:101–12.
de Assis, E., Ferreira, A. L., Silva, C., and de Souza, J. (2022). Classificação automática de áudios de leituras de pseudopalavras para avaliação em larga escala de fluência da leitura de crianças em fase de alfabetização. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, pages 27–38, Porto Alegre, RS, Brasil. SBC.
de Castro, M. H. G. and Callou, R. (2022). Educação em Pauta 2022: Desafios da Educação Básica no Brasil. Organização dos Estados Ibero-americanos.
Evrard, M. (2023). Transformers in Automatic Speech Recognition, pages 123–139. Springer International Publishing.
Gomes Jr, J., Almeida Silva, W., Souza, J., Barrere, E., and Souza, J. (2019). Uso de alinhadores forçados para avaliação automática em larga escala da fluência em leitura. In Anais do XXX Simpósio Brasileiro de Informática na Educação, page 61, Porto Alegre, RS, Brasil. SBC.
Junior, A. C., Casanova, E., Soares, A., de Oliveira, F. S., Oliveira, L., Junior, R. C. F., da Silva, D. P. P., Fayet, F. G., Carlotto, B. B., Gris, L. R. S., and Aluísio, S. M. (2021). Coraa: a large corpus of spontaneous and prepared speech manually validated for speech recognition in brazilian portuguese.
Karim, R. and Suyanto, S. (2019). Optimizing parameters of automatic speech segmentation into syllable units. International Journal of Intelligent Systems and Applications, 11:9–17.
Martins, M. A. and Capellini, S. A. (2019). Relação entre fluência de leitura oral e compreensão de leitura. CoDAS, 31(1):e20170244.
Miller, J. and Schwanenflugel, P. J. (2008). A longitudinal study of the development of reading prosody as a dimension of oral reading fluency in early elementary school children. Reading Research Quarterly, 43(4):336–354.
N, A., S, K., D, K., Chanda, P., and Tripathi, S. (2020). Automatic correction of stutter in disfluent speech. Procedia Computer Science, 171:1363–1370.
Panda, S. P. and Nayak, A. K. (2016). Automatic speech segmentation in syllable centric speech recognition system. International Journal of Speech Technology, 19:9–18.
Puliezi, S. and Maluf, M. (2014). A fluência e sua importância para a compreensão da leitura. Psico-USF, 19:467–475.
Soares, E., Carchedi, L., Gomes Jr, J., Barrere, E., and Souza, J. (2018). Avaliação automática da fluência em leitura para crianças em fase de alfabetização. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, page 11, Porto Alegre, RS, Brasil. SBC.
Baevski, A., Zhou, H., Mohamed, A., and Auli, M. (2020). wav2vec 2.0: A framework for self-supervised learning of speech representations. CoRR, abs/2006.11477.
Boháč, M., Matějů, L., Rott, M., and Šafařík, R. (2016). Automatic syllabification and syllable timing of automatically recognized speech – for czech. In Sojka, P., Horák, A., Kopeček, I., and Pala, K., editors, Text, Speech, and Dialogue, pages 540–547, Cham. Springer International Publishing.
Carchedi, L., Barrére, E., and de Souza, J. (2021). Avalia online: um sistema para avaliação em larga escala de testes de fluência de leitura. In Anais do XXXII Simpósio Brasileiro de Informática na Educação, pages 01–11, Porto Alegre, RS, Brasil. SBC.
Crystal, T. H. and House, A. S. (1990). Articulation rate and the duration of syllables and stress groups in connected speech. The Journal of the Acoustical Society of America, 88 1:101–12.
de Assis, E., Ferreira, A. L., Silva, C., and de Souza, J. (2022). Classificação automática de áudios de leituras de pseudopalavras para avaliação em larga escala de fluência da leitura de crianças em fase de alfabetização. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, pages 27–38, Porto Alegre, RS, Brasil. SBC.
de Castro, M. H. G. and Callou, R. (2022). Educação em Pauta 2022: Desafios da Educação Básica no Brasil. Organização dos Estados Ibero-americanos.
Evrard, M. (2023). Transformers in Automatic Speech Recognition, pages 123–139. Springer International Publishing.
Gomes Jr, J., Almeida Silva, W., Souza, J., Barrere, E., and Souza, J. (2019). Uso de alinhadores forçados para avaliação automática em larga escala da fluência em leitura. In Anais do XXX Simpósio Brasileiro de Informática na Educação, page 61, Porto Alegre, RS, Brasil. SBC.
Junior, A. C., Casanova, E., Soares, A., de Oliveira, F. S., Oliveira, L., Junior, R. C. F., da Silva, D. P. P., Fayet, F. G., Carlotto, B. B., Gris, L. R. S., and Aluísio, S. M. (2021). Coraa: a large corpus of spontaneous and prepared speech manually validated for speech recognition in brazilian portuguese.
Karim, R. and Suyanto, S. (2019). Optimizing parameters of automatic speech segmentation into syllable units. International Journal of Intelligent Systems and Applications, 11:9–17.
Martins, M. A. and Capellini, S. A. (2019). Relação entre fluência de leitura oral e compreensão de leitura. CoDAS, 31(1):e20170244.
Miller, J. and Schwanenflugel, P. J. (2008). A longitudinal study of the development of reading prosody as a dimension of oral reading fluency in early elementary school children. Reading Research Quarterly, 43(4):336–354.
N, A., S, K., D, K., Chanda, P., and Tripathi, S. (2020). Automatic correction of stutter in disfluent speech. Procedia Computer Science, 171:1363–1370.
Panda, S. P. and Nayak, A. K. (2016). Automatic speech segmentation in syllable centric speech recognition system. International Journal of Speech Technology, 19:9–18.
Puliezi, S. and Maluf, M. (2014). A fluência e sua importância para a compreensão da leitura. Psico-USF, 19:467–475.
Soares, E., Carchedi, L., Gomes Jr, J., Barrere, E., and Souza, J. (2018). Avaliação automática da fluência em leitura para crianças em fase de alfabetização. In Anais do XXXIII Simpósio Brasileiro de Informática na Educação, page 11, Porto Alegre, RS, Brasil. SBC.
Publicado
06/11/2023
Como Citar
JUCÁ, Bruno de O.; ROCHA, Caio C.; MELLO, Rômulo C. de; BARRÉRE, Eduardo; SOUZA, Jairo Francisco de.
Identificação de silabação em áudios de leitura de crianças em anos iniciais. In: SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO (SBIE), 34. , 2023, Passo Fundo/RS.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2023
.
p. 1363-1374.
DOI: https://doi.org/10.5753/sbie.2023.234866.