Improving automated literacy assessments through a multiple output grapheme-to-phoneme approach
Resumo
Avaliações de fluência são essenciais para monitorar a alfabetização, mas sistemas automáticos ainda enfrentam dificuldades com a diversidade fonética do português brasileiro e características da leitura infantil. Propomos um conversor grafema-fonema baseado em regras que gera múltiplas transcrições por palavra, considerando variações regionais e fala infantil. Validado com leituras infantis, o módulo reduz erros, eleva a acurácia de 89% para 95% na base PARC-2019 e melhora o desempenho entre leitores inconsistentes. G2Ps flexíveis tornam avaliações mais justas e confiáveis.
Referências
Jucá, B. D. O., Rocha, C. C., Mello, R. C. D., Barrére, E., and Souza, J. F. D. (2023). Identificação de silabação em áudios de leitura de crianças em anos iniciais. In Anais do XXXIV Simpósio Brasileiro de Informática na Educação (SBIE 2023), pages 1363–1374, Brasil. Sociedade Brasileira de Computação - SBC.
Kubo, Y., Hori, T., and Nakamura, A. (2013). A method for structure estimation of weighted finite-state transducers and its application to grapheme-to-phoneme conversion. In Interspeech 2013, pages 647–651. ISCA.
Kłosowski, P. (2022). A Rule-Based Grapheme-to-Phoneme Conversion System. Applied Sciences, 12(5):2758.
Lemle, M. (2007). Guia teórico do alfabetizador, volume 104 of Princípios. Editora Ática, São Paulo, 17 edition.
Moore, R. K. and Skidmore, L. (2019). On the Use/Misuse of the Term ‘Phoneme’. pages 2340–2344.
Mortensen, D. R., Dalmia, S., and Littell, P. (2018). Epitran: Precision G2P for many languages. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018).
Pine, A., William Littell, P., Joanis, E., Huggins-Daines, D., Cox, C., Davis, F., Antonio Santos, E., Srikanth, S., Torkornoo, D., and Yu, S. (2022). Gi22Pi Rule-based, index-preserving grapheme-to-phoneme transformations Rule-based, index-preserving grapheme-to-phoneme transformations. In Proceedings of the Fifth Workshop on the Use of Computational Methods in the Study of Endangered Languages, pages 52–60, Dublin, Ireland. Association for Computational Linguistics.
Rao, K., Peng, F., Sak, H., and Beaufays, F. (2015). Grapheme-to-phoneme conversion using Long Short-Term Memory recurrent neural networks. In 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pages 4225–4229. ISSN: 2379-190X.
Rasinski, T. (2017). Fluency matters. International Electronic Journal of Elementary Education, 7(1):3–12. Section: Articles.
Rocha, C. C., Mello, R. C. D., and Souza, J. F. D. (2024). Avaliação de fluência leitora em língua portuguesa: primeira experiência com uso em larga escala de Inteligência Artificial. In Anais do XXXV Simpósio Brasileiro de Informática na Educação (SBIE 2024), pages 3075–3084, Brasil. Sociedade Brasileira de Computação - SBC.
Siravenha, A., Neto, N., Macedo, V., and Klautau, A. (2008). Uso de Regras Fonológicas com Determinação de Vogal Tônica para Conversão GrafemaFone em Português Brasileiro. 7th International Information and Telecommunication Technologies Symposium.
Sorgatto, D. W., Nogueira, B. M., Cáceres, E. N., and Mongelli, H. (2021). Avaliação de classificadores para relacionar características escolares a indicadores educacionais. In Anais do XXXII Simpósio Brasileiro de Informática na Educação (SBIE 2021), pages 1232–1242, Brasil. Sociedade Brasileira de Computação - SBC.
Taylor, P. (2005). Hidden Markov models for grapheme to phoneme conversion. In Interspeech 2005, pages 1973–1976. ISCA.
Vecchietti, L. F. S. (2017). Comparison between rule-based and data-driven natural language processing algorithms for Brazilian Portuguese speech synthesis.
White, S., Sabatini, J., Park, B.-s. J., Chen, J., Bernstein, J., and Li, M. (2021). The 2018 NAEP Oral Reading Fluency Study. Technical Report NCES 2021-025, U.S. Department of Education, Institute of Education Sciences, National Center for Education Statistics, Washington, DC.
Zhang, Y., Tino, P., Leonardis, A., and Tang, K. (2021). A Survey on Neural Network Interpretability. IEEE Transactions on Emerging Topics in Computational Intelligence, 5(5):726–742.
