Classificação de Questões da Olimpíada Brasileira de Informática Modalidade Iniciação com Inteligência Artificial e Chain of Thought

Thiago Gonçalves de Almeida; Esteic Janaina Santos Batista; Anderson Correa de Lima; Amaury Antônio Castro Junior

doi:10.5753/educomp.2026.18644

Thiago Gonçalves de Almeida UFMS
Esteic Janaina Santos Batista UFMS
Anderson Correa de Lima UFMS
Amaury Antônio Castro Junior UFMS

DOI: https://doi.org/10.5753/educomp.2026.18644

Resumo

Este trabalho apresenta um estudo sobre a classificação automática de questões da Modalidade Iniciação da Olimpíada Brasileira de Informática (OBI), com o objetivo de comparar abordagens supervisionadas e baseadas em prompting, visando apoiar na produção de materiais de treinamento para a competição e o desenvolvimento de habilidades relacionadas ao Pensamento Computacional. A metodologia foi estruturada em três etapas principais: (i) mineração e extração de textos de provas oficiais da OBI, resultando em um dataset de questões textuais; (ii) treinamento supervisionado com o modelo BERTimbau; e (iii) classificação com prompting por meio da técnica Chain of Thought (CoT), aplicada aos modelos GPT-4.1-mini e GPT-5-mini. Os resultados indicam que o uso de prompting com raciocínio passo a passo é uma alternativa promissora para tarefas educacionais de classificação textual, reduzindo a dependência de rotulação manual. Como contribuição, o estudo desenvolve um classificador de questões da OBI e disponibiliza um dataset associado. Essa proposta oferece um acervo estruturado de material que atende ao treinamento de estudantes e subsidia a prática docente, contribuindo para iniciativas de ensino de Computação na Educação Básica.

Referências

Brackmann, C. P., Caetano, S. V. N., and da Silva, A. R. (2019). Pensamento computacional desplugado: ensino e avaliação na educação primária brasileira. Revista Novas Tecnologias na Educação, 17(3):636–647.

Brasil (2022). CNE/CEB. Parecer Nº 2/2022 - Normas sobre Computação na Educação Básica – Complemento à BNCC. [link] - Acesso em: 26 ago. 2025.

Brasil (2023). Lei nº 14.533, de 11 de janeiro de 2023. institui a política nacional de educação digital. [link]. Acesso em: 26 ago. 2025.

Britto, L. F., Pessoa, L. A., and Agostinho, S. C. (2022). Cross-domain sentiment analysis in portuguese using bert. In Encontro Nacional de Inteligência Artificial e Computacional (ENIAC), pages 61–72. SBC.

Caseli, H. and Nunes, M. (2024). Processamento de linguagem natural: Conceitos, técnicas e aplicações em português. bpln, 2 edn.(2024).

Dagiene, V. and Stupuriene, G. (2016). Bebras–a sustainable community building model for the concept based learning of informatics and computational thinking. Informatics in education, 15(1):25–44.

de Almeida, T. G., Batista, E. J. S., de Lima, A. C., and Junior, A. A. C. (2024). Produçao e desenvolvimento de material de apoio ao treinamento para a modalidade iniciaçao da obi: Uma revisao sistemática da literatura. In Workshop sobre Educação em Computação (WEI), pages 477–488. SBC.

Devlin, J., Chang, M.-W., Lee, K., and Toutanova, K. (2019). Bert: Pre-training of deep bidirectional transformers for language understanding. In Proceedings of the 2019 conference of the North American chapter of the association for computational linguistics: human language technologies, volume 1 (long and short papers), pages 4171–4186.

Instituto de Computação - Unicamp (2025). Olimpíada brasileira de informática (obi). [link]. Acesso em: 26 ago. de 2025.

Laranjeira, M. L. and Bezerra, P. T. (2025). Gerador automático de planos de aula sobre tecnologia baseado em llms. In Workshop sobre Educação em Computação (WEI), pages 515–526. SBC.

Maia, S. M. and Sarkis, L. C. (2025). Utilização de llm como ferramenta de apoio no ensino-aprendizagem de programação python para iniciantes: Um relato de experiência. In Workshop sobre Educação em Computação (WEI), pages 385–396. SBC.

Martins, W. S. (2011). Jogos de Lógica: divirta-se e prepare-se para a Olimpíada Brasileira de Informática. Vieira.

Nascimento, D. B. d. S. d. (2024). Classificação automática de avaliações de acessibilidade em lojas de aplicativos: um estudo sobre técnicas de prompt. PhD thesis, Universidade de São Paulo.

Peres, R. S. (2023). Grandes modelos de linguagem na resolução de questões de vestibular: o caso dos institutos militares brasileiros. Master’s thesis.

Rodrigues, L. S., Santos, M., Gomes, C. F. S., Choren, R., Goldschmidt, R., and Barbará, S. (2024). Transformers para previsão de desempenho acadêmico no ensino fundamental e médio. Revista Brasileira de Informática na Educação, 32:213–241.

Souza, F., Nogueira, R., and Lotufo, R. (2020). Bertimbau: pretrained bert models for brazilian portuguese. In Brazilian conference on intelligent systems, pages 403–417. Springer.

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., and Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30.

Wei, J., Wang, X., Schuurmans, D., Bosma, M., Xia, F., Chi, E., Le, Q. V., Zhou, D., et al. (2022). Chain-of-thought prompting elicits reasoning in large language models. Advances in neural information processing systems, 35:24824–24837.

Wing, J. (2016). Pensamento computacional–um conjunto de atitudes e habilidades que todos, não só cientistas da computação, ficaram ansiosos para aprender e usar. Revista Brasileira de Ensino de Ciência e Tecnologia, 9(2).

Zhang, B., Fu, X., Ding, D., Huang, H., Dai, G., Yin, N., Li, Y., and Jing, L. (2023). Investigating chain-of-thought with chatgpt for stance detection on social media. arXiv preprint arXiv:2304.03087.