Evaluating Machine Learning Algorithms for Software Effort Estimation from Textual Descriptions of Requirements

  • Rodrigo De Nadai Grigoleto IFES
  • Hilário Tomaz Alves de Oliveira IFES

Resumo


A estimativa de esforço no desenvolvimento de software é uma tarefa desafiadora, subjetiva, que exige considerável empenho, impactando diretamente o planejamento e a alocação de recursos. Este trabalho investigou a eficácia de diferentes algoritmos de Aprendizado de Máquina (AM) e arquiteturas de redes neurais profundas na estimativa automática do esforço de desenvolvimento a partir de descrições textuais de requisitos. Foram avaliados algoritmos tradicionais de AM usando TF-IDF, bem como modelos baseados no BERT, em seis conjuntos de dados públicos. Os experimentos analisaram o desempenho dos modelos em dois cenários: intra e inter conjuntos de dados, utilizando a métrica de erro absoluto médio. Os resultados experimentais indicaram que os modelos baseados no BERT obtiveram o melhor desempenho no cenário intra bases de dados, mas apresentaram um declínio mais acentuado no cenário inter bases de dados em comparação com os algoritmos tradicionais.

Referências

Alsaadi, B. and Saeedi, K. (2022). Data-driven effort estimation techniques of agile user stories: a systematic literature review. Artificial Intelligence Review, 55(7):5485–5516.

Atoum, I. and Otoom, A. A. (2024). Enhancing software effort estimation with pre-trained word embeddings: A small-dataset solution for accurate story point prediction. Electronics, 13(23).

Awad, M. and Khanna, R. (2015). Efficient Learning Machines: Theories, Concepts, and Applications for Engineers and System Designers. Apress.

Choetkiertikul, M., Dam, H. K., Tran, T., Pham, T., Ghose, A., and Menzies, T. (2018). A deep learning model for estimating story points. IEEE Transactions on Software Engineering, 45(7):637–656.

CORRÊA, W. A. (2020). Aplicando aprendizado de máquina para estimativa de esforço no desenvolvimento de software. Master’s thesis. DEPARTAMENTO DE INFORMÁTICA/CCET.

Devlin, J., Chang, M.-W., Lee, K., and Toutanova, K. (2019). Bert: Pre-training of deep bidirectional transformers for language understanding. In Proceedings of the 2019 conference of the North American chapter of the association for computational linguistics: human language technologies, volume 1 (long and short papers), pages 4171–4186.

Fernandes, J. M. and Machado, R. J. (2017). Requisitos em projetos de software e de sistemas de informação (Portuguese Edition). Novatec Editora. Edição do Kindle., 1ª edição edition.

Fu, M. and Tantithamthavorn, C. (2023). Gpt2sp: A transformer-based agile story point estimation approach. IEEE Transactions on Software Engineering, 49(2):611–625.

Jadhav, A., Shandilya, S. K., Izonin, I., and Muzyka, R. (2024). Multi-step dynamic ensemble selection to estimate software effort. Applied Artificial Intelligence, 38(1):2351718.

Massari, V. (2018). Gerenciamento Ágil de Projetos (2a. edição). Brasport.

Pressman, R. S. and Maxim, B. R. (2021). Engenharia de software. McGraw Hill Brasil, 9ª edição edition.

Pérez-Godoy, M. D., Molina, M., Martínez, F., Elizondo, D., Charte, F., and Rivera, A. J. (2024). Desreg: Dynamic ensemble selection library for regression tasks. Neurocomputing, 580:127487.

Tawosi, V., Moussa, R., and Sarro, F. (2024). Agile effort estimation: Have we solved the problem yet? insights from the replication of the gpt2sp study. In 2024 IEEE International Conference on Software Analysis, Evolution and Reengineering (SANER), pages 1034–1041.

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., and Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30.
Publicado
29/09/2025
GRIGOLETO, Rodrigo De Nadai; OLIVEIRA, Hilário Tomaz Alves de. Evaluating Machine Learning Algorithms for Software Effort Estimation from Textual Descriptions of Requirements. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 22. , 2025, Fortaleza/CE. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 141-152. ISSN 2763-9061. DOI: https://doi.org/10.5753/eniac.2025.11851.

Artigos mais lidos do(s) mesmo(s) autor(es)