Avaliação empírica de termos técnicos em issues de projetos opensource

Joselito  Mota Júnior; Ivan Machado

Joselito Mota Júnior Universidade Federal da Bahia
Ivan Machado Universidade Federal da Bahia

Resumo

A demanda crescente por sistemas de software robustos e confiáveis tem levado a comunidade científica e a indústria de software a investigar aspectos relacionados aos defeitos reportados em sistemas de rastreamento de defeitos. O objetivo comum é compreender as causas dos defeitos, e assim estabelecer estratégias para prevenir sua ocorrência e propagação, reduzindo possíveis danos. Os defeitos reportados por usuários através de issues em rastreadores de defeitos revelam informações importantes para os desenvolvedores. A presente investigação realizou uma análise de dados provenientes de 510.212 issues de 85 repositórios de projetos de código-fonte aberto, disponíveis no Github. Com o auxílio de uma lista de 608 termos técnicos selecionados manualmente, foi analisada a frequência na utilização dos termos pelos contribuidores desses repositórios. O estudo encontrou o emprego dos termos nos diferentes campos de uma issue, bem como a possibilidade de identificação dos termos mais utilizados nestes repositórios. Os resultados deste estudo apontam para ganhos potenciais na compreensão do ambiente de falhas por apresentar termos que formam indicativos de defeitos em estruturas fundamentais do repositório.

Palavras-chave: Engenharia de software, mineração de dados, defeitos, issues, termos técnicos

Referências

Abal, I., Brabrand, C., and Wasowski, A. (2014). 42 variability bugs in the linux kernel: a qualitative analysis. In Proceedings of the 29th ACM/IEEE International Conference on Automated Software Engineering (ASE), pages 421–432.

Boechat, G., Junior, J. M., Machado, I., and Mendonca, M. (2019). Analise de sentimentos em discussoes de issues reabertas do github. In Anais do VII Workshop on Software Visualization, Evolution and Maintenance (VEM), pages 13–20. SBC.

Card, D. N. (1998). Learning from our mistakes with defect causal analysis. IEEE software, 15(1):56–63.

Catolino, G., Palomba, F., Zaidman, A., and Ferrucci, F. (2019). Not all bugs are the same: Understanding, characterizing, and classifying bug types. Journal of Systems and Software, 152:165–181.

Grady, R. B. (1996). Software failure analysis for high-return process improvement decisions. Hewlett Packard Journal, 47:15–24.

Gromova, A., Itkin, I., Pavlov, S., and Korovayev, A. (2019). Raising the quality of bug reports by predicting software defect indicators. In 2019 IEEE 19th International Conference on Software Quality, Reliability and Security Companion (QRS-C), pages 198–204. IEEE.

Karahroudy, A. A. and Tabrizi, M. (2011). Software defect taxonomy, analysis and overview. In Proceedings of the International Conference on Software Engineering Research and Practice (SERP).

Sullivan, M. and Chillarege, R. (1991). Software Defects and their Impact on System Availability: A Study of Field Failures in Operating Systems. In International Symposium on Fault-Tolerant Computing, volume 21, pages 2–9.

Zubrow, D. (2009). IEEE Standard Classification for Software Anomalies. IEEE Computer Society.