Classificação de Artigos de Engenharia de Software: uma Replicação Experimental Estendida

Ramon Pereira; Alcemir Santos

doi:10.5753/ercemapi.2020.11476

Ramon Pereira UESPI
Alcemir Santos UESPI

DOI: https://doi.org/10.5753/ercemapi.2020.11476

Resumo

Busca de informação científica em grandes volumes de dados não é uma tarefa trivial. A classificação automatizada de texto científico é uma forma de contornar o problema. Embora haja evolução dos algoritmos de classificação, pouco é feito sobre a classificação de textos de engenharia de software. As soluções identificadas apresentam resultados não conclusivos, o que abre espaço para estudos de replicação experimental em busca de novas evidências. Este artigo avalia a eficiência dos algoritmos (Naive Bayes, J48 e SVM) na classificação de artigos de engenharia de software através de uma replicação estendida de estudo primário. Os resultados desta pesquisa apontaram um melhor desempenho, com ênfase para o SVM.

Referências

Ahmed, E., Ashraf, S., and Shahzad, W. (2020). An effective way to enhance classifications for the semi-structured research articles. University of Sindh Journal of Information and Communication Technology, 4(1):45–51.

Dosciatti, M. M., Ferreira, L., and Paraiso, E. (2013). Identificando emoções em textos em português do brasil usando máquina de vetores de suporte em solução multiclasse.

ENIAC-Encontro Nacional de Inteligência Artificial e Computacional. Fortaleza, Brasil.

Lagerkrants, E. and Holmström, J. (2016). Using machine learning to classify news articles.

Monard, M. C. and Baranauskas, J. A. (2003). Conceitos sobre aprendizado de máquina. Sistemas inteligentes-Fundamentos e aplicações, 1(1):32.

Popper, K. (2005). The Logic of Scientific Discovery. This Edotion Published, volume 2. New York: The Taylor & Francis e-Library.

Santos, J. A. M., Santos, A. R., and Mendonça, M. G. (2015). Investigating bias in the search phase of software engineering secondary studies. In CIbSE, page 488.

Schneider, J. (1997). Cross validation, feb 7, 1997. URL: https://www.cs.cmu.edu/˜schneide/tut5/node42.html (visited on 06/07/2019).

Vapnik, V. N. (2000). Direct methods in statistical learning theory. In The nature of statistical learning theory, pages 225–265. Springer.

Wohlin, C., Runeson, P., Höst, M., Ohlsson, M. C., Regnell, B., and Wesslén, A. (2012). Experimentation in software engineering. Springer Science & Business Media.

Woodson, C., Hayes, J. H., and Griffioen, S. (2018). Towards reproducible research: automatic classification of empirical requirements engineering papers. In Proceedings of the ACMSE 2018 Conference, pages 1–7.