Classificação de Artigos de Engenharia de Software: uma Replicação Experimental Estendida

  • Ramon Pereira UESPI
  • Alcemir Santos UESPI

Resumo


Busca de informação científica em grandes volumes de dados não é uma tarefa trivial. A classificação automatizada de texto científico é uma forma de contornar o problema. Embora haja evolução dos algoritmos de classificação, pouco é feito sobre a classificação de textos de engenharia de software. As soluções identificadas apresentam resultados não conclusivos, o que abre espaço para estudos de replicação experimental em busca de novas evidências. Este artigo avalia a eficiência dos algoritmos (Naive Bayes, J48 e SVM) na classificação de artigos de engenharia de software através de uma replicação estendida de estudo primário. Os resultados desta pesquisa apontaram um melhor desempenho, com ênfase para o SVM.

Referências

Ahmed, E., Ashraf, S., and Shahzad, W. (2020). An effective way to enhance classifications for the semi-structured research articles. University of Sindh Journal of Information and Communication Technology, 4(1):45–51.

Dosciatti, M. M., Ferreira, L., and Paraiso, E. (2013). Identificando emoções em textos em português do brasil usando máquina de vetores de suporte em solução multiclasse.

ENIAC-Encontro Nacional de Inteligência Artificial e Computacional. Fortaleza, Brasil.

Lagerkrants, E. and Holmström, J. (2016). Using machine learning to classify news articles.

Monard, M. C. and Baranauskas, J. A. (2003). Conceitos sobre aprendizado de máquina. Sistemas inteligentes-Fundamentos e aplicações, 1(1):32.

Popper, K. (2005). The Logic of Scientific Discovery. This Edotion Published, volume 2. New York: The Taylor & Francis e-Library.

Santos, J. A. M., Santos, A. R., and Mendonça, M. G. (2015). Investigating bias in the search phase of software engineering secondary studies. In CIbSE, page 488.

Schneider, J. (1997). Cross validation, feb 7, 1997. URL: https://www.cs.cmu.edu/˜schneide/tut5/node42.html (visited on 06/07/2019).

Vapnik, V. N. (2000). Direct methods in statistical learning theory. In The nature of statistical learning theory, pages 225–265. Springer.

Wohlin, C., Runeson, P., Höst, M., Ohlsson, M. C., Regnell, B., and Wesslén, A. (2012). Experimentation in software engineering. Springer Science & Business Media.

Woodson, C., Hayes, J. H., and Griffioen, S. (2018). Towards reproducible research: automatic classification of empirical requirements engineering papers. In Proceedings of the ACMSE 2018 Conference, pages 1–7.
Publicado
10/09/2020
PEREIRA, Ramon; SANTOS, Alcemir. Classificação de Artigos de Engenharia de Software: uma Replicação Experimental Estendida. In: ESCOLA REGIONAL DE COMPUTAÇÃO DO CEARÁ, MARANHÃO E PIAUÍ (ERCEMAPI), 8. , 2020, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2020 . p. 125-132. DOI: https://doi.org/10.5753/ercemapi.2020.11476.