Análise de Sentimentos: Avaliando o Desempenho de Pré-Processamento e de Algoritmos de Aprendizagem de Máquina sobre o Dataset TweetSentBR

  • Laerte dos Santos Cardozo UFPel
  • Larissa Astrogildo de Freitas UFPel

Resumo


A análise de sentimentos é o campo de estudo responsável por analisar as opiniões contidas em aplicações ou serviços, os quais estão sendo muito utilizados pela sociedade. Neste trabalho, foi realizada uma análise de sentimentos no dataset TweetSentBR, na qual foram utilizadas técnicas de aprendizado de máquina para identificação dos sentimentos contidos nos textos. Foram aplicadas abordagens de pré-processamento para os algoritmos os classificarem. Os melhores resultados apresentaram uma Medida F com predição de 82% para a polaridade binária utilizando SVM.
Palavras-chave: Análise de Sentimento, Aprendizado de Máquina, Processamento de Língua Natural

Referências

Benevenuto, F., Ribeiro, F., and Araújo, M. (2015). Métodos para análise de sentimentos em mídias sociais. In Proceedings of the Brazilian Symposium on Multimedia and the Web (Webmedia), Manaus, Brasil. Webmedia.

Britto, L. F. S. and Pacífico, L. D. S. (2019). Sentiment analysis for mobile app reviews in brazilian portuguese. In 2019 Encontro Nacional de Inteligência Artificial e Computação (ENIAC 2019), volume 1, pages 1–12, Salvador. SBC.

Brum, H. B. and Nunes, M. G. V. (2018). Building a sentiment corpus of tweets in brazilian portuguese. In Eleventh International Conference on Language Resources and Evaluation (LREC 2018), Miyazaki, Japão. European Language Resources Association (ELRA).

Coelho, A. R. (2007). Stemming para a língua portuguesa: estudo, análise e melhoria do algoritmo rslp. Monografia (Graduação em Ciência da Computação), UFRGS (Universidade Federal do Rio Grande do Sul), Porto Alegre, Brasil.

Cortes, C. and Vapnik, V. (1995). Support-vector networks. Machine Learning, 20(3):273–297.

Hochreiter, S. and Schmidhuber, J. (1997). Long short-term memory. Neural Computation, 9(8):1735–1780.

Kumar, V. and Subba, B. (2020). A tfidfvectorizer and svm based sentiment analysis framework for text data corpus. In 2020 National Conferenceon Communications (NCC), pages 1–6.

Liu, B. (2012). Sentiment analysis and opinion mining, volume 5 of Synthesis Lectures on Human Language Technologies. Morgan & Claypool Publishers, USA.

Martins, R. F., Pereira, A., and Benevenuto, F. (2015). An approach to sentiment analysis of web applications in portuguese. In Proceedings of the 21st Brazilian Symposium on Multimedia and the Web, pages 105–112, New York, NY, USA. ACM, Association for Computing Machinery.

Nascimento, P. A. (2019). Aplicando ensemble para classificação de textos curtos em português do brasil. Dissertação (Mestrado em Ciência da Computação), Universidade Federal de Pernambuco (UFPE), Recife, Brasil.

Orengo, V. and Huyck, C. (2001). A stemming algorithm for the portuguese language. In String Processing and Information Retrieval, International Symposium on, page 0186, Los Alamitos, CA, USA. IEEE Computer Society.

Porter, M. F. (2001). Snowball: A language for stemming algorithms. Disponível em: http://snowball.tartarus.org/texts/introduction.html. Acesso em: 17 dez. 2020.

Russell, S. and Norvig, P. (2013). Inteligência Artificial. Elsevier Editora, Rio de Janeiro, 3 edition.

Sakiyama, K., de Souza Rodrigues, L., and Matsubara, E. T. (2020). Can twitter data estimate reality show outcomes? In Intelligent Systems, pages 466–482, Cham. Springer International Publishing.
Publicado
18/07/2021
CARDOZO, Laerte dos Santos; FREITAS, Larissa Astrogildo de. Análise de Sentimentos: Avaliando o Desempenho de Pré-Processamento e de Algoritmos de Aprendizagem de Máquina sobre o Dataset TweetSentBR. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING (BRASNAM), 10. , 2021, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 169-174. ISSN 2595-6094. DOI: https://doi.org/10.5753/brasnam.2021.16135.