Analysis of Twitter users' sentiments about the first round 2022 presidential election in Brazil
Resumo
O crescimento da internet e da comunicação por meio das redes sociais, facilitou a obtenção de informações sobre o que outros indivíduos estão pensando e qual a opinião deles para determinado assunto, porém, uma pessoa manualmente não consegue analisar todos os comentários na rede sobre certo tema, sendo necessário o uso de tecnologias, computadores e algoritmos para auxiliar na análise dos dados. Diante disso, este trabalho tem o objetivo de coletar, processar e classificar os sentimentos de uma amostra de textos publicados no Twitter, em Português, sobre as eleições presidenciais no Brasil em 2022, utilizando o processo de Descoberta de Conhecimento em Base de Dados para analisar os comentários e conseguir classificar os tweets entre opiniões positivas, neutras e negativas. Nós usamos duas representações textuais clássicas (Bag of Words and TFIDF) e seis classificadores (Naive Bayes, Decision Tree, Random Forest, K-Nearest Neighbors, MLP, e SVM) Desse modo, predizer qual candidato tem uma maior aceitação/rejeição por parte dos brasileiros nas eleições de 2022, considerando apenas os candidatos com melhores posições nas pesquisas de intenção de votos. De acordo com os resultados obtidos empregando um dataset balanceado no treinamento dos algoritmos, o candidato com maior porcentagem de sentimentos positivos foi Jair Bolsonaro, sentimentos neutros foi Luiz Inácio Lula da Silva e sentimentos negativos foi Ciro Gomes.
Referências
Caetano, J. A. C., Lima, H. S. L., dos Santos Santos, M. F., and Marques-Neto, H. T. M.-N. (2017). Utilizando análise de sentimentos para definição da homofilia política dos usuários do twitter durante a eleição presidencial americana de 2016. In Congresso da Sociedade Brasileira de Computação-CSBC.
de Camargo Penteado, C. L. and Guerbali, J. G. (2016). As manifestações do impeachment no twitter: uma análise sobre as manifestações de 2015. Ponto-e-Vírgula: Revista de Ciências Sociais, (19).
de Queiroz, G. G. and Almeida, L. (2020). Uma metodologia de análise de sentimentos dos candidatos as eleições presidenciais de 2018 no twitter. Revista de Engenharia e Pesquisa Aplicada, 5(1):21–30.
Ferrari, D. G. and Silva, L. N. d. C. (2017). Introdução a mineração de dados. Saraiva Educação SA.
Garcia, K. and Berton, L. (2021). Topic detection and sentiment analysis in twitter content related to covid-19 from brazil and the usa. Applied soft computing, 101:107057.
Jack Dorsey, E. W. e. B. S. Sobre o twitter. [On-line], [link]. accessed: 27.01.2022.
Koehn, P. and Mihalcea, R. (2009). Proceedings of the 2009 conference on empirical methods in natural language processing. In Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing.
Lorena, A. C., Gama, J., and Faceli, K. (2000). Inteligência artificial: uma abordagem de aprendizado de máquina. Grupo Gen-LTC.
Matsubara, E. T., Martins, C. A., and Monard, M. C. (2003). Pretext: Uma ferramenta para pré-processamento de textos utilizando a abordagem bag-of-words. Techinical Report, 209(4):10–11.
Passos, E. and Goldschmidt, R. (2005). Data mining: um guia prático. Editora Campus, Rio de Janeiro.
Silva, L. R. (2018). Análise de sentimentos aplicada à política.
Silva, N. (2010). Bestchoice: Classificação de sentimento em ferramentas de expressão de opinião. Trabalho de Graduação em Ciência da Computação–Centro de Informática/UFPE, Recife.
Viana, Z. L. (2014). Mineração de textos: análise de sentimentos utilizando tweets referentes às eleições presidenciais 2014.