Aprendizado de Máquina e Análise de Sentimento em Redes Sociais: Um Estudo de Caso Usando as Eleições Presidenciais em 2022

  • Bruno La Gatta Oliveira CEFET-MG
  • Luan Soares Oliveira CEFET-MG

Resumo


O presente estudo relata o processo de construção e avaliação de modelos de treinamento utilizando de dados textuais extraídos de redes sociais no cenário de segundo turno das eleições presidenciais brasileiras de 2022. O objetivo é uma avaliação da relevância e qualidade que as opiniões expostas publicamente possuem para censos políticos em comparação a pesquisas eleitorais tradicionais defasadas. Os textos são extraídos, processados, classificados e avaliados do ponto de vista dos sentimentos contidos, o que reflete diretamente nas intenções de voto expressas como rejeição ou aprovação direcionado ao candidato. Estabeleceu-se uma relação entre os resultados obtidos com os resultados reais e de fontes de pesquisa populares no país.

Palavras-chave: Mineração de dados, Algoritmos de classificação, Pesquisas eleitorais

Referências

Pang, B., Lee, L. and Vaithyanathan, S. (2002) Thumbs up?: Sentiment Classification Using Machine Learning Techniques. Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing, 10, 79-86. https://doi.org/10.3115/1118693.1118704

Jadhav, R., & M. S., W. (2017). Survey: Sentiment Analysis of Twitter Data for Stock Market Prediction. IJARCCE, 6(3), 558–562. https://doi.org/10.17148/ijarcce.2017.63129

Oliveira, D. J. S., Bermejo, P. H. d. S., & dos Santos, P. A. (2016). Can social media reveal the preferences of voters? A comparison between sentiment analysis and traditional opinion polls. Journal of Information Technology & Politics, 14(1), 34–45. https://doi.org/10.1080/19331681.2016.1214094

Barbosa, S., & Silva, B. (2010). Interação humano-computador. Elsevier Brasil.

Caetano, J., Lima, H., dos Santos, M., & Marques-Neto, H. (2017). Utilizando Análise de Sentimentos para Definição da Homofilia Política dos Usuários do Twitter durante a Eleição Presidencial Americana de 2016. In Anais do VI Brazilian Workshop on Social Network Analysis and Mining. Porto Alegre: SBC. doi:10.5753/brasnam.2017.3246

Digital 2021 - We Are Social UK. (s.d.). We Are Social UK. [link]

Boiy, E., & Moens, M.-F. (2008). A machine learning approach to sentiment analysis in multilingual Web texts. Information Retrieval, 12(5), 526–558. https://doi.org/10.1007/s10791-008-9070-z

Rosa, R. L. (2015). Análise de sentimentos e afetividade de textos extraídos das redes sociais. Tese de Doutorado, Escola Politécnica, Universidade de São Paulo, São Paulo. doi:10.11606/T.3.2016.tde-19072016-115713. Recuperado em 2023-07-03, de [link]

Gomes, J., Pimenta, R., & Schneider, M. (2019). no campo ENANCIB. Acesso em [link].

Costa, E., Baker, R. S., Amorim, L., Magalhães, J., & Marinho, T. (2012). Mineração de dados educacionais: conceitos, técnicas, ferramentas e aplicações. Jornada de Atualização em Informática na Educação, 1(1), 1-29.

Morais, E. A. M., Ambrósio, A. P. L. (2007). Mineração de Textos (Relatório Técnico - INF_005/07). [link].

Batista, G. E. A. P. A. (2003). Pré-processamento de dados em aprendizado de máquina supervisionado. Tese de Doutorado, Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. doi:10.11606/T.55.2003.tde-06102003-160219. Recuperado em 2023-07-03, de [link]

Martins, C. A. (2003). Uma abordagem para pré-processamento de dados textuais em algoritmos de aprendizado. Tese de Doutorado, Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Paulo.

Matsubara, E. T., Martins, C. A., & Monard, M. C. (2003). Pretext: Uma ferramenta para pré-processamento de textos utilizando a abordagem bag-of-words.

Manning, C. D. (2008). Introduction to Information Retrieval. Cambridge University Press.

Ricci, R. D. (2020). Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019. Trabalho de Conclusão de Curso, Graduação em Estatística, Universidade Federal de Uberlândia, Uberlândia. Recuperado em 2023-07-03, de [link]

Monard M. C., Baranauskas A. J. (2003). Conceitos sobre Aprendizado de Máquina. In Sistemas inteligentes Fundamentos e aplicações (p. 89–114). Manole Ltda.

Ferri, C., Hernández-Orallo, J., & Modroiu, R. (2009). An experimental comparison of performance measures for classification. Pattern Recognition Letters, 30(1), 27–38.

Souza, B. F. (2010). Meta-aprendizagem aplicada à classificação de dados de expressão gênica. Tese de Doutorado, Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. doi:10.11606/T.55.2010.tde-04012011-142551. Recuperado em 2023-07-03, de [link]

DEVIKA, M. D.; SUNITHA, C.; GANESH, Amal. Sentiment Analysis: A Comparative Study on Different Approaches. Procedia Computer Science, v. 87, p. 44-49, 2016.

Karthika P., Murugeswari R. and Manoranjithem R. (2019). Sentiment Analysis of Social Media Network Using Random Forest Algorithm. IEEE International Conference on Intelligent Techniques in Control, Optimization and Signal Processing (INCOS), Tamilnadu, India, 1-5.

Sulaiman, S., Wahid, R. A., Hanee Ariffin, A., & Zalina Zulkifli, C. (2002). Question Classification Based on Cognitive Levels using Linear SVC. Test Engineering and Management, 83, 6463–6470.

SCIKIT-LEARN: machine learning in Python — scikit-learn 1.3.1 documentation. Disponível em: [link]. Acesso em: 11 out. 2023.

Folha. (2022, 31 de outubro). Na véspera da eleição, Lula tem 52%, e Bolsonaro, 48%. Folha de São Paulo. [link].

G1. (2022, 29 de outubro). Ipec: Lula tem 54% dos votos válidos no 2º turno, e Bolsonaro, 46%. G1. [link].
Publicado
18/10/2023
Como Citar

Selecione um Formato
OLIVEIRA, Bruno La Gatta; OLIVEIRA, Luan Soares. Aprendizado de Máquina e Análise de Sentimento em Redes Sociais: Um Estudo de Caso Usando as Eleições Presidenciais em 2022. In: CONGRESSO LATINO-AMERICANO DE SOFTWARE LIVRE E TECNOLOGIAS ABERTAS (LATINOWARE), 20. , 2023, Foz do Iguaçu/PR. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 107-112. DOI: https://doi.org/10.5753/latinoware.2023.236551.