Aprendizado de Máquina e Análise de Sentimento em Redes Sociais: Um Estudo de Caso Usando as Eleições Presidenciais em 2022
Resumo
O presente estudo relata o processo de construção e avaliação de modelos de treinamento utilizando de dados textuais extraídos de redes sociais no cenário de segundo turno das eleições presidenciais brasileiras de 2022. O objetivo é uma avaliação da relevância e qualidade que as opiniões expostas publicamente possuem para censos políticos em comparação a pesquisas eleitorais tradicionais defasadas. Os textos são extraídos, processados, classificados e avaliados do ponto de vista dos sentimentos contidos, o que reflete diretamente nas intenções de voto expressas como rejeição ou aprovação direcionado ao candidato. Estabeleceu-se uma relação entre os resultados obtidos com os resultados reais e de fontes de pesquisa populares no país.
Referências
Jadhav, R., & M. S., W. (2017). Survey: Sentiment Analysis of Twitter Data for Stock Market Prediction. IJARCCE, 6(3), 558–562. https://doi.org/10.17148/ijarcce.2017.63129
Oliveira, D. J. S., Bermejo, P. H. d. S., & dos Santos, P. A. (2016). Can social media reveal the preferences of voters? A comparison between sentiment analysis and traditional opinion polls. Journal of Information Technology & Politics, 14(1), 34–45. https://doi.org/10.1080/19331681.2016.1214094
Barbosa, S., & Silva, B. (2010). Interação humano-computador. Elsevier Brasil.
Caetano, J., Lima, H., dos Santos, M., & Marques-Neto, H. (2017). Utilizando Análise de Sentimentos para Definição da Homofilia Política dos Usuários do Twitter durante a Eleição Presidencial Americana de 2016. In Anais do VI Brazilian Workshop on Social Network Analysis and Mining. Porto Alegre: SBC. doi:10.5753/brasnam.2017.3246
Digital 2021 - We Are Social UK. (s.d.). We Are Social UK. [link]
Boiy, E., & Moens, M.-F. (2008). A machine learning approach to sentiment analysis in multilingual Web texts. Information Retrieval, 12(5), 526–558. https://doi.org/10.1007/s10791-008-9070-z
Rosa, R. L. (2015). Análise de sentimentos e afetividade de textos extraídos das redes sociais. Tese de Doutorado, Escola Politécnica, Universidade de São Paulo, São Paulo. doi:10.11606/T.3.2016.tde-19072016-115713. Recuperado em 2023-07-03, de [link]
Gomes, J., Pimenta, R., & Schneider, M. (2019). no campo ENANCIB. Acesso em [link].
Costa, E., Baker, R. S., Amorim, L., Magalhães, J., & Marinho, T. (2012). Mineração de dados educacionais: conceitos, técnicas, ferramentas e aplicações. Jornada de Atualização em Informática na Educação, 1(1), 1-29.
Morais, E. A. M., Ambrósio, A. P. L. (2007). Mineração de Textos (Relatório Técnico - INF_005/07). [link].
Batista, G. E. A. P. A. (2003). Pré-processamento de dados em aprendizado de máquina supervisionado. Tese de Doutorado, Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. doi:10.11606/T.55.2003.tde-06102003-160219. Recuperado em 2023-07-03, de [link]
Martins, C. A. (2003). Uma abordagem para pré-processamento de dados textuais em algoritmos de aprendizado. Tese de Doutorado, Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Paulo.
Matsubara, E. T., Martins, C. A., & Monard, M. C. (2003). Pretext: Uma ferramenta para pré-processamento de textos utilizando a abordagem bag-of-words.
Manning, C. D. (2008). Introduction to Information Retrieval. Cambridge University Press.
Ricci, R. D. (2020). Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019. Trabalho de Conclusão de Curso, Graduação em Estatística, Universidade Federal de Uberlândia, Uberlândia. Recuperado em 2023-07-03, de [link]
Monard M. C., Baranauskas A. J. (2003). Conceitos sobre Aprendizado de Máquina. In Sistemas inteligentes Fundamentos e aplicações (p. 89–114). Manole Ltda.
Ferri, C., Hernández-Orallo, J., & Modroiu, R. (2009). An experimental comparison of performance measures for classification. Pattern Recognition Letters, 30(1), 27–38.
Souza, B. F. (2010). Meta-aprendizagem aplicada à classificação de dados de expressão gênica. Tese de Doutorado, Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. doi:10.11606/T.55.2010.tde-04012011-142551. Recuperado em 2023-07-03, de [link]
DEVIKA, M. D.; SUNITHA, C.; GANESH, Amal. Sentiment Analysis: A Comparative Study on Different Approaches. Procedia Computer Science, v. 87, p. 44-49, 2016.
Karthika P., Murugeswari R. and Manoranjithem R. (2019). Sentiment Analysis of Social Media Network Using Random Forest Algorithm. IEEE International Conference on Intelligent Techniques in Control, Optimization and Signal Processing (INCOS), Tamilnadu, India, 1-5.
Sulaiman, S., Wahid, R. A., Hanee Ariffin, A., & Zalina Zulkifli, C. (2002). Question Classification Based on Cognitive Levels using Linear SVC. Test Engineering and Management, 83, 6463–6470.
SCIKIT-LEARN: machine learning in Python — scikit-learn 1.3.1 documentation. Disponível em: [link]. Acesso em: 11 out. 2023.
Folha. (2022, 31 de outubro). Na véspera da eleição, Lula tem 52%, e Bolsonaro, 48%. Folha de São Paulo. [link].
G1. (2022, 29 de outubro). Ipec: Lula tem 54% dos votos válidos no 2º turno, e Bolsonaro, 46%. G1. [link].