Análise de polaridade e de tópicos em tweets no domínio da política no Brasil

  • Leonardo Capellaro UFSCar
  • Helena de Medeiros Caseli UFSCar

Resumo


O campo da política no Brasil é um dos mais movimentados e mais polêmicos da última década. Com o advento das redes sociais, um novo canal de comunicação entre os eleitores e os políticos foi criado, com os usuários tendo um espaço para publicar suas opiniões e crenças. Neste contexto, este trabalho mostra como modelos BERT se saem na análise de polaridade (positiva, negativa ou neutra) e de tópicos de grandes quantidades de tweets relacionados à política do Brasil. Experimentos foram realizados com tweets relacionados às eleições de 2018, e melhores resultados (F1 = 96%) foram obtidos para a classificação de polaridade em comparação com trabalhos anteriores. A avaliação qualitativa dos tópicos também mostrou resultados promissores.

Referências

Bertaglia, T. F. C. e Nunes, M. d. G. V. (2016). Exploring word embeddings for unsupervised textual user-generated content normalization. In Proceedings of the 2nd Workshop on Noisy User-generated Text (WNUT), pages 112–120.

Campello, R. J. G. B., Moulavi, D., e Sander, J. (2013). Density-based clustering based on hierarchical density estimates. In Pei, J., Tseng, V. S., Cao, L., Motoda, H., e Xu, G., editors, Advances in Knowledge Discovery and Data Mining, pages 160–172, Berlin, Heidelberg. Springer Berlin Heidelberg.

Christhie, W., Reis, J. C. S., Moro, F. B. M. M., e Almeida, V. (2018). Detecção de posicionamento em tweets sobre política no contexto brasileiro. In Anais do VII Brazilian Workshop on Social Network Analysis and Mining, Porto Alegre, RS, Brasil. SBC.

Cristiani, A., Lieira, D., e Camargo, H. (2020). A sentiment analysis of brazilian elections tweets. In Anais do VIII Symposium on Knowledge Discovery, Mining and Learning, pages 153–160, Porto Alegre, RS, Brasil. SBC.

Devlin, J., Chang, M.-W., Lee, K., e Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. In Proceedings of NAACLHLT 2019, page 4171–4186.

Grootendorst, M. (2020). BERTopic: Leveraging BERT and c-TF-IDF to create easily interpretable topics.

Moreira, R., Vaz de Melo, P., e Pappa, G. (2020). Elite versus mass polarization on the brazilian impeachment proceedings of 2016. Social Network Analysis and Mining, 10(92).

Pereira, J. G. (2019). Análise de sentimentos da população brasileira em relação a eleição presidencial de 2018 através da rede social twitter. Trabalho de Conclusão de Curso (Bacharelado) Universidade Federal do Rio Grande do Norte. Centro de Ensino Superior do Seridó. Departamento de Computação e Tecnologia.

Pinto, M. A. S., Junior, A. F. L. J., Busson, A. J. G., e Colcher, S. (2020). Relacionando modelagem de tópicos e classificação de sentimentos para análise de mensagens do twitter durante a pandemia da covid-19. In Anais Estendidos do XXVI Simpósio Brasileiro de Sistemas Multimídia e Web, pages 61–64, Porto Alegre, RS, Brasil. SBC.

Sales, M. L. e Barbosa, M. W. (2019). Uma avaliação do potencial de uso dos dados do Twitter para a predição do resultado de eleições: O caso das eleições presidenciais brasileiras de 2018. Revista de Informática Aplicada RIA, 15(2):30–43.

Silveira, R., Fernandes, C. G., Neto, J. A. M., Furtado, V., e Filho, J. E. P. (2021). Topic modelling of legal documents via legal-bert1. In RELATED Relations in the Legal Domain Workshop, in conjunction with ICAIL 2021, São Paulo, Brazil.

Souza, F., Nogueira, R., e Lotufo, R. (2020). BERTimbau: pretrained BERT models for Brazilian Portuguese. In Lecture Notes in Computer Science – Proceedings of the 9th Brazilian Conference on Intelligent Systems (BRACIS), volume 12319, pages 403–417.
Publicado
29/11/2021
Como Citar

Selecione um Formato
CAPELLARO, Leonardo; CASELI, Helena de Medeiros. Análise de polaridade e de tópicos em tweets no domínio da política no Brasil. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 13. , 2021, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 47-55. DOI: https://doi.org/10.5753/stil.2021.17783.