Análise de Dados para Comunicação Política a partir de um Sistema de Coleta de Tweets

  • Alexandre A. P. Heine Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
  • Bruno Coutinho Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
  • Mariana Barreto Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
  • Nicholas Xavier University of British Columbia
  • Marcos V. Villas Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
  • Arthur Ituassu Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
  • Sérgio Lifschitz Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)

Resumo


Este artigo apresenta o projeto, a pesquisa e o desenvolvimento de uma ferramenta de coleta e análise de dados do Twitter, que tem por objetivo avaliar os dados publicados nesta rede social, em particular voltados para a área de comunicação política. Além de explicar brevemente a arquitetura do sistema, descrevemos algumas funcionalidades importantes, a saber: a coleta de dados por streaming; as análises relativas aos links compartilhados; a identificação de usuários que realizaram retweets; e o estudo de polaridade dos sentimentos expressos no corpo dos tweets. Dentre os desafios encontrados destacamos o pré-processamento dos dados coletados, as limitações no uso da API do Twitter e a obtenção e preparação da bases de dados para a análise de sentimentos.

Palavras-chave: Twitter, Análise de Sentimentos, Mídia, Comunicação Política, Bots

Referências

Araújo, M., Pereira, A., and Benevenuto, F. (2020). A comparative study of machine translation for multilingual sentence-level sentiment analysis. Information Sciences, 512:1078–1102

Carvalho, P. and Silva, M. J. (2015). Sentilex-pt: Principais características e potencialidades. Oslo Studies in Language, 7(1).

dos Santos, J. G. B., Ituassu, A., Lifschitz, S., Guimarães, T., Cerqueira, D., Albu, D., Fernando, R., Ferreira, J. H., and Mondelli, M. L. (2021). Das milícias digitais ao comportamento coordenado: métodos interdisciplinares de análise e identificação de bots nas eleições brasileiras. In Anais do X Brazilian Workshop on Social Network Analysis and Mining, pages 187–192. SBC.

Gonçalo Oliveira, H., Paulo-Santos, A., and Gomes, P. (2014). Assigning polarity automatically to the synsets of a wordnet-like resource. In Symposium on Languages, Applications and Technologies (SLATE), OASICS, pages 169–184.

Ituassu, A., Lifschitz, S., Capone, L., Vaz, M. B., and Mannheimer, V. (2018). Compartilhamento de mídia e preferência eleitoral no twitter: uma análise de opinião pública durante as eleições de 2014 no Brasil. Palabra Clave [online], 21(3):860–884.

Rabelo, L. (2010). As mídias sociais e a esfera pública: mudanças de paradigma na comunicação contemporânea. In Anais do XII Congresso de Ciências da Comunicação na Região Centro-Oeste, pages 27–29.

Rodriguez, A. M., Sava, P. S., Ituassu, A., and Lifschitz, S. (2019). Sistema web crawler para coleta automática de tweets, persistência em bancos de dados e análises estatísticas. In Companion Proceedings SBBD, pages 325–332.

Silva, E. A. and de Oliveira, L. F. R. (2018). Análise de sentimentos: Identificando sentimentos em comentários da rede humaniza SUS. In II Workshop de Informação, Dados e Tecnologia, UFPB.
Publicado
04/10/2021
HEINE, Alexandre A. P.; COUTINHO, Bruno; BARRETO, Mariana; XAVIER, Nicholas; VILLAS, Marcos V.; ITUASSU, Arthur; LIFSCHITZ, Sérgio. Análise de Dados para Comunicação Política a partir de um Sistema de Coleta de Tweets. In: WORKSHOP DE TRABALHOS DE ALUNOS DA GRADUAÇÃO (WTAG) - SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 36. , 2021, Rio de Janeiro. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 49-55. DOI: https://doi.org/10.5753/sbbd_estendido.2021.18162.