Gerenciamento de Dados de Redes Sociais com Análise de Redes e Modelagem de Tópicos

  • Isabella Carmo Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
  • André L. C. Rêgo Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
  • Mariana Barreto Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
  • Marina Schuler Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
  • Alexandre Heine Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio) http://orcid.org/0000-0001-9235-4153
  • Marcos V. Villas Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
  • Sérgio Lifschitz Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)

Resumo


Este artigo diz respeito à gestão, manuseio e análise de dados obtidos de redes sociais digitais. Inicialmente, explica-se como as informações coletadas foram usadas para realizar análises, detalhando o uso de um software dedicado à análise de redes, para observar as possı́veis comunidades, e o uso de algoritmos para modelagem de tópicos. São apresentados resultados práticos para cada um destes processos de enriquecimento dos dados para pesquisas envolvendo postagens sobre vacinação no Brasil e respostas a mulheres candidatas nas eleições de 2022 no Brasil. Dentre os desafios encontrados, destacam-se a capacidade para lidar com grandes volumes dados, a aplicação dos conceitos de análise de redes e a inferência de tópicos após a aplicação dos algoritmos. Apesar dos exemplos e experimentos serem relacionados com o Twitter, os assuntos aqui investigados e discutidos podem se aplicar a qualquer rede social.
Palavras-chave: Limpeza de dados, filtragem de informações e publicação, Mineração e análise de dados, Redes sociais e crowdsourcing

Referências

Blondel, V. D., Guillaume, J.-L., Lambiotte, R., and Lefebvre, E. (2008). Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment, 2008(10):P10008.

Chauhan, U. and Shah, A. (2021). Topic modeling using latent dirichlet allocation: A survey. ACM Comput. Surv., 54(7).

Cherepnalkoski, D. and Mozetic, I. (2015). A retweet network analysis of the european parliament. In Procs. 11th International Conference on Signal-Image Technology & Internet-Based Systems (SITIS), pages 350–357.

Devlin, J., Chang, M.-W., Lee, K., and Toutanova, K. (2019). Bert: Pre-training of deep bidirectional transformers for language understanding.

Gargiulo, F., Cafiero, F., Guille-Escuret, P., Seror, V., and Ward, J. K. (2020). Asymmetric participation of defenders and critics of vaccines to debates on french-speaking twitter. Scientific reports, 10(1):1–12.

Grootendorst, M. (2022). Bertopic: Neural topic modeling with a class-based tf-idf procedure.

Heine, A., Coutinho, B., Barreto, M., Xavier, N., Villas, M., Ituassu, A., and Lifschitz, S. (2021). Análise de dados para comunicação polı́tica a partir de um sistema de coleta de tweets. In Anais Estendidos do XXXVI Simpósio Brasileiro de Bancos de Dados, pages 49–55, Porto Alegre, RS, Brasil. SBC.

Novak, P. K., Amicis, L. D., and Mozetič, I. (2018). Impact investing market on twitter: influential users and communities. Applied network science, 3(1):1–20.

Page, L., Brin, S., Motwani, R., and Winograd, T. (1999). The pagerank citation ranking: Bringing order to the web. Technical Report 1999-66, Stanford InfoLab. Previous number = SIDL-WP-1999-0120.

Reimers, N. and Gurevych, I. (2019). Sentence-bert: Sentence embeddings using siamese bert-networks.

Verjovsky, M., Barreto, M. P., Carmo, I., Coutinho, B., Thomer, L., Lifschitz, S., and Jurberg, C. (2023). Political quarrel overshadows vaccination advocacy: How the vaccine debate on brazilian twitter was framed by anti-vaxxers during bolsonaro government.
Publicado
25/09/2023
CARMO, Isabella; L. C. RÊGO, André; BARRETO, Mariana; SCHULER, Marina; HEINE, Alexandre; VILLAS, Marcos V.; LIFSCHITZ, Sérgio. Gerenciamento de Dados de Redes Sociais com Análise de Redes e Modelagem de Tópicos. In: WORKSHOP DE TRABALHOS DE ALUNOS DA GRADUAÇÃO (WTAG) - SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 38. , 2023, Belo Horizonte/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 64-70. DOI: https://doi.org/10.5753/sbbd_estendido.2023.233417.