Análise exploratória de tweets do Governo de Santa Catarina utilizando Modelagem de Tópicos
Resumo
Modelagem de tópicos tem sido amplamente utilizada para descobrir tópicos e agrupar documentos de uma coleção de documentos de entrada. O Twitter é uma das plataformas mais utilizadas para divulgação de notícias, sendo uma fonte valiosa de informação para os cidadãos. Utilizando tweets extraídos da conta oficial do Governo de Santa Catarina e LDA para extração de tópicos, este trabalho visa identificar os assuntos recorrentes divulgados nos anos de 2019, 2020 e 2021. Como resultado, é possível identificar os assuntos mais importantes publicados pela conta oficial no período selecionado.
Referências
Blei, D. M., Ng, A. Y., and Jordan, M. I. (2003). Latent dirichlet allocation. Journal of machine Learning research, 3(Jan):993–1022.
Chehal, D., Gupta, P., and Gulati, P. (2021). Implementation and comparison of topic modeling techniques based on user reviews in e-commerce recommendations. Journal of Ambient Intelligence and Humanized Computing, 12(5):5055–5070.
Duarte, D. and Stahl, N. (2019). Machine learning: a concise overview. In Said, A. and Torra, V., editors, Data Science in Practice, pages 27–58. Springer.
Fukuyama, S. and Wakabayashi, K. (2018). Extracting time series variation of topic popularity in microblogs. In Proceedings of iiWAS, pages 365–369, New York, New York, USA. ACM.
Hidayatullah, A. F., Pembrani, E. C., Kurniawan, W., Akbar, G., and Pranata, R. (2018). Twitter topic modeling on football news. In 2018 3rd ICCCS, pages 467–471. IEEE.
Pereira, M. (2019). Análise exploratória de tweets utilizando modelagem de tópicos para textos curtos: caso olimpíadas rio 2016. [link]. Monografia, UFFS, Chapeco, Brasil.
Roder, M., Both, A., and Hinneburg, A. (2015). Exploring the space of topic coherence measures. In Proceedings of the Eighth WSDM, pages 399–408, USA. ACM.
Steyvers, M. and Griffiths, T. (2007). Probabilistic topic models. In Landauer, T. K., McNamara, D. S., Dennis, S., and Kintsch, W., editors, Handbook of latent semantic analysis, chapter 21, pages 424–440. Laurence Erlbaum Associates.
Yan, X., Guo, J., Lan, Y., and Cheng, X. (2013). A biterm topic model for short texts. In Proceedings of the 22nd WWW. ACM.