Aplicação de Modelos de Tópicos em análises automatizadas de discursos de senadores brasileiros
Resumo
Neste trabalho, pretende-se aplicar os modelos de tópicos e avaliar os resultados a fim de se obter informações relacionandos os assuntos dos discursos dos senadores ao longo do tempo. O contexto atual da sociedade é marcado por um excesso de informações. Dessa forma, uma abordagem de análise automatizada pode facilmente explicitar padrões em grandes coleções de dados. Uma dessas abordagens é a Modelagem de Tópicos. Tal ferramenta consome grandes coleções de documentos e evidencia padrões na forma de tópicos, que são conjuntos de palavras que descrevem um campo semântico. Neste contexto, almeja-se obter padrões ao analisar os tópicos obtidos a partir da extensa base textual de discursos de senadores, disponibilizada pelo Senado Federal. Acredita-se que é possível correlacionar a evolução temporal dos tópicos dos discursos com eventos históricos, políticos e econômicos. Os resultados encontrados são comparados com projetos de leis, datas relevantes e artigos jornalísticos. Com isso, este trabalho pode promover transparência aos cidadãos em relação às informações obtidas dos discursos de seus parlamentares. Por fim, o trabalho pode ser estendido com a avaliação de outras propostas de implementação de Modelos de Tópicos mais modernas.
Referências
Blei, D. M. (2012). Probabilistic topic models, surveying a suite of algorithms that offer a solution to managing large document archives. Communications of the acm.
Blei, D. M., Ng, A. Y., and Jordan, M. I. (2003). Latent dirichlet allocation. J. Mach. Learn. Res., 3(null):993-1022.
Boyd-Graber, J. (2017). Applications of topic models. Department of Computer Science, umiacs, Language Science - University of Maryland.
Boyd-Graber, J., Mimno, D., and Newman, D. (2014). Care and Feeding of Topic Models: Problems, Diagnostics, and Improvements. CRC Handbooks of Modern Statistical Methods. CRC Press, Boca Raton, Florida.
Chang, J., Gerrish, S., Wang, C., Boyd-graber, J., and Blei, D. (2009). Reading tea leaves: How humans interpret topic models. In Bengio, Y., Schuurmans, D., Lafferty, J., Williams, C., and Culotta, A., editors, Advances in Neural Information Processing Systems, volume 22. Curran Associates, Inc.
Lau, J. H., Newman, D., and Baldwin, T. (2014). Machine reading tea leaves: Automatically evaluating topic coherence and topic model quality. In Proceedings of the 14th Conference of the European Chapter of the Association for Computational Linguistics, pages 530-539, Gothenburg, Sweden. Association for Computational Linguistics.
Moreira, D. (2020). Com a palavra os nobres deputados: ênfase temática dos discursos dos parlamentares brasileiros. DADOS, Rio de Janeiro.
Newman, D., Karimi, S., and Cavedon, L. (2011). External evaluation of topic models. ADCS 2009 Proceedings of the Fourteenth Australasian Document Computing Symposium.
Thiago de Paulo Faleiros, A. d. A. L. (2016). Modelos probabilÍsticos de tÓpicos: Desvendando o latent dirichlet allocation. Instituto de Ciências Matemáticas e de Computação (ICMC/USP), São Carlos - SP.
Wallach, H. M., Murray, I., Salakhutdinov, R., and Mimno, D. (2012). Evaluation methods for topic models. Communications of the acm.