Topic and sentiment analysis in Brazilian indigenous letters
Abstract
This article presents preliminary results from a computational analysis of sentiment and keywords in a corpus of over 1,500 Brazilian Indigenous letters. We used pre-trained language models to detect affective polarity and extract representative terms from the texts, aiming to explore the feasibility of culturally sensitive fact-checking solutions. The results suggest consistent patterns between themes and emotions, while also revealing current technical limitations.References
Arora, A. et al. (2023). Risk and the future of ai: Algorithmic bias, data colonialism, and marginalization. Information and Organization, 33(3):100478.
Bender, E. M., Gebru, T., McMillan-Major, A., and Shmitchell, S. (2021). On the dangers of stochastic parrots: Can language models be too big? In Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, pages 610–623.
Costa, S. L. (2013). O que (ainda) podem as cartas? Revista de Estudos em Língua e Literatura, 19:87–98.
Costa, S. L. (2018). As cartas das mulheres indígenas ao brasil. Estudos Linguísticos e Literários, 59:109–123.
Costa, S. L. (2019). As cartas dos povos indígenas ao brasil: a construção do arquivo 2000–2015. Memoria Americana. Cuadernos de Etnohistoria, 26:94.
Costa, S. L. (2021). Gestos de utopia no sul global: as cartas indígenas para o mundo. Thomas Project Journal for Utopian Thoughts, 5:75–89.
Costa, S. L. and Xucuru-Kariri, R. (2018). Autoria indígena em quinze anos de cartas. Trabalhos em Linguística Aplicada, 57:1364–1376.
Dantas, A. C. (2024). caramelo-smile (revision 2707a19).
Defensoria Pública do Estado do Paraná and Universidade Federal do Paraná (2025). Contribuições ao estudo do comitê consultivo do conselho de direitos humanos sobre o impacto da desinformação no gozo e na realização dos direitos humanos. [link]. Acesso em: 20 mar. 2025.
Graves, L. (2018). Understanding the promise and limits of automated fact-checking. Technical report, Reuters Institute for the Study of Journalism.
Grootendorst, M. (2020). Keybert: Minimal keyword extraction with bert.
Henz, M., Heckler, W., and Barbosa, J. (2025). Uma avaliação da capacidade de modelos de linguagem para análise de sentimentos em um contexto de saúde mental. In Anais do XXV Simpósio Brasileiro de Computação Aplicada à Saúde, pages 293–304, Porto Alegre, RS, Brasil. SBC.
Noble, S. U. (2018). Algorithms of Oppression: How Search Engines Reinforce Racism. New York University Press, New York.
O’Neil, C. (2016). Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. Crown, New York, USA.
OpenAI (2024). Gpt-4 technical report.
Prestes, E., Barbosa, L. V. F., Del Grossi, V. C. D., Gonzaga de Azevedo, C. P., Macedo, G., and Maffei, R. (2024). Ai and brazil’s indigenous populations: A call for participation. Technical report, UNESCO. Acesso em: março de 2025.
Simões-Gomes, L., Roberto, E., and Mendonça, E. (2020). Viés algorítmico: Um balanço provisório. Estudos Sociológicos, 25(48):139–166.
Souza, F., Nogueira, R., and Lotufo, R. (2020). BERTimbau: pretrained BERT models for Brazilian Portuguese. In 9th Brazilian Conference on Intelligent Systems, BRACIS, Rio Grande do Sul, Brazil, October 20-23 (to appear).
UNESCO (2021). Recommendation on the ethics of artificial intelligence. Acesso em: março de 2025.
Vosoughi, S., Roy, D., and Aral, S. (2018). The spread of true and false news online. Science, 359(6380):1146–1151.
Bender, E. M., Gebru, T., McMillan-Major, A., and Shmitchell, S. (2021). On the dangers of stochastic parrots: Can language models be too big? In Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, pages 610–623.
Costa, S. L. (2013). O que (ainda) podem as cartas? Revista de Estudos em Língua e Literatura, 19:87–98.
Costa, S. L. (2018). As cartas das mulheres indígenas ao brasil. Estudos Linguísticos e Literários, 59:109–123.
Costa, S. L. (2019). As cartas dos povos indígenas ao brasil: a construção do arquivo 2000–2015. Memoria Americana. Cuadernos de Etnohistoria, 26:94.
Costa, S. L. (2021). Gestos de utopia no sul global: as cartas indígenas para o mundo. Thomas Project Journal for Utopian Thoughts, 5:75–89.
Costa, S. L. and Xucuru-Kariri, R. (2018). Autoria indígena em quinze anos de cartas. Trabalhos em Linguística Aplicada, 57:1364–1376.
Dantas, A. C. (2024). caramelo-smile (revision 2707a19).
Defensoria Pública do Estado do Paraná and Universidade Federal do Paraná (2025). Contribuições ao estudo do comitê consultivo do conselho de direitos humanos sobre o impacto da desinformação no gozo e na realização dos direitos humanos. [link]. Acesso em: 20 mar. 2025.
Graves, L. (2018). Understanding the promise and limits of automated fact-checking. Technical report, Reuters Institute for the Study of Journalism.
Grootendorst, M. (2020). Keybert: Minimal keyword extraction with bert.
Henz, M., Heckler, W., and Barbosa, J. (2025). Uma avaliação da capacidade de modelos de linguagem para análise de sentimentos em um contexto de saúde mental. In Anais do XXV Simpósio Brasileiro de Computação Aplicada à Saúde, pages 293–304, Porto Alegre, RS, Brasil. SBC.
Noble, S. U. (2018). Algorithms of Oppression: How Search Engines Reinforce Racism. New York University Press, New York.
O’Neil, C. (2016). Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. Crown, New York, USA.
OpenAI (2024). Gpt-4 technical report.
Prestes, E., Barbosa, L. V. F., Del Grossi, V. C. D., Gonzaga de Azevedo, C. P., Macedo, G., and Maffei, R. (2024). Ai and brazil’s indigenous populations: A call for participation. Technical report, UNESCO. Acesso em: março de 2025.
Simões-Gomes, L., Roberto, E., and Mendonça, E. (2020). Viés algorítmico: Um balanço provisório. Estudos Sociológicos, 25(48):139–166.
Souza, F., Nogueira, R., and Lotufo, R. (2020). BERTimbau: pretrained BERT models for Brazilian Portuguese. In 9th Brazilian Conference on Intelligent Systems, BRACIS, Rio Grande do Sul, Brazil, October 20-23 (to appear).
UNESCO (2021). Recommendation on the ethics of artificial intelligence. Acesso em: março de 2025.
Vosoughi, S., Roy, D., and Aral, S. (2018). The spread of true and false news online. Science, 359(6380):1146–1151.
Published
2025-09-29
How to Cite
ALMEIDA, Caio; VIEIRA, Renata; ABDALLA, Débora.
Topic and sentiment analysis in Brazilian indigenous letters. In: BRAZILIAN SYMPOSIUM IN INFORMATION AND HUMAN LANGUAGE TECHNOLOGY (STIL), 16. , 2025, Fortaleza/CE.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 512-518.
DOI: https://doi.org/10.5753/stil.2025.37851.
