Identificando Padrões de Sexismo na Música Brasileira através do Processamento de Linguagem Natural
Resumo
Este trabalho apresenta uma análise de um corpus composto por 138.368 músicas brasileiras a fim de identificar vieses de gênero. Para isso, foram utilizados métodos de Processamento de Linguagem Natural para definir o conjunto de adjetivos mais utilizados para caracterizar homens e mulheres nas canções. Os resultados mostram que o gênero feminino é frequentemente descrito utilizando predicativos que remetem à aparência física, enquanto o gênero oposto é constantemente descrito a partir de sua boa personalidade. Nossos resultados corroboram outros estudos da literatura e jogam luz na discussão sobre a perpetuação do sexismo em nossa sociedade e na necessidade de intervenção para proporcionar equidade de oportunidade para as mulheres.
Referências
Caliskan, A., Ajay, P. P., Charlesworth, T., Wolfe, R., and Banaji, M. R. (2022). Gender bias in word embeddings: A comprehensive analysis of frequency, syntax, and semantics. In Proceedings of the 2022 AAAI/ACM Conference on AI, Ethics, and Society, AIES ’22. ACM.
Caseli, H. M. and Nunes, M. G. V., editors (2024). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. BPLN, 2 edition.
Desvelar, S. (2024). Danos e discriminação algorítmica: Mapeamento. Desvelar Justiça racial, IA e tecnologias digitais. Acesso em: 22/03/2024.
Duprat, R. (2008). Fruição, sedução e produção: o papel da mulher na música. Música em Perspectiva, 1(1).
Feijó, M. and Macedo, R. M. S. d. (2013). Gênero, cultura e rede social: a construção social da desigualdade de gênero por meio da linguagem. Nova Perspectiva Sistêmica, 21(44):21–34.
Freitas, C. and Martins, F. (2023). Bela, recatada e do lar: o que a mineração de textos literários nos diz sobre a caracterização de personagens femininas e masculinas. Fórum Linguístico, 20:9118–9138.
Jurafsky, D. and Martin, J. H. (2023). Speech and Language Processing, volume 3.
Kong, L. (1995). Popular Music in Geographical Analyses. Progress in Human Geography, 15th edition.
Lima, R. A., de Sousa, R. C. C., Barbosa, S. D. J., and Lopes, H. C. V. (2020). Brazilian lyrics-based music genre classification using a BLSTM network. CoRR, abs/2003.05377.
Salles, I. and Pappa, G. (2021). Viés de gênero em biografias da wikipédia em português. In Anais do X Brazilian Workshop on Social Network Analysis and Mining, pages 211–216, Porto Alegre, RS, Brasil. SBC.
Taso, F., Reis, V., and Martinez, F. (2023a). Discriminação algorítmica de gênero: Estudo de caso e análise no contexto brasileiro. In Anais do IV Workshop sobre as Implicações da Computação na Sociedade, pages 13–25, Porto Alegre, RS, Brasil. SBC.
Taso, F., Reis, V., and Martinez, F. (2023b). Sexismo no brasil: análise de um word embedding por meio de testes baseados em associação implícita. In Anais do XIV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, pages 53–62, Porto Alegre, RS, Brasil. SBC.
Zhang, H., Sneyd, A., and Stevenson, M. (2020). Robustness and reliability of gender bias assessment in word embeddings: The role of base pairs. In Wong, K.-F., Knight, K., and Wu, H., editors, Proceedings of the 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing, pages 759–769, Suzhou, China. Association for Computational Linguistics.