Identifying Patterns of Sexism in Brazilian Music through Natural Language Processing

  • Vitória Pereira Firmino UFMS
  • Janaina Nogueira de S. Lopes UFMS
  • Valéria Q. Reis UFMS / Leuphana Universität Lüneburg

Abstract


This paper presents an analysis of a corpus composed of 138, 368 Brazilian lyrics in order to identify gender biases. Natural Language Processing methods were used to define the set of adjectives most often used to characterize men and women in songs. The results show that the female gender is often described using words that refer to physical appearance, while the opposite gender is constantly described based on their good personality. Our results corroborate other studies in the literature and shed light on the discussion about the perpetuation of sexism in our society and the need for intervention to provide equal opportunities for women.

References

Barocas, S. and Selbst, A. D. (2016). Big data’s disparate impact. California Law Review, 104(3):671–732.

Caliskan, A., Ajay, P. P., Charlesworth, T., Wolfe, R., and Banaji, M. R. (2022). Gender bias in word embeddings: A comprehensive analysis of frequency, syntax, and semantics. In Proceedings of the 2022 AAAI/ACM Conference on AI, Ethics, and Society, AIES ’22. ACM.

Caseli, H. M. and Nunes, M. G. V., editors (2024). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. BPLN, 2 edition.

Desvelar, S. (2024). Danos e discriminação algorítmica: Mapeamento. Desvelar Justiça racial, IA e tecnologias digitais. Acesso em: 22/03/2024.

Duprat, R. (2008). Fruição, sedução e produção: o papel da mulher na música. Música em Perspectiva, 1(1).

Feijó, M. and Macedo, R. M. S. d. (2013). Gênero, cultura e rede social: a construção social da desigualdade de gênero por meio da linguagem. Nova Perspectiva Sistêmica, 21(44):21–34.

Freitas, C. and Martins, F. (2023). Bela, recatada e do lar: o que a mineração de textos literários nos diz sobre a caracterização de personagens femininas e masculinas. Fórum Linguístico, 20:9118–9138.

Jurafsky, D. and Martin, J. H. (2023). Speech and Language Processing, volume 3.

Kong, L. (1995). Popular Music in Geographical Analyses. Progress in Human Geography, 15th edition.

Lima, R. A., de Sousa, R. C. C., Barbosa, S. D. J., and Lopes, H. C. V. (2020). Brazilian lyrics-based music genre classification using a BLSTM network. CoRR, abs/2003.05377.

Salles, I. and Pappa, G. (2021). Viés de gênero em biografias da wikipédia em português. In Anais do X Brazilian Workshop on Social Network Analysis and Mining, pages 211–216, Porto Alegre, RS, Brasil. SBC.

Taso, F., Reis, V., and Martinez, F. (2023a). Discriminação algorítmica de gênero: Estudo de caso e análise no contexto brasileiro. In Anais do IV Workshop sobre as Implicações da Computação na Sociedade, pages 13–25, Porto Alegre, RS, Brasil. SBC.

Taso, F., Reis, V., and Martinez, F. (2023b). Sexismo no brasil: análise de um word embedding por meio de testes baseados em associação implícita. In Anais do XIV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, pages 53–62, Porto Alegre, RS, Brasil. SBC.

Zhang, H., Sneyd, A., and Stevenson, M. (2020). Robustness and reliability of gender bias assessment in word embeddings: The role of base pairs. In Wong, K.-F., Knight, K., and Wu, H., editors, Proceedings of the 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing, pages 759–769, Suzhou, China. Association for Computational Linguistics.
Published
2024-07-21
FIRMINO, Vitória Pereira; LOPES, Janaina Nogueira de S.; REIS, Valéria Q.. Identifying Patterns of Sexism in Brazilian Music through Natural Language Processing. In: WORKSHOP ON THE IMPLICATIONS OF COMPUTING IN SOCIETY (WICS), 5. , 2024, Brasília/DF. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 59-69. ISSN 2763-8707. DOI: https://doi.org/10.5753/wics.2024.2968.