Uma abordagem baseada em letras para a descoberta de conhecimento da música brasileira: o sertanejo como um estudo de caso
Resumo
Técnicas computacionais podem ser usadas para identificar tendências e padrões musicais, ajudando as pessoas a filtrar e selecionar músicas de acordo com suas preferências. Nesse cenário, pesquisas afirmam que o futuro da música permeia a inteligência artificial, que desempenhará o papel de compor músicas que melhor atendam aos gostos dos consumidores. Portanto, extrair padrões desses dados é fundamental e pode contribuir para o ecossistema da indústria da música. Essas técnicas são bem conhecidas no campo da recuperação de informações musicais. Eles consistem na extração das características de áudio (conteúdo) ou letra (contexto), sendo o último preferível por exigir menor custo computacional e apresentar melhores resultados. No entanto, ao observar o estado da arte, verificou-se a falta de antecedentes que investiguem a extração de padrões musicais brasileiros por meio de letras. Nesse sentido, o objetivo principal deste trabalho é preencher essa lacuna por meio de técnicas de mineração de texto, analisando a classificação das músicas nos subgêneros do sertanejo. Essa análise é baseada em letras e extração de conhecimento para explicar como os subgêneros diferem.
Referências
Armentano, M. G., De Noni, W. A., and Cardoso, H. F. (2017). Genre classification of symbolic pieces of music. Journal of Intelligent Information Systems, 48(3):579–599.
Barcinski, A. (2018). Pesquisa comprova: no Brasil o sertanejo lidera, mas o futuro é do funk. Disponı́vel em: https://blogdobarcinski.blogosfera.uol.c om.br/2018/07/24/pesquisa-comprova-no-brasil-o-sertanejo -lidera-mas-o-futuro-e-do-funk/. Último acesso em: 28 de agosto de 2019.
Barkwell, K. E., Cuzzocrea, A., Leung, C. K., Ocran, A. A., Sanderson, J. M., Stewart, J. A., and Wodi, B. H. (2018). Big data visualisation and visual analytics for music data mining. In Int Conf. Information Visualisation, pages 235–240. IEEE.
Barman, M. P., Dahekar, K., Anshuman, A., and Awekar, A. (2019). It’s only words and words are all I have. In Eur. Conf. on Information Retrieval, pages 30–36. Springer.
Bello, J. P., Grosche, P., Müller, M., and Weiss, R. (2018). Content-based methods for knowledge discovery in music. In Springer Handbook of Systematic Musicology, pages 823–840. Springer.
Brookes, G. and McEnery, T. (2019). The utility of topic modelling for discourse studies: A critical evaluation. Discourse Studies, 21(1):3–21.
Chen, Z., Mukherjee, A., Liu, B., Hsu, M., Castellanos, M., and Ghosh, R. (2013). Leveraging multi-domain prior knowledge in topic models. In Twenty-Third Int. Joint Conf. on Artificial Intelligence.
Choi, K. (2018). Computational lyricology: quantitative approaches to understanding song lyrics and their interpretations. PhD thesis, University of Illinois at UrbanaChampaign.
Cirqueira, D., Pinheiro, M. F., Jacob, A., Lobato, F., and Santana, Á. (2018). A Literature Review in Preprocessing for Sentiment Analysis for Brazilian Portuguese Social Media. In 2018 IEEE/WIC/ACM International Conference on Web Intelligence (WI), pages 746–749. IEEE.
Darlington, S. (2019). Why Brazil’s music industry is booming again. Disponı́vel em: https://www.billboard.com/articles/columns/latin/8507548/ brazil-music-industry-top-markets-streaming. Acesso em: 4 de junho de 2019.
Deshmukh, P. and Kale, G. (2018). A survey of music recommendation system. Int. Journal of Scientific Research in Computer Science, Engineering and Information Technology, 3(3):1721–1729.
Fell, M. and Sporleder, C. (2014). Lyrics-based analysis and classification of music. In Proc. 25th Int. Conf. on Computational Linguistics: Technical Papers, pages 620–631.
Flynn, M. A., Craig, C. M., Anderson, C. N., and Holody, K. J. (2016). Objectification in popular music lyrics: An examination of gender and genre differences. Sex roles, 75(3-4):164–176.
Fonseca, E. R., Rosa, J. L. G., and Aluı́sio, S. M. (2015). Evaluating word embeddings and a revised corpus for part-of-speech tagging in portuguese. Journal of the Brazilian Computer Society, 21(1):2.
Freitas, A. A. (2014). Comprehensible Classification Models: A Position Paper. SIGKDD Explor. Newsl., 15(1):1–10.
Harris, Z. S. (1954). Distributional structure. Word, 10(2-3):146–162.
Katarya, R. and Verma, O. P. (2018). Efficient music recommender system using context graph and particle swarm. Multimedia Tools and Applications, 77(2):2673–2687.
Knees, P. and Schedl, M. (2013). A survey of music similarity and recommendation from music context data. ACM Transactions on Multimedia Computing, Communications, and Applications, 10(1):2.
Knees, P. and Schedl, M. (2015). Music retrieval and recommendation: A tutorial overview. In Proc. Int. Conf. on Research and Development in Information Retrieval, pages 1133–1136. ACM.
Laoh, E., Surjandari, I., and Febirautami, L. R. (2018). Indonesians’ song lyrics topic modelling using latent dirichlet allocation. In Int. Conf. on Information Science and Control Engineering, pages 270–274. IEEE.
Li, T., Ogihara, M., and Tzanetakis, G. (2011). Music data mining. CRC Press.
Lobato, F. M. F., Silva, M., Coelho, K., Silva, C., and Pontes, F. (2018). Vamos falar sobre deficiência? Uma análise dos Tweets sobre este tema no Brasil. In Brazilian Workshop on Social Network Analysis and Mining.
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., and Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12:2825–2830.
Rasmussen, E. E. and Densley, R. L. (2017). Girl in a country song: Gender roles and objectification of women in popular country music across 1990 to 2014. Sex Roles, 76(3-4):188–201.
Rodrigues, L., Junior, J., and Lobato, F. (2019). A culpa é dela! É isso o que dizem nos comentários das notıcias sobre a tentativa de feminicıdio de Elaine Caparroz. In Anais do VIII Brazilian Workshop on Social Network Analysis and Mining, pages 47–58, Porto Alegre, RS, Brasil. SBC.
Rossi, R. G. (2016). Classificação automática de textos por meio de aprendizado de máquina baseado em redes. PhD thesis, Universidade de São Paulo.
Sales, B. (2018). Quem são os cantores sertanejos mais bem pagos da atualidade? Disponı́vel em: https://segredosdomundo.r7.com/quem-sao-os-can tores-sertanejos-mais-bem-pagos-da-atualidade/. Último acesso em 28 de agosto de 2019.
Sasaki, S., Yoshii, K., Nakano, T., Goto, M., and Morishima, S. (2014). Lyricsradar: A lyrics retrieval system based on latent topics of lyrics. In Int. Society for Music Information Retrieval Conf., pages 585–590.
Schedl, M., Knees, P., and Gouyon, F. (2017). New paths in music recommender systems research. In Proc. Conf. on Recommender Systems, pages 392–393. ACM.
Schedl, M., Zamani, H., Chen, C.-W., Deldjoo, Y., and Elahi, M. (2018). Current challenges and visions in music recommender systems research. Int. Journal of Multimedia Information Retrieval, 7(2):95–116.
Sobota, G. (2019). Indústria da música no Brasil tem crescimento acima da média internacional em 2018. Disponı́vel em: https://cultura.estadao.com.br /noticias/musica,industria-da-musica-no-brasil-tem-cresc imento-acima-da-media-internacional-em-2018,70002777115. Último acesso em 28 de agosto de 2019.
Sturm, B. L., Ben-Tal, O., Monaghan, U., Collins, N., Herremans, D., Chew, E., Hadjeres, G., Deruty, E., and Pachet, F. (2019). Machine learning research that matters for music creation: A case study. Journal of New Music Research, 48(1):36–55.
Tan, P.-N. (2018). Introduction to data mining. Pearson Education India.
Vijayarani, S., Ilamathi, M. J., and Nithya, M. (2015). Preprocessing techniques for text mining-an overview. Int. Journal of Computer Science & Communication Networks, 5(1):7–16.
Yang, J. (2018). Lyric-based music genre classifcation. Master’s thesis, University of Victoria.