Will I Remain Popular? A Study Case on Spotify

  • Carlos Araujo Universidade Federal do Amazonas
  • Marco Cristo Universidade Federal do Amazonas
  • Rafael Giusti Universidade Federal do Amazonas

Resumo


Atualmente, as plataformas de streaming on-line são a forma mais importante de consumo de música. Neste artigo, apresentamos um modelo para prever se uma música popular no Spotify permanecerá popular após um determinado peróodo de tempo.  O Spotify é o segundo maior serviço global de streaming. Se  uma  música  for  popular  nessa  plataforma,  ela  garantirá  um bom retorno financeiro para o artista e sua gravadora. Abordamos o problema como uma tarefa de classificação e empregamos classificadores baseados em informações  prévias  do  ranking  Top  50  Global  da  plataforma.  O classificador de Máquina de Vetores de Suporte (SVM) com kernel linear alcançou os melhores resultados. Também verificamos se informações acústicas podem fornecer  recursos úteis  para  esse  problema.  Fizemos uma série de rodadas  declassificação, onde os resultados de uma rodada eram utilizados como entradada rodada posterior. Nossos resultados mostram que os dados prévios são suficientes para prever se uma música permanecerá no Top 50 Global com dois meses de antecedência, alcançando precisão, valor preditivo negativo, revocação, especificidade e valor-F1 acima de 70% para essa tarefa. Ademais,  resultados  até  6,60%  superiores  puderam  ser  obtidos  ao  utilizar  as  características acústicas das faixas.

Referências

Abel, F., Diaz-Aviles, E., Henze, N., Krause, D., and Siehndel, P. (2010). Analyzing the blogosphere for predicting the success of music and movie products. In 2010 International Conference on Advances in Social Networks Analysis and Mining, pages 276–280.

Arakelyan, S., Morstatter, F., Martin, M., Ferrara, E., and Galstyan, A. (2018). Mining and forecasting career trajectories of music artists. In Proceedings of the 29th on Hypertext and Social Media, HT ’18, pages 11–19, New York, NY, USA. ACM.

Araújo, C. V., Neto, R. M., Nakamura, F. G., and Nakamura, E. F. (2017). Using complex networks to assess collaboration in rap music: A study case of dj khaled. In Proceedings of the 23rd Brazillian Symposium on Multimedia and the Web, WebMedia ’17, pages 425–428, New York, NY, USA. ACM.

Brownlee, J. (2017). Introduction to Time Series Forecasting with Python: How to Prepare Data and Develop Models to Predict the Future. Jason Brownlee.

Dhar, V. and Chang, E. A. (2009). Does chatter matter? the impact of user-generated content on music sales. Journal of Interactive Marketing, 23(4):300 – 307.

Dubnov, S. (2004). Generalization of spectral flatness measure for non-gaussian linear processes. IEEE Signal Processing Letters, 11(8):698–701.

Fawcett, T. (2006). An introduction to roc analysis. Pattern Recognition Letters, 27(8):861 – 874. ROC Analysis in Pattern Recognition.

Harris, D. and Harris, S. (2010). Digital design and computer architecture. Morgan Kaufmann.

Herremans, D., Martens, D., and Sörensen, K. (2014). Dance hit song prediction. Journal of New Music Research, 43(3):291–302.

Interiano, M., Kazemi, K., Wang, L., Yang, J., Yu, Z., and Komarova, N. L. (2018). Musical trends and predictability of success in contemporary songs in and out of the top charts. Royal Society Open Science, 5(5):171274.

Lee, J. and Lee, J. (2018). Music popularity: Metrics, characteristics, and audio-based prediction. IEEE Transactions on Multimedia, 20(11):3173–3182.

McFee, B., Raffel, C., Liang, D., Ellis, D. P., McVicar, M., Battenberg, E., and Nieto, O. (2015). librosa: Audio and music signal analysis in python. In Proceedings of the 14th python in science conference, pages 18–25.

McKinney, W. (2010). Data structures for statistical computing in python. In van der Walt, S. and Millman, J., editors, Proceedings of the 9th Python in Science Conference, pages 51 – 56.

Olson, D. L. and Delen, D. (2008). Advanced data mining techniques. Springer Science & Business Media.

Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., and Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12:2825–2830.

Shulman, B., Sharma, A., and Cosley, D. (2016). Predictability of popularity: Gaps between prediction and understanding. In Tenth International AAAI Conference on Web and Social Media, pages 348–357.

Silva, M. O., Rocha, L. M., and Moro, M. M. (2019). Collaboration profiles and their impact on musical success. In Proceedings of the 34th ACM/SIGAPP Symposium on Applied Computing, SAC ’19, pages 2070–2077, New York, NY, USA. ACM.

Steininger, D. M. and Gatzemeier, S. (2013). Using the wisdom of the crowd to predict popular music chart success. In Proceedings of the 21st European Conference on Information Systems, page 215.

Zhang, H. (2004). The optimality of naive bayes. AA, 1(2):3.
Publicado
15/10/2019
ARAUJO, Carlos; CRISTO, Marco; GIUSTI, Rafael. Will I Remain Popular? A Study Case on Spotify. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 16. , 2019, Salvador. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 599-610. ISSN 2763-9061. DOI: https://doi.org/10.5753/eniac.2019.9318.