Predição de Rankings de Artistas por Meio de Regressão

  • Felipe Faria Universidade Federal de Ouro Preto
  • Álvaro Jr. Universidade Federal de Ouro Preto
  • Luiz Merschmann Universidade Federal de Ouro Preto

Resumo


A construção de rankings consiste na ordenação de resultados recuperados de acordo com um determinado critério. Os rankings podem fornecer informações relevantes para analistas de diferentes setores da indústria. Na indústria fonográfica, os rankings possibilitam a compreensão de como os estilos musicais e a popularidade dos artistas e suas músicas evoluem com o tempo, permitindo análises de históricos de execuções e de tendências. Devido à importância da construção de rankings no escopo musical, técnicas de minera- ção de dados têm sido utilizadas para predizer os rankings através de informações contidas em mídias sociais. Este trabalho avalia modelos de regressão para a predição de rankings de artistas utilizando-se de dados históricos (rankings diários de artistas) extraídos do website Vagalume. Três técnicas de regressão (k-Nearest Neighbors - k-NN, Regressão Linear Múltipla - RLM e Random Forests - RF) foram avaliadas neste trabalho considerando-se diversos cenários. Os resultados obtidos por meio de experimentos mostraram que predições com baixas taxas de erros podem ser obtidas, indicando que técnicas de mineração de dados podem ser utilizadas para obtenção de informações que auxiliem a indústria fonográfica na tomada de decisões.

Palavras-chave: Mineração de Dados, Regressão, Mídia Social

Referências

D. W. Aha. Tolerating noisy, irrelevant and novel attributes in instance-based learning algorithms. International Journal of Man-Machine Studies, 36(2):267–287, 1992.

G. L. Toledo and I. I. Ovalle. Estatística Básica, page 251. Atlas, São Paulo, 2 edition, 1983.

Han, J. and Kamber, M. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2006.

J. Grace, D. Gruhl, K. Haas, M. Nagarajan, C. Robson, and N. Sahoo. Artist ranking through analysis of online community comments. Technical report, IBM, 2007.

L. Breiman. Random forests. Machine Learning, 45(1):5–32, 2001.

Mark Hall, Eibe Frank, Geoffrey Holmes, Bernhard Pfahringer, Peter Reutemann, Ian H. Witten (2009); The WEKA Data Mining Software: An Update; SIGKDD Explorations, Volume 11, Issue 1.

N. J. Bryan and G. Wang. Musical influence network analysis and rank of sample-based music. In Proceedings of the 12th International Society for Music Information Retrieval Conference, ISMIR, pages 329–334, Miami, Florida, 2011.

N. Koenigstein and Y. Shavitt. Song ranking based on piracy in peer-to-peer networks. In Proceedings of the 10th International Society for Music Information Retrieval Conference, ISMIR, pages 633–638, Kobe, Japan, 2009.

R Development Core Team, R: A Language and Environment for Statistical Computing, Viena, Austria, 2009.[Online]. Available: http://www.R-project.org/

T. Hastie, R. Tibshirani, and J. Friedman. The elements of statistical learning: data mining, inference and prediction. Springer, 2 edition, 2009.

Y. Sun, H. Li, I. G. Councill, J. H. 0002, W.-C. Lee, and C. L. Giles. Personalized ranking for digital libraries based on log analysis. In Proceedings of the 10th ACM International Workshop on Web Information and Data Management, pages 133–140, Napa Valley, California, 2008.

Y.-H. Yang, Y.-C. Lin, A. Lee, and H. Chen. Improving musical concept detection by ordinal regression and context fusion. In Proceedings of the 10th International Society for Music Information Retrieval Conference, ISMIR, pages 147–152, Kobe, Japan, 2009.

Y.-H. Yang, Y.-C. Lin, Y.-F. Su, and H. H. Chen. A regression approach to music emotion recognition. IEEE, 16(2):448–457, 2008.

Z.-S. Chen, J.-S. Jang, and C.-H. Lee. A kernel framework for content-based artist recommendation system in music. IEEE Transactions on Multimedia, 13(6):1371–1380, 2008.
Publicado
26/05/2015
FARIA, Felipe; JR., Álvaro; MERSCHMANN, Luiz. Predição de Rankings de Artistas por Meio de Regressão. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 11. , 2015, Goiânia. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2015 . p. 95-102. DOI: https://doi.org/10.5753/sbsi.2015.5805.