Uso de metaheurísticas e regras de associação na identificação de padrões em egressos de curso de Ciência da Computação
Resumo
A mineração de regras de associação, uma técnica popular de mineração de dados, depende fortemente da configuração adequada de hiperparâmetros para gerar regras significativas e aplicáveis na prática. Este estudo explora a aplicação de três metaheurísticas — Busca Tabu (Tabu Search), Simulated Annealing (SA) e Algoritmos Genéticos (AG) — para ajustar hiperparâmetros de maneira eficaz e eficiente. Métodos tradicionais para ajuste de hiperparâmetros podem ser demorados e computacionalmente caros. Portanto, esta pesquisa visa avaliar o desempenho da Busca Tabu, Simulated Annealing e Algoritmos Genéticos na busca de configurações ótimas de hiperparâmetros. As técnicas foram avaliadas no problema de identificação de padrões relacionando vida acadêmica de estudante e desempenho profissional de egressos de curso de Ciência da Computação.
Referências
Brin, S., Motwani, R., Ullman, J. D., and Tsur, S. (1997). Dynamic itemset counting and implication rules for market basket data. In Proceedings of the 1997 ACM SIGMOD international conference on Management of data, pages 255–264.
Glover, F. (1989). Tabu search—part i. ORSA Journal on computing, 1(3):190–206.
Glover, F. (1990). Tabu search—part ii. ORSA Journal on computing, 2(1):4–32.
Golberg, D. E. (1989). Genetic algorithms in search, optimization, and machine learning. Addion wesley, 1989(102):36.
Hahsler, M., Grün, B., and Hornik, K. (2005). arules-a computational environment for mining association rules and frequent item sets. Journal of statistical software, 14(15):1–25.
Hipp, J., Güntzer, U., and Nakhaeizadeh, G. (2000). Algorithms for association rule mining—a general survey and comparison. ACM sigkdd explorations newsletter, 2(1):58–64.
Olson, D. L. and Delen, D. (2008). Advanced data mining techniques. Springer Science & Business Media.
Piatetsky-Shapiro, G. (1991). Discovery, analysis, and presentation of strong rules. Knowledge Discovery in Data-bases, pages 229–248.
Taha, A. A. and Hanbury, A. (2015). Metrics for evaluating 3d medical image segmentation: analysis, selection, and tool. BMC medical imaging, 15:1–28.
Van Laarhoven, P. J., Aarts, E. H., van Laarhoven, P. J., and Aarts, E. H. (1987). Simulated annealing. Springer.
Zhang, C. and Zhang, S. (2002). Association rule mining: models and algorithms. Springer.