Uso de Séries Temporais e Seleção de Atributos em Mineração de Dados Educacionais para Previsão de Desempenho Acadêmico
Resumo
A previsão de desempenho acadêmico tem grande utilidade para Instituições de Ensino no sentido de auxiliá-las a tomar, de forma antecipada, decisões pedagógicas que possam auxiliar os estudantes. Neste trabalho foram realizados experimentos em uma base de dados do Ambiente Virtual de Aprendizagem Moodle, utilizando o conceito de Séries Temporais e a técnica Cápsula de Seleção de Atributos que, dentre os trabalhos pesquisados, não havia sido ainda empregada. Resultados experimentais indicam uma melhora no desempenho dos classificadores com o uso de Seleção de Atributos, alguns alcançando a marca de 84,7% de acurácia.
Palavras-chave:
Mineração de Dados Educacionais, Séries Temporais, Previsão de Desempenho Acadêmico
Referências
Aha, D., Kibler, D. & Albert, M. (1991). Instance-Based Learning Algorithms. MachineLearning,6(1):37–66.
Baker, R. S. J., Isotani, S. & de Carvalho, A. M. J. B. (2011). Mineração de dados educacionais: Oportunidades para o brasil. Revista Brasileira de Informática na Educação, 19(2), pp. 3-13.
Breiman, L. Random forests. Machine learning, v. 45, n. 1, p. 5-32, 2001.
Bouckaert, R., et al., 2015, WEKA Manual for Version 3-6-4. 2010. Disponível em: [link]. Acesso em: 16 jun. 2016.
Cohen, W. (1995). Fast Effective Rule Induction. In Proceedings of ICML-95, 115-123.
dos Santos, R. N., de Alburqueque Siebra, C., & Oliveira, E. S. (2014). Uma Abordagem Temporal para Identificação Precoce de Estudantes de Graduação a Distância com Risco de Evasão em um AVA utilizando Árvores de Decisão. In: Anais dos Workshops do III Congresso Brasileiro de Informática na Educação.
Fayyad, U., Piatetsky-Shapiro, G. & Smyth, P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3), pp. 37-54.
Ferreira, G. (2015). Investigação acerca dos fatores determinantes para a conclusão do Ensino Fundamental utilizando Mineração de Dados Educacionais no Censo Escolar da Educação Básica do INEP 2014. In: Anais dos Workshops do IV Congresso Brasileiro de Informática na Educação.
Freund, Y. & Schapire, R. E. (1996). Experiments with a new boosting algorithm. In L. Saitta (Ed.), Proceedings of the Thirteenth International Conference on Machine Learning (pp. 148–156). Bari, Italy. San Francisco: Morgan Kaufmann.
Gottardo, E. (2013). Estimativa de desempenho acadêmico de estudantes em um AVA utilizando técnicas de mineração de dados (Dissertação Mestrado). Universidade Tecnológica Federal do Paraná.
Guércio, H., Marques, P., Ströele, V., Pereira, C. K., & Barrere, E. (2014). Análise do Desempenho Estudantil na Educação a Distância Aplicando Técnicas de Mineração de Dados. In: Anais dos Workshops do III Congresso Brasileiro de Informática na Educação.
Hall, M., Witten, I. & Frank, E. (2011). Data mining: Practical machine learning tools and techniques. Kaufmann, Burlington.
Hand, D. J., Mannila, H. & Smyth, P. (2001). Principles of data mining. MIT press.
Heckerman, D.(1995). A Tutorial on Learning With Bayesian Networks. Microsoft Research, Page 57. number MSR-TR-95-06, March.
Kohavi, R., Sommerfield, D. & Odugherty, J. (1996) Data Mining Using MLC++, A Machine Learning Library in C++. In Proceedings of the 8th International Conference on Tools with Artificial Intelligence (ICTAI '96). IEEE Computer Society, Washington, DC, USA, 234-245, 1996.
Kotsiantis, S. B., Zaharakis, I. D. & Pintelas, P. E. (2007). Supervised machine learning: A review of classification techniques. 3-24.
Marquez-Vera, C., Romero, C., Ventura, S. (2011). Predicting school failure using data mining. In: EDM. p. 271–276.
Mitchell, T.M. (1997). Machine Learning. McGraw-Hill.
Platt, J. (1998). Fast training of support vector machines using sequential minimal optimization. In B. Schölkopf, C. Burges, & A. Smola (Eds.), Advances in kernel methods: Support vector learning (pp. 185–209). Cambridge, MA: MIT Press.
Quinlan, J.R. (1993). C4.5: Programs for machine learning. Morgan Kaufmann, San Francisco.
Ramaswami, M., Bhaskaran, R. (2009) A study on feature selection techniques in educational data mining. arXiv preprint arXiv:0912.3924.
Rumelhart, D. E., Hinton, G. E. & Williams, R. J. (1986). Learning representations by backpropagating errors. Nature, 323:533–53.
Wu, X. et al. (2008). Top 10 algorithms in data mining. Knowledge and information systems, v. 14, n. 1, p. 1-37.
Baker, R. S. J., Isotani, S. & de Carvalho, A. M. J. B. (2011). Mineração de dados educacionais: Oportunidades para o brasil. Revista Brasileira de Informática na Educação, 19(2), pp. 3-13.
Breiman, L. Random forests. Machine learning, v. 45, n. 1, p. 5-32, 2001.
Bouckaert, R., et al., 2015, WEKA Manual for Version 3-6-4. 2010. Disponível em: [link]. Acesso em: 16 jun. 2016.
Cohen, W. (1995). Fast Effective Rule Induction. In Proceedings of ICML-95, 115-123.
dos Santos, R. N., de Alburqueque Siebra, C., & Oliveira, E. S. (2014). Uma Abordagem Temporal para Identificação Precoce de Estudantes de Graduação a Distância com Risco de Evasão em um AVA utilizando Árvores de Decisão. In: Anais dos Workshops do III Congresso Brasileiro de Informática na Educação.
Fayyad, U., Piatetsky-Shapiro, G. & Smyth, P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3), pp. 37-54.
Ferreira, G. (2015). Investigação acerca dos fatores determinantes para a conclusão do Ensino Fundamental utilizando Mineração de Dados Educacionais no Censo Escolar da Educação Básica do INEP 2014. In: Anais dos Workshops do IV Congresso Brasileiro de Informática na Educação.
Freund, Y. & Schapire, R. E. (1996). Experiments with a new boosting algorithm. In L. Saitta (Ed.), Proceedings of the Thirteenth International Conference on Machine Learning (pp. 148–156). Bari, Italy. San Francisco: Morgan Kaufmann.
Gottardo, E. (2013). Estimativa de desempenho acadêmico de estudantes em um AVA utilizando técnicas de mineração de dados (Dissertação Mestrado). Universidade Tecnológica Federal do Paraná.
Guércio, H., Marques, P., Ströele, V., Pereira, C. K., & Barrere, E. (2014). Análise do Desempenho Estudantil na Educação a Distância Aplicando Técnicas de Mineração de Dados. In: Anais dos Workshops do III Congresso Brasileiro de Informática na Educação.
Hall, M., Witten, I. & Frank, E. (2011). Data mining: Practical machine learning tools and techniques. Kaufmann, Burlington.
Hand, D. J., Mannila, H. & Smyth, P. (2001). Principles of data mining. MIT press.
Heckerman, D.(1995). A Tutorial on Learning With Bayesian Networks. Microsoft Research, Page 57. number MSR-TR-95-06, March.
Kohavi, R., Sommerfield, D. & Odugherty, J. (1996) Data Mining Using MLC++, A Machine Learning Library in C++. In Proceedings of the 8th International Conference on Tools with Artificial Intelligence (ICTAI '96). IEEE Computer Society, Washington, DC, USA, 234-245, 1996.
Kotsiantis, S. B., Zaharakis, I. D. & Pintelas, P. E. (2007). Supervised machine learning: A review of classification techniques. 3-24.
Marquez-Vera, C., Romero, C., Ventura, S. (2011). Predicting school failure using data mining. In: EDM. p. 271–276.
Mitchell, T.M. (1997). Machine Learning. McGraw-Hill.
Platt, J. (1998). Fast training of support vector machines using sequential minimal optimization. In B. Schölkopf, C. Burges, & A. Smola (Eds.), Advances in kernel methods: Support vector learning (pp. 185–209). Cambridge, MA: MIT Press.
Quinlan, J.R. (1993). C4.5: Programs for machine learning. Morgan Kaufmann, San Francisco.
Ramaswami, M., Bhaskaran, R. (2009) A study on feature selection techniques in educational data mining. arXiv preprint arXiv:0912.3924.
Rumelhart, D. E., Hinton, G. E. & Williams, R. J. (1986). Learning representations by backpropagating errors. Nature, 323:533–53.
Wu, X. et al. (2008). Top 10 algorithms in data mining. Knowledge and information systems, v. 14, n. 1, p. 1-37.
Publicado
24/10/2016
Como Citar
DOS SANTOS, Rodrigo Magalhães Mota; PITANGUI, Cristiano Grijó; ANDRADE, Alessandro Vivas; ASSIS, Luciana Pereira de.
Uso de Séries Temporais e Seleção de Atributos em Mineração de Dados Educacionais para Previsão de Desempenho Acadêmico. In: SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO (SBIE), 27. , 2016, Uberlândia/MG.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2016
.
p. 1146-1155.
DOI: https://doi.org/10.5753/cbie.sbie.2016.1146.
