Evasão Escolar: Aplicando Mineração de Dados para Identificar Variáveis Relevantes
Resumo
A evasão escolar na educação pública brasileira é um problema de grandes proporções. Um em cada quatro brasileiros deixa a escola prematuramente, antes de terminar o ensino médio. Este trabalho faz um recorte do problema, ao analisar a evasão escolar no último ano do ensino fundamental nas escolas públicas estaduais e municipais do estado de Pernambuco, com base nos dados dos Censos Escolares 2011 e 2012. Árvore de Decisão, Indução de Regras e Regressão Logística foram as técnicas para extração de conhecimento aplicadas visando a identificar o perfil do aluno evasor e estimar a propensão à evasão. Os resultados mostraram que fatores como idade, turno das aulas e região geográfica das escolas influenciam fortemente a evasão.
Referências
Biggs, D., Ville, B. D., and Suen, E. (1991). A method of choosing multiway partitions for classification and decision trees. Journal of Applied Statistics, 18:49–62.
Borgelt, C. and Kruse, R. (2002). Induction of association rules: Apriori implementation. In Proceedings of the 15th Conference on Computational Statistics.
BRASIL (2015). Disponível em [link]. Acessado em 14/08/2016.
da Silva, H. R. B. and Adeodato, P. J. L. (2012). A data mining approach for preventing undergraduate students retention. In The 2012 International Joint Conference on Neural Networks (IJCNN), Brisbane, Australia, June 10-15, 2012, pages 1–8. IEEE.
Fawcett, T. (2006). An introduction to ROC analysis. Pattern Recogn. Lett., 27(8):861–874.
Hosmer, D. W. and Lemeshow, S. (2000). Applied logistic regression. Wiley series in probability and statistics. John Wiley & Sons, Inc. A Wiley-Interscience Publication, New York, Chichester, Weinheim.
IBM (2015). IBM SPSS Software Trial Version. Disponível em [link]. Acessado em 14/08/2016.
INEP (2015). Disponível em [link]. Acessado em 14/08/2016.
GREBIN. S. Z. (2012). “Combinação em série e em paralelo de modelos de redes neurais e regressão logística - um estudo de caso em crosselling,” Trabalho de conclusão do curso de Bacharelado em Estatística, Universidade Federal do Rio Grande do Sul.
Kass, G. V. (1980). An exploratory technique for investigating large quantities of categorical data. Journal of the Royal Statistical Society. Series C (Applied Statistics), 29(2):119–127.
Maimon, O. and Rokach, L. (2005). Data Mining and Knowledge Discovery Handbook. Springer-Verlag New York, Inc., Secaucus, NJ, USA.
Shearer, C. (2000). The crisp-dm model: The new blueprint for data mining. Journal of Data Warehousing, 5(4).
UOL (2015). [link]. Acessado em 14/08/2016.
R (2015). Disponível em [link]. Acessado em 14/08/2016.
VIEIRA, S. L.; FARIAS, I. M. S. (2007) Política Educacional no Brasil: introdução histórica. Brasília: Liber Livro.
