Estimação de Índices de Aprovação e Reprovação Escolar do Ensino Médio

  • Ricardo B. das Neves Junior Universidade de Pernambuco (UPE)
  • Rafaella L. S. do Nascimento Universidade Federal de Pernambuco (UFPE)
  • Roberta A. A. Fagundes Universidade de Pernambuco (UPE)
  • Paulo S. G. de Mattos Neto Universidade Federal de Pernambuco (UFPE)

Resumo


A mineração de dados educacionais busca estudar e contribuir com resultados que expliquem variáveis e encontrem possíveis soluções para problemas na área da educação. Tendo em vista essa motivação, este artigo descreve um estudo com base em dados educacionais fornecidos pelo INEP e a construção de modelos de predição utilizando a regressão quantílica não paramétrica com e sem otimizador de parâmetros. Apresenta-se um estudo descritivo das variáveis explicativas do modelo, o qual é utilizado para predizer a aprovação e reprovação escolar. Os resultados obtidos mostram que a regressão quantílica com otimização obteve menor erro de predição. O estudo mostra a relevância na aplicação de técnicas não paramétricas de regressão.

Palavras-chave: Mineração de Dados Educacionais, Regressão Quantílica, Aprovação Escolar, Reprovação Escolar, INEP

Referências

Baker, R., Isotani, S., and Carvalho, A. (2011). Mineraçao de dados educacionais: Oportunidades para o brasil. Brazilian Journal of Computers in Education, 19(02):03.

Breiman, L. (2001). Random forests machine learning. 45: 5–32. View Article PubMed/NCBI Google Scholar.

Calixto, K., Segundo, C., and de Gusmão, R. P. (2017). Mineração de dados aplicada a educação: um estudo comparativo acerca das características que influenciam a evasão escolar. In Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação-SBIE), volume 28, page 1447.

Colpani, R. (2018). Mineração de dados educacionais: um estudo da evasão no ensino médio com base nos indicadores do censo escolar. Informática na educação: teoria & prática, 21(3).

Coutinho, L. D. (2015). Utilizando redes neurais artificiais e algoritmos de seleção de variaveis para realizar diagnóstico precoce da doença de alzheimer e do déficit cognitivo leve. Master’s thesis, Universidade de Pernambuco.

Darwin, C. (1909). The origin of species. Dent.

do Nascimento, R. L. S., da Cruz Junior, G. G., and de Araújo Fagundes, R. A. (2018a). Mineração de dados educacionais: Um estudo sobre indicadores da educação em bases de dados do inep. RENOTE, 16(1).

do Nascimento, R. L. S., das Neves Junior, R. B., de Almeida Neto, M. A., and de Araújo Fagundes, R. A. (2018b). Educational data mining: An application of regressors in predicting school dropout. In International Conference on Machine Learning and Data Mining in Pattern Recognition, pages 246–257. Springer.

Fagundes, R. A. d. A. and Cysneiros, F. J. d. A. (2013). Métodos de regressão robusta e kernel para dados intervalares. Universidade Federal de Pernambuco.

Hayfield, T. and Racine, J. S. (2008). Nonparametric econometrics: The np package. Journal of Statistical Software, 27(5).

Holland, J. H. (1992). Adaptation in natural and artificial systems: an introductory analysis with applications to biology, control, and artificial intelligence. MIT press.

INEP (2019). Instituto nacional de estudos e pesquisas educacionais anísio teixeira. url: [link]. Accesso em 14 de Janeiro de 2019.

Koenker, R. (2006). Quantile regresssion. Encyclopedia of environmetrics.

Koenker, R. and Bassett Jr, G. (1978). Regression quantiles. Econometrica: journal of the Econometric Society, pages 33–50.

Kohavi, R. et al. (1995). A study of cross-validation and bootstrap for accuracy estimation and model selection. In Ijcai, volume 14, pages 1137–1145. Montreal, Canada.

Laisa, J. and Nunes, I. (2015). Mineração de dados educacionais como apoio para a classificação de alunos do ensino médio. In Brazilian Symposium on Computers in Education (Simpósio Brasileiro de Informática na Educação-SBIE), volume 26, page 1112.

Li, Q., Lin, J., and Racine, J. S. (2013). Optimal bandwidth selection for nonparametric conditional distribution and quantile functions. Journal of Business & Economic Statistics, 31(1):57–65.

Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012). Introduction to linear regression analysis, volume 821.

Montgomery, D. C., Runger, G. C., and Calado, V. (2000). Estatística Aplicada E Probabilidade Para Engenheiros . Grupo Gen-LTC.

Romero, C. and Ventura, S. (2010). Educational data mining: a review of the state of the art. IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews), 40(6):601–618.
Publicado
11/11/2019
DAS NEVES JUNIOR, Ricardo B.; DO NASCIMENTO, Rafaella L. S.; FAGUNDES, Roberta A. A.; DE MATTOS NETO, Paulo S. G.. Estimação de Índices de Aprovação e Reprovação Escolar do Ensino Médio. In: SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO (SBIE), 30. , 2019, Brasília/DF. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 339-348. DOI: https://doi.org/10.5753/cbie.sbie.2019.339.