Preparation of the aggregated dataset of the basic education census
Abstract
The Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) makes available the Census of Basic Education, the largest survey of data on Brazilian education every year. The data are made available annually and with about 370 columns and just over 230 thousand records per year. This work presents the process that was used to create a dataset that would unify the years 2010-2021 and make it available in order to ensure good practices for making data available on the web. A dataset was generated by creating a sub-division of the provided data and aligning its data dictionary to reflect the current context of the data produced.
References
Balbinot, A. D. and Haubert, A. (2017). Análise de matrículas como indicadores da evolução da educação especial no estado do Rio de Janeiro. REVISTA ELETRÔNICA PESQUISEDUCA, 9(19):663-673.
Conte, V. d. S. Mineração de dados educacionais para avaliar os fatores que influenciam no desempenho de candidatos do enem.
da Silva Pinto, G Junior, O. d. G. F., and de Barros Costa, E. (2019). Identificação dos fatores de melhorias no ideb pelo uso de mineração de dados: Um estudo de caso em escolas municipais de Teotônio Vilela-Alagoas. RENOTE, 17(3):183-193.
de Souza Barreto, I. M. and Freitas, A. E. S. (2020). Gerando inteligência através de microdados: uma proposta de business intelligence para a área de ensino do Instituto Federal da Bahia (IFBA).
Diniz, E. (1999). O censo escolar. Revista Brasileira de Estudos Pedagógicos, 80(194).
Ferreira, J., Miranda, M., Abelha, A., and Machado, J. (2010). O processo etl em sistemas data warehouse. In INForum, pages 757-765.
Filho, J. A. C., Isotani, S., and Penteado, B. E. Utilização de notas escolares para predição da nota enem em ciências humanas.
Freneda, F. C. B. et al. (2020). Múltiplos fatores do desempenho escolar: uma análise dos microdados do inep sobre a educação no Distrito Federal.
Gonçalves, M. V. F., dos Santos, J. S., Ferreira, C. Z., Zavaleta, J., da Cruz, S. M. S., and Sampaio, J. O. (2021). Datasets curados e enriquecidos com proveniência da campanha nacional de vacinação contra covid-19. In Anais do III Dataset Showcase Workshop, pages 148-159. SBC.
James, E. A., Milenkiewicz, M. T., and Bucknam, A. (2008). Participatory action research for educational leadership: Using data-driven decision making to improve schools. Sage.
Lai, M. K. and Schildkamp, K. (2013). Data-based decision making: An overview. Data-based decision making in education, pages 9-21.
Vasconcelos, F. F., Tavares, J. V., Ribeiro, M. U., Coutinho, F. J., and Clarindo, J. P. (2021). Candidata: um dataset para análise das eleições no Brasil. In Anais do III Dataset Showcase Workshop, pages 160-168. SBC.
WANDERLEY, P. F. et al. (2021). Uso de business intelligence para avaliação de indicadores de desempenho na educação básica: um estudo de caso no estado do Acre.
