Intelligent Information System for Analyzing Success Factors in Public Policies: A Case Study of the Pé-de-Meia Program

  • Lucas B. F. Praxedes UFERSA / UERN
  • Sebastião E. A. Filho UFERSA / UERN

Resumo


Research Context: Public policies such as the 'Pé-de-Meia' program are crucial for reducing school dropout in Brazil, but their evaluation is complex due to vast amounts of data and inherent selection bias. Scientific and/or Practical Problem: There is a need for an approach that moves beyond simple causal inference to identify the contextual factors that enhance the program's success, providing actionable intelligence for public managers. Proposed Solution and/or Analysis: We developed an intelligent information system that integrates public data and uses a Machine Learning model (LightGBM) to identify the main predictors of success in student retention, complemented by a quasi-experimental analysis (PSM) to estimate impact. Related IS Theory: This work is grounded in the principles of Decision Support Systems (DSS), applying computational intelligence to transform raw governmental data into strategic insights for policy management. Research Method: The methodology involved a four-stage data processing pipeline: data collection (Censo Escolar, Portal da Transparência), feature engineering (creating a proxy for school enrollment dynamics), predictive modeling with LightGBM to rank success factors, and impact estimation using Propensity Score Matching. Summary of Results: The predictive analysis identified that, beyond the natural inertia of previous performance, the number of teachers and program intensity are the most significant actionable predictors of success. To ensure robustness, these factors were cross-validated using a Random Forest model. The quasi-experimental analysis, refined with strict common support and caliper matching, estimated a positive and statistically significant impact (ATT = +0.19 p.p., p-value < 0.001). Contributions and Impact to IS area: This study contributes a novel, rigorously validated method for public policy evaluation within the IS field. It demonstrates how a predictive system can provide immediate strategic insights, while advanced quasi-experimental techniques can detect causal effects even in early-stage implementations, offering a tangible artifact for evidence-based management.

Referências

Aguilar, J. et al. (2022). A machine learning model for predicting student dropout in higher education. Journal of Intelligent & Fuzzy Systems, v. 42, n. 6, p. 5747-5762.

Arduini, D. et al. (2020). Inteligência na gestão pública: um modelo de institucionalização. Revista de Administração Pública, Rio de Janeiro, v. 54, n. 1, p. 177-199.

Brasil (2019). Decreto Nº 10.046, de 9 de outubro de 2019. Dispõe sobre a governança no compartilhamento de dados no âmbito da administração pública federal e institui o Cadastro Base do Cidadão e o Comitê Central de Governança de Dados. Diário Oficial da União, Brasília, DF, 10 out. 2019.

Brasil (2024). Lei nº 14.818, de 16 de janeiro de 2024. Institui o Programa Pé-de-Meia, a poupança de incentivo à permanência e conclusão escolar, para estudantes do ensino médio. Diário Oficial da União, Brasília, DF, 17 jan. 2024.

Chen, H., Chiang, R. H. and Storey, V. C. (2012). Business Intelligence and Analytics: From Big Data to Big Impact. MIS Quarterly, v. 36, n. 4, p. 1165-1188.

Costa, F. L. and Castanhar, J. C. (2003). Avaliação de programas públicos: desafios conceituais e metodológicos. Revista de Administração Pública, Rio de Janeiro, v. 37, n. 5, p. 969-992, set./out. 2003.

Crosling, G., Heagney, M. and Thomas, L. (2009). Improving student retention in higher education. Australian Universities' Review, v. 51, n. 2, p. 9-18.

de Janvry, A. et al. (2015). The impact of Bolsa Família on schooling. Journal of Development Economics, v. 116, p. 1-17.

Freund, Y. and Schapire, R. E. (1997). A decision-theoretic generalization of on-line learning and an application to boosting. Journal of Computer and System Sciences, v. 55, n. 1, p. 119-139.

Friedman, J. H. (2001). Greedy Function Approximation: A Gradient Boosting Machine. The Annals of Statistics, v. 29, n. 5, p. 1189-1232.

Instituto Brasileiro de Geografia e Estatística (IBGE) (2024). Pesquisa Nacional por Amostra de Domicílios Contínua: Educação 2023. Rio de Janeiro: IBGE.

Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) (2024). Censo da Educação Básica 2023: resumo técnico. Brasília, DF: Inep.

Janssen, M., van der Voort, H. and Wahyudi, A. (2017). Factors influencing data-driven decision-making in government. Information Polity, v. 22, n. 2-3, p. 1-17.

Ke, G. et al. (2017). LightGBM: A Highly Efficient Gradient Boosting Decision Tree. In: Conference on Neural Information Processing Systems, 31., Long Beach. Proceedings... Long Beach, CA, USA, p. 3146-3154.

Mullainathan, S. and Spiess, J. (2017). Machine learning: an applied econometric approach. Journal of Economic Perspectives, v. 31, n. 2, p. 87-106.

Pereira, A. K. et al. (2018). Desafios e oportunidades para o uso de Big Data no setor público brasileiro. Revista de Administração Pública, v. 52, n. 4, p. 746-763.

Quintella, R. H. and Soares Junior, J. S. (2003). Sistemas de apoio à decisão e descoberta de conhecimento em bases de dados: uma aplicação potencial em políticas públicas. Organizações & Sociedade, Salvador, v. 10, n. 28, p. 83-96.

Ronfeldt, M., Loeb, S. and Wyckoff, J. (2013). How Teacher Turnover Harms Student Achievement. American Educational Research Journal, v. 50, n. 1, p. 4-36.

Rosenbaum, P. R. and Rubin, D. B. (1983). The central role of the propensity score in observational studies for causal effects. Biometrika, v. 70, n. 1, p. 41-55.

Samuel, A. L. (1959). Some Studies in Machine Learning Using the Game of Checkers. IBM Journal of Research and Development, v. 3, n. 3, p. 210-229.

Shadish, W. R., Cook, T. D. and Campbell, D. T. (2002). Experimental and Quasi-Experimental Designs for Generalized Causal Inference. Boston: Houghton Mifflin.

Silva, A. R. da (2024). Avaliação de modelos preditivos baseados em aprendizagem de máquina no contexto da evasão escolar considerando um cenário multicampi. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal do Piauí, Teresina.

Silva, L. et al. (2022). A Machine Learning Approach for School Dropout Prediction in Brazil. In: European Symposium on Artificial Neural Networks, Bruges. Proceedings... Bruges, Belgium.

Silva Junior, W. S. and Gonçalves, F. O. (2016). Evidências da relação entre a frequência no ensino infantil e o desempenho no ensino fundamental no Brasil. Revista Brasileira de Estudos de População, Rio de Janeiro, v. 33, n. 2, p. 283-301, maio/ago. 2016.

Wooldridge, J. M. (2010). Econometric Analysis of Cross Section and Panel Data. 2. ed. Cambridge: MIT Press.

Borges, G. A. et al. (2025). A Platform for Early Class Dropout Prediction of University Students. IEEE Access, v. 13, p. 109116-109133. DOI: 10.1109/ACCESS.2025.3581751.

Martins, C. P. P. and Silva, G. S. (2024). Método e Aplicação de Automatização Para Download de Dados Abertos em Portais de Transparência. In: Anais Estendidos do Simpósio Brasileiro de Sistemas de Informação (SBSI). Porto Alegre: SBC, p. 351-356.

Wang, C. and Yao, S. (2025). Enhancing Student Dropout and Academic Success Prediction Using Machine Learning and Over-sampling Techniques. ICCK Transactions on Educational Data Mining, v. 1, n. 1, p. 36-43.

Alves, A. F. et al. (2024). Aspectos relevantes dos modelos preditivos de inteligência artificial no combate à evasão escolar em cursos de graduação: uma revisão sistemática. In: Anais do XXXV Simpósio Brasileiro de Informática na Educação (SBIE 2024). Porto Alegre: SBC.

Colpo, M. P. et al. (2024). Educational Data Mining for Dropout Prediction: Trends, Opportunities, and Challenges. Revista Brasileira de Informática na Educação (RBIE), v. 32, p. 220-256.

Yar, M. A. et al. (2024). Governing with Intelligence: The Impact of Artificial Intelligence on Policy Development. Information (MDPI), v. 15, n. 9, 556.

IPEA (2024). Nota Técnica: Agenda Político-Institucional e Programas Sociais. Instituto de Pesquisa Econômica Aplicada.

Lunt, M. (2014). Selecting an appropriate caliper can be essential for achieving good balance with propensity score matching. American Journal of Epidemiology.
Publicado
25/05/2026
PRAXEDES, Lucas B. F.; A. FILHO, Sebastião E.. Intelligent Information System for Analyzing Success Factors in Public Policies: A Case Study of the Pé-de-Meia Program. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 22. , 2026, Vitória/ES. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2026 . p. 1276-1291. DOI: https://doi.org/10.5753/sbsi.2026.248775.