Utilização do Apache Superset para Visualização Escalável de Dados Educacionais Públicos: Um Estudo de Caso com o Censo Escola

  • João Pedro V. Ramalho Universidade Federal do Paraná (UFPR)
  • João A. Silveira Universidade Federal do Paraná (UFPR)
  • Thales Gabriel C. de Lima Universidade Federal do Paraná (UFPR)
  • Mateus S. Herbele Universidade Federal do Paraná (UFPR)
  • Josiney de Souza Universidade Federal do Paraná (UFPR)
  • Guilherme A. Derenievicz Universidade Federal do Paraná (UFPR)
  • Letícia M. Peres Universidade Federal do Paraná (UFPR)
  • Simone Dominico Universidade Federal do Paraná (UFPR) https://orcid.org/0000-0003-3471-8670

Resumo


As bases públicas, como o Censo Escolar, dispõem de dados que facilitam o planejamento de políticas educacionais no Brasil. Embora os dados sejam fornecidos em formato acessível e estrutura tabular, a falta de ferramentas adequadas limita sua exploração. Este artigo avalia o uso do Apache Superset como solução de código aberto para visualização interativa e criação de indicadores educacionais. Os dados foram adicionados em um banco relacional e passaram por um fluxo de ingestão e transformação. O Superset foi utilizado para a criação de indicadores de matrículas e docentes, para demonstrar como a ferramenta facilita a análise de padrões temporais, espaciais e demográficos, apoiando a tomada de decisão e a produção de conhecimento científico.
Palavras-chave: Visualização de dados, dados públicos, educação básica, Apache Superset

Referências

Apache Software Foundation (2024). Apache NiFi. [link]. Acesso em: 14 jun. 2025.

Ehrenfried, H. V., Eckelberg, R., Iboshi, H., Todt, E., Weingaertner, D., and Del Fabro, M. D. (2019). Hotmapper: Historical open data table mapper. In EDBT, pages 550–553.

Karabtsev, S., Kotov, R., Davzit, I., and Gurov, E. (2023). Building data marts to analyze university faculty activities using power bi. In E3S Web of Conferences, volume 419, page 02014. EDP Sciences.

Mbata, A., Sripada, Y., and Zhong, M. (2024). A survey of pipeline tools for data engineering. arXiv preprint arXiv:2406.08335.

Schulze, R., Schreiber, T., Yatsishin, I., Dahimene, R., and Milovidov, A. (2024). Clickhouse-lightning fast analytics for everyone. Proceedings of the VLDB Endowment, 17(12):3731–3744.

Superset, A. (2024). Apache Superset. [link]. Acesso em: 5 maio 2025.

Van den Burg, G. J., Nazábal, A., and Sutton, C. (2019). Wrangling messy csv files by detecting row and type patterns. Data Mining and Knowledge Discovery, 33(6):1799–1820.

Yamanaka, M., de Almeida, D., de Almeida, P. R., Dominico, S., Peres, L., Sunye, M., and Almeida, E. (2024). Statistical validation of column matching in the database schema evolution of the brazilian public school census. In Anais do XXXIX Simpósio Brasileiro de Bancos de Dados - SBBD, pages 498–509.
Publicado
29/09/2025
RAMALHO, João Pedro V.; SILVEIRA, João A.; DE LIMA, Thales Gabriel C.; S. HERBELE, Mateus; DE SOUZA, Josiney; DERENIEVICZ, Guilherme A.; PERES, Letícia M.; DOMINICO, Simone. Utilização do Apache Superset para Visualização Escalável de Dados Educacionais Públicos: Um Estudo de Caso com o Censo Escola. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 40. , 2025, Fortaleza/CE. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 914-920. ISSN 2763-8979. DOI: https://doi.org/10.5753/sbbd.2025.247800.