Construção de um Dataset Padronizado em Python a partir de Dados Públicos do SNIRH

Resumo


Este trabalho tem como objetivo o desenvolvimento de um script na linguagem de programação Python para automatizar tanto a coleta de dados públicos na plataforma SNIRH, quanto à construção de um dataset pré-processado para facilitar o desenvolvimento de aplicações de inteligência artificial e estatística. Para tanto, a coleta de dados foi feita com a biblioteca Selenium, enquanto a limpeza dos dados com Pandas. O trabalho realizou duas análises estatísticas com base em dados públicos obtidos com o auxílio da script desenvolvido. Ambas mostram a consistência dos dados: a primeira apresenta um gráfico de dispersão entre vazão e o nível, enquanto a segunda aborda uma análise de sazonalidade do nível entre os meses de julho a início de outubro.

Palavras-chave: Hidrometria, SNIRH, ANA, Coleta de Dados, Automação

Referências

ANA (2022). Manual técnico de operação de estações hidrometeorológicas. [link]. Acesso em: out. 2025.

Calegario, A. T., Assis, C. M. d. A., Brumano, C. L., Damasceno, C. R. A., Aragao, J., Amorim, R. S. S., Moreira, M. C., da Silva, D. D., Vaz Junior, G., and Lourenco, A. M. G. (2024). Download e pre-processamento de dados hidroclimaticos do Hidroweb/ANA com o pacote Hydrobr. Acesso em: out. 2025.

Eng, K. and Wolock, D. (2022). Evaluation of machine learning approaches for predicting streamflow metrics across the conterminous United States. Technical Report 2022-5058, U.S. Geological Survey, Reston, VA.

Hasan, F., Medley, P., Drake, J., and Chen, G. (2024). Advancing hydrology through machine learning: Insights, challenges, and future directions using the camels, caravan, grdc, chirps, persiann, nldas, gldas, and grace datasets. Water, 16(13).

Massulo Neto, G. and Nascimento, E. L. B. d. (2024). Mudanças climáticas: inteligência artificial na previsão de eventos hidrológicos extremos no estado do amazonas. Cuadernos de Educación y Desarrollo, 16(13):e6849.

Rodrigues, R. and Martins, C. (2025). Modelos de aprendizado na predição de nível de rios para detecção de falhas em estações hidrotelemétricas. In Anais do Workshop de Computação Aplicada à Gestão do Meio Ambiente e Recursos Naturais (WCAMA). Disponível em: [link]. Acesso em: out. 2025.

SNIRH, A. (2023). Sistema nacional de informações sobre recursos hídricos (snirh). [link]. Acesso em: out. 2025.

Zhang, Z. and et al. (2019). Data preprocessing in machine learning: A review. In Proceedings of the International Conference on Artificial Intelligence and Data Processing (IDAP), pages 1–5. IEEE.
Publicado
12/11/2025
SILVA, Gabriel R.; FERREIRA, Lucca Gabriel H.; RODRIGUES, Roni; MARTINS, Claudia A.; BIANCH, Samuel O. S.. Construção de um Dataset Padronizado em Python a partir de Dados Públicos do SNIRH. In: ESCOLA REGIONAL DE INFORMÁTICA DE MATO GROSSO (ERI-MT), 14. , 2025, Pontes e Lacerda/MT. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 383-387. ISSN 2447-5386. DOI: https://doi.org/10.5753/eri-mt.2025.17229.