Construção de um Dataset Padronizado em Python a partir de Dados Públicos do SNIRH
Resumo
Este trabalho tem como objetivo o desenvolvimento de um script na linguagem de programação Python para automatizar tanto a coleta de dados públicos na plataforma SNIRH, quanto à construção de um dataset pré-processado para facilitar o desenvolvimento de aplicações de inteligência artificial e estatística. Para tanto, a coleta de dados foi feita com a biblioteca Selenium, enquanto a limpeza dos dados com Pandas. O trabalho realizou duas análises estatísticas com base em dados públicos obtidos com o auxílio da script desenvolvido. Ambas mostram a consistência dos dados: a primeira apresenta um gráfico de dispersão entre vazão e o nível, enquanto a segunda aborda uma análise de sazonalidade do nível entre os meses de julho a início de outubro.
Referências
Calegario, A. T., Assis, C. M. d. A., Brumano, C. L., Damasceno, C. R. A., Aragao, J., Amorim, R. S. S., Moreira, M. C., da Silva, D. D., Vaz Junior, G., and Lourenco, A. M. G. (2024). Download e pre-processamento de dados hidroclimaticos do Hidroweb/ANA com o pacote Hydrobr. Acesso em: out. 2025.
Eng, K. and Wolock, D. (2022). Evaluation of machine learning approaches for predicting streamflow metrics across the conterminous United States. Technical Report 2022-5058, U.S. Geological Survey, Reston, VA.
Hasan, F., Medley, P., Drake, J., and Chen, G. (2024). Advancing hydrology through machine learning: Insights, challenges, and future directions using the camels, caravan, grdc, chirps, persiann, nldas, gldas, and grace datasets. Water, 16(13).
Massulo Neto, G. and Nascimento, E. L. B. d. (2024). Mudanças climáticas: inteligência artificial na previsão de eventos hidrológicos extremos no estado do amazonas. Cuadernos de Educación y Desarrollo, 16(13):e6849.
Rodrigues, R. and Martins, C. (2025). Modelos de aprendizado na predição de nível de rios para detecção de falhas em estações hidrotelemétricas. In Anais do Workshop de Computação Aplicada à Gestão do Meio Ambiente e Recursos Naturais (WCAMA). Disponível em: [link]. Acesso em: out. 2025.
SNIRH, A. (2023). Sistema nacional de informações sobre recursos hídricos (snirh). [link]. Acesso em: out. 2025.
Zhang, Z. and et al. (2019). Data preprocessing in machine learning: A review. In Proceedings of the International Conference on Artificial Intelligence and Data Processing (IDAP), pages 1–5. IEEE.
