Detecção de Anomalias em Dados Meteorológicos do Sertão de Pernambuco Utilizando Isolation Forest e DBSCAN

  • Anderson Rodrigues Cavalcante UFRPE
  • Victor Wanderley Costa de Medeiros UFRPE
  • Glauco Estácio Gonçalves UFPA


Valores anômalos são alguns dos problemas presentes em séries de dados meteorológicos, os quais podem aparecer por causa de defeitos, má configuração dos sensores e até mesmo efeitos climáticos extremos. O uso de algoritmos de aprendizado de máquina não supervisionado tem se tornado cada vez mais comum para este tipo de problema. Esta pesquisa avalia o uso do DBSCAN (Density Based Spatial Clustering of Application with Noise) e da IF (Isolation Forest) para detecção de anomalias presentes nos dados meteorológicos de temperatura e umidade relativa do ar de Petrolina. Tanto o Isolation Forest quanto o DBSCAN, em suas melhores configurações de hiperparâmetros, apresentaram bom desempenho. O IF apresentou uma acurácia de 98% e uma pontuação F1 de 95%. Já o DBSCAN apresentou uma acurácia de 97% e uma pontuação F1 de 94%. Ambos também obtiveram uma revocação de 100%, o que indica que não classificaram valores como falsos negativos, ou seja, nenhuma anomalia foi considerada normal.


CAVALCANTE, Anderson Rodrigues; MEDEIROS, Victor Wanderley Costa de; GONÇALVES, Glauco Estácio. Detecção de Anomalias em Dados Meteorológicos do Sertão de Pernambuco Utilizando Isolation Forest e DBSCAN. In: WORKSHOP DE COMPUTAÇÃO APLICADA À GESTÃO DO MEIO AMBIENTE E RECURSOS NATURAIS (WCAMA), 14. , 2023, João Pessoa/PB. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 51-60. ISSN 2595-6124. DOI: