Use of a decision tree to choose a gap filling method in meteorological data

Abstract


Traditional meteorological stations are being replaced by automated ones, creating a greater amount of information. However, there may be gaps on the data series, which creates difficulties in the analysis and in decision-making processes. Such gaps must be corrected in order to obtain a quality dataset and enable more detailed analyzes. There are gap filling methods that do this task. Each method has different performances depending on the aspects of the gaps. This paper proposes a methodology with a decision tree to determine which gap filling method should be used by analyzing a meteorological dataset.

Keywords: collection stations, weather data, missing data, gap filling, decision tree

References

Correia, T. P., Dohler, R. E., Dambroz, C. S., and Binoti, D. H. B. (2016). Aplicação de redes neurais artificiais no preenchimento de falhas de precipitação mensal na região serrana do Espírito Santo. UNESP, Geociências, 35(4):560–567.

Curral, J. (1994). Statistics packages: A general overview. Universidade de Glasgow.

da Silva Júnior, A. A., de Souza Rosa Gomes, R., Ventura, T. M., Rodrigues, T. R.,de Souza Nogueira, J., de Oliveira, A. G., and de Figueiredo, J. M. (2019). Visão geral sobre o tratamento de dados meterológicos no Brasil.Natural Resources, 9(2):59–66.

de Oliveira, A. G. (2009). A importância dos dados das variáveis climáticas nas pesquisas em geografia: Um estudo de caso empregando a precipitação pluviométrica. Caminhosde Geografia - revista online, pages 9–21.

Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. (1996). Advances in knowledge discovery and data mining. pages 1–34.

Giroto, D. B., Guldoni, B., and Tommaselli, J. T. G. (2015). A escola na estação meteorológica: a importância da meteorologia no cotidiano humano. 8o Congresso de extensão universitária da UNESP, pages 1–11.

Han, J. and Kamber, M. (2001).Data mining: concepts and techniques. Morgan Kauf-mann Publishers, 1st edition.

Junior, L. C. G. V., Ventura, T. M., Gomes, R. S. R., de S. Nogueira, J., de A. Lobo, F., Vourlitis, G. L., and Rodrigues, T. R. (2020). Comparative assessment of modelled and empirical reference evapotranspirations methods for a brazilian savanna. Agricultural Water Management, volume 232.

Mello, Y. R. d., Kohls, W., and Oliveira, T. M. N. d. (2017). Uso de diferentes métodospara o preenchimento de falhas em estações pluviométricas.Boletim de Geografia,35(1):112–121.

Mentzer, J. T. and Bienstock, C. C. (1998). Sales forecasting management. California: Sage.

Moisen, G. G. (2008). Classification and regression trees. In Sven Erik Jorgensen, B.D. F., editor, Encyclopedia of Ecology, volume 1, pages 582–588. Elsevier.

Nascimento, R. F. F., de Alcantara, E. H., Kampel, M., Stech, J. L., de Moraes Novo, E. M. L., and Fonseca, L. M. G. (2009). O algoritmo Support Vector Machines (SVM): avaliação da separação ótima de classes em imagens CCD-CBERS-2. Anais XIV Simpósio Brasileiro de Sensoriamento Remoto, Natal, Brasil, pages 2079–2086.

Rangel, R. H. O., de Oliveira-Junior, J. F., Júnior, A. R. T., Pimentel, L. C. G., and de Gois, G. (2018). Série e transformada de fourier aplicadas no preenchimento de falhas de séries temporais de intensidade do vento na central nuclear almirante Alvaro Alberto, Rio de Janeiro - Brasil. Anuário do Instituto de Geociências - UFRJ, 41(2):74–84.

Ventura, T. M., de Oliveira, A. G., Marques, H. O., Oliveira, R. S., Martins, C. A., de Figueiredo, J. M., and Bonfante, A. G. (2013). Uma abordagem computacional para preenchimento de falhas em dados micro meteorológicos. Revista Brasileira de Ciências Ambientais, (27).

Ventura, T. M., Martins, C. A., de Figueiredo, J. M., de Oliveira, A. G., and Montanher, J. R. P. (2019). Mannga: A robust method for gap filling meteorological data. Revista Brasileira de Meteorologia, 34(2):315–323.

Ventura, T. M., Santana, L. L. R., Martins, C. A., and de Figueiredo, J. M. (2016). Análise da aplicabilidade de métodos estatísticos para preenchimento de falhas em dados meteorológicos. Revista Brasileira de Climatologia, 12:168–177.

Wanderley, H. S., de Amorim, R. F. C., and de Carvalho, F. O. (2012). Variabilidade espacial e preenchimento de falhas de dados pluviométricos para o estado de Alagoas. Revista Brasileira de Meteorologia, 27(3):347–354.

Witten, I. H. and Frank, E. (2005).Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. Morgan Kaufmann Publishers and Elsevier,2nd edition.
Published
2020-06-30
ZENERE, Pedro Vinicius S.; VENTURA, Thiago Meirelles; GOMES, Raphael de Souza Rosa; RODRIGUES, Thiago Rangel. Use of a decision tree to choose a gap filling method in meteorological data. In: BRAZILIAN E-SCIENCE WORKSHOP (BRESCI), 14. , 2020, Cuiabá. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2020 . p. 89-96. ISSN 2763-8774. DOI: https://doi.org/10.5753/bresci.2020.11186.