Explorando técnicas de aprendizado de máquina para aprimoramento da previsão de geadas no sul e sudeste do Brasil
Resumo
A previsão operacional de geadas do CPTEC/INPE é baseada em um índice estabelecido a partir da variação numérica de variáveis meteorológicas de um modelo de previsão de tempo, que é comparado aos valores previstos operacionalmente. Um constante aprimoramento dessas previsões visando mitigar danos econômicos e sociais decorrentes de geadas se faz necessária. O propósito deste trabalho é identificar uma metodologia baseada em aprendizado de máquina que supere o desempenho do sistema de previsão atual. Para tanto, esta pesquisa exploratória aplicou diferentes combinações entre três algoritmos, variando suas parametrizações e o conjunto de variáveis preditoras de dados de estações meteorológicas do sul e sudeste do Brasil. Testes preliminares em previsões de 24h mostram que o desempenho supera o método atual, sinalizando que o processo de busca da metodologia mais adequada deve ser continuada.
Referências
Black, T. L. (1994) The new NMC mesoscale Eta model: description and forecast examples. Weather and Forecasting, 9, 265–278.
Chou, S. C., Tanajura, C. A. S., Xue, Y. and Nobre, C. A. (2002) Validation of the coupled Eta/SsiB model over South America. Journal of Geophysical Research: Atmospheres, 107(D20), 8088. DOI: https://doi.org/10.1029/2000JD000270.
Friedman, J. H. (2001) Greedy Function Approximation: A Gradient Boosting Machine. Annals of Statistics, 29, 1189-1232. DOI: https://doi.org/10.1214/aos/1013203451
Haykin, S. (1999) Neural Networks: A Comprehensive Foundation, 842 pp., Prentice-Hall, Old Tappan, N. J.
Liaw, A., Wiener, M., (2002) Classification and Regression by random forest. R. News 2, 18–22.
Mesinger, F., Janji?c, Z.I., Ni ckovi?c, S., Gavrilov, D. and Deaven, D.G. (1988) The step-mountain coordinate: model description and per- formance for cases of alpine lee cyclogenesis and for a case of an Appalachian redevelopment. Monthly Weather Review, 116, 1493–1518.
Naing, W. Y. N., Htike, Z.Z., (2015) Forecasting of monthly temperature variations using random forests. ARPN J. Eng. Appl. Sci. 10, 10109–10112.
Pedregosa et al. (2011) Scikit-learn: Machine Learning in Python, JMLR 12, pp. 2825-2830.
Pereira, A. R., Angelocci, L. R., Sentelhas, P. C. (2002) Agrometeorologia: fundamentos e aplicações práticas. Guaíba: Agropecuária. 478p.
Robinson, C., Mort, N., (1997) A neural network system for the protection of citrus crops from frost damage. Comput. Electron. Agric. 16, 177–187. DOI: https://doi.org/10.1016/S0168-1699(96)00037-3
Roebber, P. J. (2009) Visualizing multiple measures of forecast quality. Weather and Forecasting, 24, 601–608.
Rozante J. R., Gutierrez E. R, da Silva Dias P. L., de Almeida Fernandes A., Alvim D. S., Silva V. M. (2020) Development of an index for frost prediction: Technique and validation. Meteorol Appl. 2020;27:e1807. DOI: https://doi.org/10.1002/met.1807
Stephenson, D. B. (2000) Use of the “odds ratio” for diagnosing forecast skill. Weather and Forecasting, 15, 221–232.
Wilks, D. S. (2011) Statistical methods in the atmospheric sciences. Oxford and Waltham, MA: Academic Press and Elsevier Science.
Yang L., Shami, A. (2020) On hyperparameter optimization of machine learning algorithms: Theory and practice, Neurocomputing, Volume 415, Pages 295-316, ISSN 0925-2312, DOI: https://doi.org/10.1016/j.neucom.2020.07.061.