Aumento de dados e suavização integrada para predição de séries temporais baseada em aprendizado de máquina

  • Fernando Alexandrino Centro Federal de Educação Tecnológica Celso Suckow da Fonseca (CEFET/RJ) / Institito Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP)
  • Carla Pacheco Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
  • Diego Carvalho Centro Federal de Educação Tecnológica Celso Suckow da Fonseca (CEFET/RJ)
  • Eduardo Ogasawara Centro Federal de Educação Tecnológica Celso Suckow da Fonseca (CEFET/RJ)

Resumo


A predição de séries temporais é uma tarefa importante da ciência de dados e possui aplicações práticas em diversos campos. Este artigo explora técnicas de aumento de dados e de suavização para melhorar a precisão e a robustez de modelos preditivos. Uma metodologia chamada de Augment+Smooth, que integra ambas as abordagens, é proposta para gerar novas instâncias a partir de termos recentes e bem-comportados. Os experimentos demonstraram que ela resulta em melhorias significativas na previsão em um contexto extremo de baixa disponibilidade de dados. Portanto, o método proposto oferece uma base sólida para futuras pesquisas e aplicações na predição de séries temporais.

Palavras-chave: aumento de dados, suavização, predição, séries temporais, aprendizado de máquina

Referências

Bishop, C. M. (1995). Training with Noise is Equivalent to Tikhonov Regularization. Neural Computation, 7(1):108–116.

Box, G. E. P., Jenkins, G. M., Reinsel, G. C., and Ljung, G. M. (2015). Time Series Analysis: Forecasting and Control. John Wiley & Sons.

Capistrano, B., Chen, L., Ribeiro, M., Pacheco, C., Lobosco, D., Quadros, J., Barreto, M. I., and Ogasawara, E. (2023). Desafios na Predição do Consumo de Pesticidas em Escala Global Usando Aprendizado de Máquina. In Anais do Brazilian e-Science Workshop (BreSci), pages 33–38. SBC.

Hastie, T. J. (2017). Generalized Additive Models. Routledge.

Haykin, S. O. (2011). Neural Networks and Learning Machines. Pearson Education.

Hyndman, R. J. and Athanasopoulos, G. (2018). Forecasting: principles and practice. OTexts.

Iglesias, G., Talavera, E., González-Prieto, Á., Mozo, A., and Gómez-Canaval, S. (2023). Data Augmentation techniques in time series domain: a survey and taxonomy. Neural Computing and Applications, 35(14):10123 – 10145.

Mason, R. L., Gunst, R. F., and Hess, J. L. (2003). Statistical Design and Analysis of Experiments: With Applications to Engineering and Science. John Wiley & Sons, 2nd. edition.

Ogasawara, E., Martinez, L. C., De Oliveira, D., Zimbrão, G., Pappa, G. L., and Mattoso, M. (2010). Adaptive Normalization: A novel data normalization approach for nonstationary time series. In Proceedings of the International Joint Conference on Neural Networks.

Rumelhart, D. E., Hinton, G. E., and Williams, R. J. (1986). Learning representations by back-propagating errors. Nature, 323(6088):533 – 536.

Salles, R., Pacitti, E., Bezerra, E., Porto, F., and Ogasawara, E. (2022). TSPred: A framework for nonstationary time series prediction. Neurocomputing, 467:197 – 202.

Shumway, R. H. and Stoffer, D. S. (2017). Time Series Analysis and Its Applications: With R Examples. Springer.

Um, T. T., Pfister, F. M., Pichler, D., Endo, S., Lang, M., Hirche, S., Fietzek, U., and Kulic, D. (2017). Data augmentation of wearable sensor data for Parkinson’s disease monitoring using convolutional neural networks. In ICMI 2017 - Proceedings of the 19th ACM International Conference on Multimodal Interaction, pages 216 – 220.

Wand, M. P. and Jones, M. C. (1994). Kernel Smoothing. CRC Press.

Zhang, G. P. (2003). Time series forecasting using a hybrid arima and neural network model. Neurocomputing, 50:159–175.
Publicado
14/10/2024
ALEXANDRINO, Fernando; PACHECO, Carla; CARVALHO, Diego; OGASAWARA, Eduardo. Aumento de dados e suavização integrada para predição de séries temporais baseada em aprendizado de máquina. In: BRAZILIAN E-SCIENCE WORKSHOP (BRESCI), 18. , 2024, Florianópolis/SC. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 32-39. ISSN 2763-8774. DOI: https://doi.org/10.5753/bresci.2024.244100.