Mineração de Séries Temporais por meio da Extração de Características e da Identificação de Motifs

  • André Gustavo Maletzke USP / UNIOESTE / PTI
  • Gustavo E. A. P. A. Batista USP
  • Huei Diana Lee UNIOESTE / PTI
  • Feng Chung Wu UNIOESTE / PTI

Resumo


Um dos grandes desafios em aprendizado de máquina é a integração de dados temporais ao processo de mineração de dados. Todavia, existe uma carência por métodos capazes de induzir conhecimento simbólico e inteligível a partir desses dados, implicando que sejam tratados de maneira adhoc. Neste trabalho é proposta uma metodologia para extração de conhecimento de séries temporais, por meio da extração de características e da identificação de motifs buscando construir modelos, principalmente simbólicos, mais precisos e compreensíveis. É utilizado também um método que demanda menor esforço computacional para a identificação de motifs. Os resultados foram significativamente melhores em relação a uma das abordagens comumente utilizada.

Referências

Chiu, B., Keogh, E., and Lonardi, S. (2003). “Probabilistic discovery of time series motifs”. In: 9th International Conference on Knowledge Discovery and Data Mining, pages 493–498, New York, USA. ACM Press.

Kadous, M. W. and Sammut, C. (2004). “Constructive induction for classifying time series”. In: 15th European Conference on Machine Learning, volume 3201 of Lecture Notes in Computer Science, pages 192–204, Pisa, Italy. Springer.

Last, M., Klein, Y., and Kandel, A. (2001). “Knowledge discovery in time series databases”. IEEE Transactions on Systems, Man, and Cybernetics, Part B, 31(1):160–169.

Lin, J., Keogh, E., Lonardi, S., and Chiu, B. (2003). “A symbolic representation of time series, with implications for streaming algorithms”. In: 8th Workshop on Research Issues in Data Mining and Knowledge Discovery, pages 2–11, San Diego, USA. ACM Press.

Maletzke, A. G., Batista, G. E., and Lee, H. D. (2008). “Uma avaliação sobre a identificação de motifs em séries temporais”. In: 3th Congresso da Academia Trinacional de Ciências, volume 1, pages 1–10, Foz do Iguaçu, Brasil.

Michalski, R. S., Bratko, I., and Kubat, M. (1998). Machine learning and data mining. Wiley, Chichester, West Sussex, England.

Weiss, S. M. and Indurkhya, N. (1998). Predictive Data Mining: a practical guide. Morgan Kaufmann, California, USA.

Yang, Q. and Wu, X. (2006). “10 challenging problems in data mining research”. International Journal of information Technology and Decision Making, 5(4):401–420.

Yankov, D., Keogh, E., Medina, J., Chiu, B., and Zordan, V. (2007). “Detecting time series motifs under uniform scaling”. In: 13th International Conference on Knowledge Discovery and Data Mining, pages 844–853, New York, USA. ACM Press.
Publicado
20/07/2009
MALETZKE, André Gustavo; BATISTA, Gustavo E. A. P. A.; LEE, Huei Diana; WU, Feng Chung. Mineração de Séries Temporais por meio da Extração de Características e da Identificação de Motifs. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 7. , 2009, Bento Gonçalves/RS. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2009 . p. 11-20. ISSN 2763-9061.

Artigos mais lidos do(s) mesmo(s) autor(es)