Impacto da amostragem aleatória uniforme para o aumento da escalabilidade na geração de agrupamentos hierárquicos de séries espaço-temporais

Rodolfo M. S. Mendes; Humberto Razente; Maria Camila N. Barioni; Luciana Alvim Santos Romani

doi:10.5753/sbbd.2016.24327

Rodolfo M. S. Mendes Universidade Federal de Uberlândia
Humberto Razente Universidade Federal de Uberlândia
Maria Camila N. Barioni Universidade Federal de Uberlândia
Luciana Alvim Santos Romani Embrapa Informática Agropecuária

DOI: https://doi.org/10.5753/sbbd.2016.24327

Resumo

Este trabalho apresenta resultados do emprego de uma abordagem escalável para o agrupamento hierárquico de séries espaço-temporais de imagens de satélite visando a redução da complexidade de tempo de execução e espaço do algoritmo. Para tanto são exploradas as técnicas de pré-processamento para redução da numerosidade, particularmente por meio de amostragem de dados. O experimento indica que é necessário o desenvolvimento de uma estratégia mais eficiente que a seleção ingênua de amostras (amostragem uniforme).

Palavras-chave: Agrupamento hierárquico, séries espaço-temporais

Referências

Bones, C., Romani, L., and Sousa, E. (2016). Improving multivariate data streams clustering. Procedia Computer Science, 80:461 – 471.

Davies, D. L. and Bouldin, D. W. (1979). A cluster separation measure. IEEE Trans. Pattern Anal. Mach. Intell., 1(2):224–227.

Dias, T. L., Câmara, G., and A. Davis Jr., C. (2005). Bancos de Dados Geográficos, capítulo Modelos espaço-temporais, páginas 137–169. MundoGEO.

Ding, R., Wang, Q., Dang, Y., Fu, Q., Zhang, H., and Zhang, D. (2015). YADING: Fast Clustering of Large-Scale Time Series Data. VLDB Endowment, 8(5):473–484.

Dunn, J. C. (1973). A fuzzy relative of the isodata process and its use in detecting compact well-separated clusters. J. Cybern., (3):32–57.

García, S., Luengo, J., and Herrera, F. (2015). Data Preprocessing in Data Mining, capítulo Data Reduction, páginas 147–162. Springer.

Guha, S., Rastogi, R., and Shim, K. (1998). Cure: an efficient clustering algorithm for large databases. In ACM SIGMOD Record, volume 27, páginas 73–84. ACM.

Han, J., Kamber, M., and Pei, J. (2011). Data Mining: Concepts and Techniques. Morgan Kaufmann.

Jain, A. K. (2010). Data clustering: 50 years beyond k-means. Pattern Recogn. Lett., 31(8):651–666.

Kaufman, L. and Rousseeuw, P. J. (1990). Finding Groups in Data: An Introduction to Cluster Analysis. Wiley Series in Probability and Statistics. Wiley.

Meek, C., Thiesson, B., and Heckerman, D. (2002). The learning-curve sampling method applied to model-based clustering. Journal of Machine Learning Research, 2:397–418.

Ng, R. T. and Han, J. (2002). Clarans: A method for clustering objects for spatial data mining. IEEE Trans. Knowl. Data Eng. (TKDE), 14(5):1003–1016.

Zhang, T., Ramakrishnan, R., and Livny, M. (1997). Birch: A new data clustering algorithm and its applications. Data Mining and Knowledge Discovery, 1(2):141–182.