Análise de dados do DataViva utilizando técnicas de projeção multidimensional
Resumo
A visualiza¸cão de informa¸cão cria representa¸cões gráficas de cole¸cões de dados para comunicar melhor seu conteúdo informacional ao usuário, revelando tendências e padrões que propiciam uma melhor tomada de decisão. O DataViva é uma plataforma computacional que disponibiliza um conjunto de ferramentas de análise visual aplicados a dados socioeconômicos, educacionais e de comércio internacional de localidades brasileiras, para direcionar a cria¸cão de políticas públicas que contribuam para o desenvolvimento nessas localidades. Técnicas de visualiza¸cão baseadas em proje¸cão multidimensional apresentam potencial para ressaltar a estrutura global da cole¸cão de dados, bem como a sele¸cão/explora¸cão de grupos de interesse. A cole¸cão é organizada baseada na similaridade entre as instâncias, real¸cando os relacionamentos entre elas. Nenhuma das ferramentas de análise fornecidas pelo DataViva atualmente oferece essa perspectiva dos dados de forma explícita. Nesse sentido, este artigo apresenta uma aplica¸cão de duas técnicas de proje¸cão multidimensional aos dados oferecidos por essa plataforma. Os resultados apresentados demonstram o potencial dessa classe de técnicas em revelar grupos de localidades com perfis semelhantes, além de destacar o perfil de localidades com comportamento peculiar, representando uma ferramenta com potencial para permitir a compreensão do comportamento das localidades brasileiras, bem como o relacionamento entre elas.
Referências
J. P. Anzola, L. A. Rodríguez, and G. M. Tarazona. Exploring data by pca and k-means for ieee xplore digital library. In Proceedings of the The 11th International Knowledge Management in Organizations Conference on The changing face of Knowledge Management Impacting Society, page 15. ACM, 2016.
F. Begam and S. Kumar. Visualization of chemical space using principal component analysis. World Applied Sciences Journal, 29:53–59, 2014.
P. Borg, I.; Groenen. Modern multidimensional scaling: Theory and applications. New York: Springer Series in Statistics, 1997.
T. F. Cox and M. A. Cox. Multidimensional scaling. CRC Press, 2010.
D. Jamróz. Application of multidimensional data visualization in creation of pattern recognition systems. In Man-Machine Interactions 3, pages 443–450. Springer, 2014.
B. Johnson and B. Shneiderman. Tree-maps: A space-filling approach to the visualization of hierarchical information structures. In Proceedings of the IEEE Conference on Visualization, 1991, Visualization’91, pages 284–291. IEEE, 1991.
I. Jolliffe. Principal component analysis. Wiley Online Library, 2002.
D. Keim. Visual exploration of large data sets. Communications of the ACM, 44(8):38–44, 2001.
S. Liu, D. Maljovec, B. Wang, P.-T. Bremer, and V. Pascucci. Visualizing high-dimensional data: Advances in the past decade. IEEE Transactions on Visualization and Computer Graphics, 23(3):1249–1268, 2017.
S. R. Panta, R. Wang, J. Fries, R. Kalyanam, N. Speer, M. Banich, K. Kiehl, M. King, M. Milham, T. D. Wager, et al. A tool for interactive data visualization: Application to over 10,000 brain imaging and phantom mri data sets. Frontiers in neuroinformatics, 10, 2016.
F. V. Paulovich, L. G. Nonato, R. Minghim, and H. Levkowitz. Least square projection: A fast high-precision multidimensional projection technique and its application to document mapping. IEEE Transactions on Visualization and Computer Graphics, 14(3):564–575, 2008.
G.-D. Sun, Y.-C. Wu, R.-H. Liang, and S.-X. Liu. A survey of visual analytics techniques and applications: State-of-the-art research and future challenges. Journal of Computer Science and Technology, 28(5):852–867, 2013.
E. Tejada, R. Minghim, and L. G. Nonato. On improved projection techniques to support visual exploration of multi-dimensional data sets. Information Visualization, 2(4):218–231, 2003.