OLAP Textual com Múltiplas Hierarquias de Tópicos e Rankings Segmentados

  • Adriano Souza Universidade Federal de Ouro Preto
  • Reinaldo Fortes Universidade Federal de Ouro Preto
  • Joubert Lima Universidade Federal de Ouro Preto

Resumo


Na última década a tecnologia OLAP tem sido redesenhada para melhor atender à demanda de dados textuais, tendo que remodelar suas medidas e dimensões. A hierarquia de tópicos surgiu como uma alternativa para organizar dimensões textuais em diferentes níveis semânticos. Contudo, tal hierarquia é criada uma única vez e utilizada para todos os cuboides do cubo. A hierarquia de tópicos é sensível ao conteúdo dos documentos, portanto diferentes células de um cubo agregam diferentes conjuntos de documentos, produzindo hierarquias de tópicos distintas. Este artigo apresenta uma abordagem para OLAP textual que constrói múltiplas hierarquias de tópicos para cada célula do cubo, denominada DTCubing. Múltiplas hierarquias são viáveis porque cada documento pode ser particionado em diversos segmentos de texto, tais como título, resumo, parágrafo, dentre outros. Este artigo também pretende contribuir com a apresentação dos resultados das consultas multidimensionais. O estado da arte em OLAP textual normalmente retorna os top-k documentos mais relevantes como resultado de suas consultas. A abordagem DTCubing vai além, retornando também os top-k segmentos de texto mais relevantes, portanto os parágrafos e resumos mais relevantes podem ser retornados. Os experimentos realizados utilizando artigos indexados pela DBLP confirmam as hipóteses do trabalho.

Palavras-chave: Cubo de Dados, OLAP, OLAP textual, Base de dados textual, Ranking, Hierarquia de Tópicos

Referências

CASIA-Iris-Interval – Image Dataset (V3). Disponível em: . Acesso em: 26 mar. 2017

da Costa, D. M. M., Passos, H., Peres, S. M., and de Moraes Lima, C. A. 2015. A comparative study of feature level fusion strategies for Multimodal Biometric Systems based on Face and Iris. In Proceedings of the annual conference on Brazilian Symposium on Information Systems: Information Systems: A Computer Socio-Technical Perspective-Volume 1 (Goiânia, May. 26-29, 2015). Brazilian Computer Society.

Daugman, J. G. 1993. High Confidence Visual Recognition of Persons by a Test of Statistical Independence. IEEE Transactions on Pattern Analysis and Machine Intelligence, 15, 11 (Nov. 1993), 1148-1161.

Daugman, J. G. 2004. How iris recognition works. IEEE Transactions on circuits and systems for video technology, 14, 1 (Jan. 2004), 21-30.

Duarte, G. D. 2003. Uso da Transformada de Hough na Detecção de Círculos em Imagens Digitais. Thema-Revista Científica do Centro Federal de Educação Tecnológica, 4, 1 (Mar. 2003), 51-58.

Galton, F. 1892. Finger prints. Macmillan and Company. London, UK.

Gil, AC. 2002. Como elaborar projetos de pesquisa. Ed. Atlas, 4. ed. São Paulo.

Herschel, W. J. 1916. The origin of finger-printing. H. Milford, Oxford University Press. London, UK.

Jain, A. K., Ross, A., and Prabhakar, S. 2004. An introduction to biometric recognition. IEEE Transactions on circuits and systems for video technology, 14, 1 (Mar,2004), 4-20.

Masek, L. Recognition of human iris patterns for biometric identification. The Univ. of Western Australia, 2003, v. 2.

Mittal, A., Moorthy, A. K., and Bovik, A. C. 2011, November). Blind/referenceless image spatial quality evaluator. In Proc. Signals, Systems and Computers, Conference (Nov. 2011), Pacific Grove, CA, 723-727.

Nist (Nacional Institute of Standards and Technology). Guidelines on Security and Privacy in Public Cloud Computing. 2011. Disponível em: http://nvlpubs.nist.gov /nistpubs/Legacy/SP/nistspecialpublication800-144.pdf

NSTC - National Science And Technology Council. 2006. Committee on Technology, Subcommittee on Biometrics. “BioHistory”, USA, (Ag. 2006).

Shimako, E. A. 2012. Avaliação subjetiva e objetiva de qualidade de vídeo digital. 2012. 41 f. Trabalho de Conclusão de Curso (Especialização) – Universidade Tecnológica Federal do Paraná, Curitiba.

Trokielewicz, M., Bartuzi, E., Michowska, K., Andrzejewska, A., and Selegrat, M. 2015. Exploring the feasibility of iris recognition for visible spectrum iris images obtained using smartphone camera. In Symposium on Photonics Applications in Astronomy, Communications, Industry, and High-Energy Physics Experiments, Wilga, Poland, (Sep. 2015), 34-39.

Wang, Z., Bovik, A. C., Sheikh, H. R., & Simoncelli, E. P. 2004. Image quality assessment: from error visibility to structural similarity. IEEE transactions on image processing, 13, 4 (Jun, 2004), 600-612.

Wildes, R. P. 1997. Iris recognition: an emerging biometric technology. In Proceedings of the IEEE, 85, 9 (Jan., 1997) 1348-1363.
Publicado
17/05/2017
SOUZA, Adriano; FORTES, Reinaldo; LIMA, Joubert. OLAP Textual com Múltiplas Hierarquias de Tópicos e Rankings Segmentados. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 13. , 2017, Lavras. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2017 . p. 480-487. DOI: https://doi.org/10.5753/sbsi.2017.6078.