Uma Arquitetura para o Processamento de Consultas com Agregados

  • Nilton Cézar de Paula UEMS
  • José Craveiro da Costa Neto UFMS
  • Líria Matsumoto Sato USP

Resumo


O processamento paralelo e distribuído é uma alternativa para melhorar o desempenho de consultas sobre um data warehouse. Ultimamente, vem-se dando ênfase ao uso da técnica de agrupamento prévio no processamento de consultas com agregados em sistemas centralizados. A sua aplicação permite maior eficiência no processamento da consulta, com a execução do agrupamento antes da junção. Neste trabalho, propõe-se uma arquitetura de software para a execução de consultas com agregados explorando o paralelismo e o agrupamento prévio. Essa arquitetura traz novos recursos ao CDBS (Concurrent Database System) e viabiliza um ambiente para a análise de consultas com agregados. Os resultados mostram que a aplicação do agrupamento prévio num ambiente paralelo pode diminuir o tempo de execução da consulta e os acessos a disco. Porém, essa técnica deve ser evitada quando o número de grupos gerados por uma consulta é muito grande. Para tanto, deve-se identificar quando essas situações ocorrem utilizando-se algum critério, por exemplo, estimar custos.

Referências

Chaudhuri. S.: Dayal, U. An Overview of Data Warehousing and OLAP Technology. SIGMOD Record, março/1997, pp. 65-74.

Garcia-Mofina, H.; Labio, W. J.; Wiener, L. J.: Zhuge. Y. Distributed and Parallel Computing lssues in Data Warehousing, 1999.

Costa Neto, J. C. Considerações sobre a Integração de um Banco de Dados e um Data Warehouse sobre um Sistema de Arquivos Paralelos. Tese de doutorado. Escola Politécnica da Universidade de São Paulo. 2001.

Chaudhuri. S.; Shim, K. lncluding Group-By in Query Optimization. Proceedings of 20th International Conference on VLDB. Santiago de Chile. Chile, setembro/1994. pp. 54-366.

Yan. W. P.; Larson, P. Performing Group-By before Join. Proceedings of the IEEE, 1994. pp.89-100.

Wilkinson, B.; Allen, M. Parallel Programming: Techniques and Applications Using Networked Workstations and Parallel Computers. Prentice-Hall, Inc.. 1999.

Bitton, D.: Boral, H.: DeWitt, D. J.: Wilkinson, W. K. Parallel Algorithms for the Execution of Relational Database Operations, ACM Transactions on Database Systems, setembro/1983, pp. 324-353.

DeWitt, D. J.: Ghandeharizadeh, S.; Schneider, D.; Brieker, A.; Hsiao. H.; Rasmussen. R. The Gamma Database Machine Project. IEEE Trans. On KDE, março/1990, pp. 44-62.

Waqar. H.; Florescu, D.; Valduriez, P. Open Issues in Parallel Query Optimization. SIGMOD Record, setembro/1996, pp. 28-33.

Elmasri, R.: Navathe, S. R. Fundamentals of Database Systems. Addison Wesley, 3 cd.. 2000.

DeWitt, D. J.; Gray, J. Parallel Database Systems: The Future of High Performance Database Processing. CACM, junho/1992, pp. 85-98.

Yu, C. T.; Meng, W. Principies of Database Query Processing for Advanced Applications. Morgan Kaufmann Publishers, Inc., 1998.

Szwarcfiter, J. L.: Markenzon, L.. Estruturas de Dados e Seus Algoritmos. Segunda Edição. Editora LTC, 1994.

Garcia-Molina, H.; Ullman, J. D.; Widom, J. Database System Implementation. Prentice-Hall, Inc., 2000.
Publicado
10/11/2003
PAULA, Nilton Cézar de; COSTA NETO, José Craveiro da; SATO, Líria Matsumoto. Uma Arquitetura para o Processamento de Consultas com Agregados. In: SIMPÓSIO EM SISTEMAS COMPUTACIONAIS DE ALTO DESEMPENHO (SSCAD), 4. , 2003, São Paulo. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2003 . p. 101-108. DOI: https://doi.org/10.5753/wscad.2003.19109.