Um Sistema Integrado para Otimização Automática de Paralelismo e de Localidade de Dados

Edson T. Midorikawa; Nelson T. Minoura; Pedro V. Artigas; João Antônio Zuffo

doi:10.5753/sbac-pad.1995.19885

Edson T. Midorikawa USP
Nelson T. Minoura USP
Pedro V. Artigas USP
João Antônio Zuffo USP

DOI: https://doi.org/10.5753/sbac-pad.1995.19885

Resumo

A obtenção de alto desempenho nos modernos computadores paralelos é um problema sério. Para se explorar eficientemente os recursos computacionais disponíveis nesta classe de computadores, o programador deve se preocupar com dois aspectos muito importantes: o paralelismo e a localidade de dados. Este trabalho apresenta um sistema para otimização automática de paralelismo e localidade de dados. Resultados preliminares mostram a funcionalidade do sistema na identificação das transformações de programa que melhoram o desempenho de programas em máquinas multiprocessadoras com memória compartilhada.

Referências

BACON, D. F. et alii. Compiler transformations for high-performance computing. Technical Report Nº UCB/CSD-93-781. Computer Science Division, University of California at Berkeley. 1993. I

BANERJEE. U. Dependente analysis for supercomputing. Kluwer Academie Publishers, 1988.

BANERJEE, U. Loop parallelization. Kluwer Academie Publishers, 1994.

CARR, S.; McKINLEY, K. S.; TSENG, C.-W. Compiler optimizations for improving data locality. In: lnt. Conf. on Architectural Support for Programming Languages and Operating Systems, 6, San Jose, CA. Proceedings. p.??-??. October, 1994.

EISENBEIS, C. et alii. A strateqy for array management in local memory. Rapports de Recherche Nº 1262. lnstitut National de Recherche en Informatique et en Automatique (INRIA), France. Juillet 1990.

KELLY, W. & PUGH, W. A unifying framework for iteration reordering transformations. Technical Report CS-TR3430. Department of Computer Science, University of Maryland. February, 1995.

KENNEDY, K. & McKINLEY, K. S. Maximizing loop parallelism and improving data locality via loop fusion and distribution. In: Workshop on Languages and Compilers for Parallel Processing, 6, Portland, OR. Proceedings. p.301-20. August 1993.

KULKARNI, D. et alii. A ceneralized theory of linear loop transformations. Technical Report CSRI-317. Computer Systems Research lnstitute, Department of Computer Science, Department of Electrical and Computer Engineering, University of Toronto, Canada. December 1994.

LI, W. Compiling for NUMA parallel machines. PhD Thesis. Cornelll University, 1993.

MANJIKIAN, N. & ABDELRAHMAN, T. Fusion of loops for parallelism and locality. Technical Rcport CSRI-315. Computer Systems Research lnstitute, Department of Computer Science, Department of Electrical and Computer Engineering, University of Toronto, Cartada. February 1995.

McKINLEY, K. S. Automatic and interactive parallelization. PhD. Thesis. Department of Computer Science, Rice University. April 1992.

MIDORIKAWA, E. T. Análise da otimização de acessos à memória. In: Simpósio Brasileiro de Arquitetura de Computadores - Processamento de Alto Desempenho, 6, Caxambu, MG. Anais. p. 37-52. Agosto de 1994.

MIDORIKAWA, E. T. & SATO, L. M. Integrando as otimizações de acessos a dados e de paralelismo. Submetido ao VII Simpósio Brasileiro de Arquitetura de Computadores -Processamento de Alto Desempenho (SBAC-PAD'95), 1995.

TAKAHASIU, S.; MIDORIKAWA, E. T.; ZUFFO, J. A. Análise do padrão de acessos e otimização de localidade em sistemas de computação de alto desempenho. Submetido ao XII Concurso de Trabalhos de Iniciação Científica (CTIC'95). 1995.

WINDHEISER, D. Optimisation de la localiti de doneés et du parallélism à grain fin. These de Docteur. Université de Rennes I, France. 1992.

WOLF, E. Improving locality and parallelism in nested loops. PhD. Thesis. Department of Computer Science, Stanford University. August 1992.