Funções MPI de Comunicação Coletiva Reconfiguráveis
Resumo
As funções MPI (Message Passing Interface) de comunicação coletiva (FMCC) são comumente implementadas em bibliotecas que utilizam algoritmos invariáveis. Nem sempre elas apresentam o melhor desempenho em todos os tipos de aplicações e ambientes de execução. Neste artigo, apresentamos, simulamos, modelamos analiticamente, verificamos e analisamos FMCC que apresentam estruturas e comportamentos que podem ser alterados para fornecer configurações, flexibilidade e desempenho otimizados. Nossos principais objetivos são: propor e apresentar um conjunto de FMCC (reconfiguráveis) otimizadas; apresentar, simular, modelar analiticamente, verificar e analisar as funções propostas. Nossas metas são: simular diferentes versões de FMCC, incluindo uma versão reconfigurável, e fornecer uma análise comparativa entre implementações fixas e reconfiguráveis. Os resultados mostram que a reconfiguração no nível de algoritmo realmente produz ganhos de flexibilidade e de desempenho em FMCCs.
Referências
MPI Forum. "The MPI Message Passing Interface Standard", Technical Report, the University of Tennessee, 1994.
M.X.T. Delgado, "Soluções Eficientes para Operações de Comunicação Coletiva em Aplicações Paralelas em Aglomerados de Computadores", tese de doutorado, Engenharia Elétrica e Eletrônica, USP, São Paulo, 1999.
L.P. Huse, "Collective Communication on Dedicated Clusters of Workstations", EuroPVMMPI, 1999, pp.469-476. 183
W.B. Tan, P. Strazdins, "The Analysis and Optimization of Collective Communications on a Beowful Cluster", ICPaDS '02, 2002, pp. 659-666.
S.S. Vadhiyar, G.E. Fagg, J. Dongarra. "Automatically Tuned Collective Communications", SC 2000, CD-ROM, ISBN 0-7803-9802-5, 2000.
R. Thakur, W. Gropp, "lmproving the Performance of Collective Operations in MPICH", Euro PVM/MPI. 2003. pp. 257-267.
K. Compton, S. Hauck, "Reconfigurable Computing: A Survey of Systems and Software", ACM Computing Survey, 34(2), 2002. pp. 171-210.
Martins, C. A. P. S., Ordonez, E. D. M., Corrêa. J. B. T., Carvalho, M. B., "Computação Reconfigurável: Conceitos. Tendências c Aplicações", XXII JAI, 2003. pp.339-388.
L. F. W. Góes, C. A. P. S. Martins, "Reconfigurable Gang Scheduling Algorithm", Workshop on Job Scheduling Strategies for Parallel Processing, LNCS, 2004.
H.C. Freitas, "Proposta e Desenvolvimento de um Processador de Rede com Chave Crossbar Reconfigurável", dissertação de mestrado, PPGEE, PUC-MG, 2003.
L. Murray, D. Carrington. P. Strooper... An approach lo specifying software frameworks", 27th Conference on Australasian Computer Science, v.26, 2004. pp. 185-192.
L.P. Huse, O.W. Saastad, "The network agnostic MPI - Scali MPI Connect", Euro PVM/MP, 2003. pp 294-301.
J.M. Squyres, A. Lumsdaine, "A Component Architecture for LAM/MPI', Euro PVM/MPI, 2003. pp. 379-387.
Roosta. S.H., Parallel Processing and Parallel Algorithms-Theory and Computation, Springer-Verlag. 1999.
Quinn, M.J., Parallel Compuing-Theory and Practice. McGraw-Hill, 2nd edition, 1994.
L. F. W. Góes, L.E.S. Ramos, C. A. P. S. Martins. "ClusterSim: A Java-Based Parallel Discrete-Event Simulation Tool for Cluster Computing", Cluster 2004.
S. Browne, C. Deane, G. Ho, P. Mucci, "PAPI: A Portable Interface to Hardware Performance Counters", Department of Defense HPCMP Users Group Conference. 1999.
M. Barnett, et ai. "Building a High-Performance Collective Communication Library". SC, 1994. pp. 107-116.