Arquitetura e Avaliação do Cluster de Alto Desempenho Netuno
Resumo
Este artigo apresenta a arquitetura e os resultados da avaliação de desempenho do supercomputador Netuno, um cluster de alto desempenho recentemente instalado na UFRJ. São apresentados detalhes tanto de sua arquitetura como dos softwares básicos e de middleware utilizados na sua construção. Os resultados de avaliação obtidos registram um desempenho de 16,2 Tflops sustentados para o benchmark HPL (High Performance Linpack), o que colocou o supercomputador Netuno na 138ª posição na lista Top500 de junho de 2008. Atualmente, o supercomputador Netuno atende diversas instituições de ensino e pesquisa no Brasil, participantes das redes temáticas de pesquisa de Geofísica Aplicada e de Oceanografia (REMO), patrocinadas pala Petrobras.
Referências
Batcher, K. E, "Design ofa Massively Parallel Processor” TEBE Transactions om Computers, Vol. C29, September 1980, B36-840.
Openfabris. http://www.openfabrics.org/.
Gabriel, E, e ali “Open MPE: goals, concept, and design of a next gencration MPL implementation”, in Proceedings, 11th European PYM/MPI Users" Group Meeting, 2004.
W. Huang, G. Santhanaramam , HL-W. Jin, Q. Go and D. K. Panta, “Design of High Performance MVAPICHZ: MPI2 over InfiniBand”, In Proceedings of the Sixth IEEE International Symposium om Cluster Computing and the Grid, p.43-48, May 16-19, 2006.
Intel MPI. http://software.intel.com/en-us/intel-mpi-library/.
Scali MPI. http://www.platform.com/Products/platform-mpi.
Moab Cluster Suite - Cluster Resources, http://www.clusterresources.com/products/moab-cluster-suite.php.
TORQUE OpenSource - Resource Manager. http://www.clusterresources.com/products/torque-resource-manager.php.
Petitet, A; Whaley, R.C,; Dongarra, J.; Cleary, "HPL - A Portable Implementation of the High-Perfommance Linpack Benchmak for Distributed-Memory Computers” , Version 2.0, September 10, 2008, http://www.netlib.org/benchmark/hpl/.
Pillons, X, “Ruming HPL on Windows HPC Server 2008”. http://windowshpc.net/Pages/Default.aspx.
Wenli, Z.; Jianping, F.; Mingyu, C. “Eficient Determination of Block Size NB for Parallel Linpack Test". Proceedings of the IASTED International Conference on Parallel and Distributed Computing and Systems (PDCS 2004).
Shipman, G.M.; Woodall, T.S; Graham, R.L.; Maccabe, A.B.; Bridges, P.G. “Infiniband Scalability in OpenMPI” Parallel and Distributed Processing Symposium, (IPDPS 2006).