Implementação CUDA dos Kernels NPB

  • Gabriell Alves de Araújo PUCRS
  • Dalvan Griebler PUCRS/SETREM
  • Luiz Gustavo Leão Fernandes GMAP - PPGCC - PUCRS

Resumo


NAS Parallel Benchmarks (NPB) é um conjunto de benchmarks utilizado para avaliar hardware e software, que ao longo dos anos foi portado para diferentes frameworks. Concernente a GPUs, atualmente existem apenas versões OpenCL e OpenACC. Este trabalho contribui com a literatura provendo a primeira implementação CUDA completa dos kernels do NPB, realizando experimentos com carga de trabalho inédita e revelando novos fatos sobre o NPB.

Palavras-chave: Algoritmos Paralelos e Distribuídos, Arquiteturas Dedicadas e Específicas (GPUs, FPGAs, e outras), Avaliação, Medição e Predição de Desempenho, Linguagens, Compiladores e Ferramentas de Computação Paralela e Distribuída, Técnicas e Métodos de Extração de Paralelismo

Referências

Bailey, D. H., Barszcz, E., Barton, J. T., Browning, D. S., Carter, R. L., Fatoohi, R. A., Frederickson, P. O., Lasinski, T. A., Simon, H. D., Venkatakrishnan, V., and Weeratunga, S. K. (1994). The NAS Parallel Benchmarks RNR-94-007. Technical report, NASA Advanced Supercomputing Division.

Griebler, D., Loff, J., Mencagli, G., Danelutto, M., and Fernandes, L. G. (2018). Efficient NAS Benchmark Kernels with C++ Parallel Programming. In 26th Euromicro International Conference on Parallel, Distributed and Network-Based Processing (PDP), PDP’18, pages 733–740, Cambridge, UK. IEEE.

Seo, S., Jo, G., and Lee, J. (2011). Performance Characterization of the NAS Parallel Benchmarks in OpenCL. In 2011 IEEE International Symposium on Workload Characterization (IISWC), pages 137–148.

Tian, X., Xu, R., Yan, Y., Chandrasekaran, S., Eachempati, D., and Chapman, B. (2016). Compiler Transformation of Nested Loops for General Purpose GPUs. Concurrency and Computation: Practice and Experience, 28(2):537–556.

Xu, R., Tian, X., Chandrasekaran, S., Yan, Y., and Chapman, B. (2015). NAS Parallel Benchmarks for GPGPUs Using a Directive-Based Programming Model. In Brodman,

J. and Tu, P., editors, Languages and Compilers for Parallel Computing, pages 67–81, Cham. Springer International Publishing.
Publicado
15/04/2020
DE ARAÚJO, Gabriell Alves; GRIEBLER, Dalvan; FERNANDES, Luiz Gustavo Leão. Implementação CUDA dos Kernels NPB. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO SUL (ERAD-RS), 20. , 2020, Santa Maria. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2020 . p. 85-88. ISSN 2595-4164. DOI: https://doi.org/10.5753/eradrs.2020.10762.