Encontrando a Configuração de Threads por Bloco para os Kernels NPB-CUDA com Q-Learning

  • Claudio Scheer PUCRS
  • Gabriell Araujo PUCRS
  • Dalvan Griebler PUCRS
  • Felipe Meneguzzi PUCRS
  • Luiz G. Fernandes PUCRS

Resumo


Este trabalho apresenta um novo método que utiliza aprendizado de máquina para prever a melhor configuração de threads por bloco para aplicações de GPUs. Os resultados foram similares a estratégias manuais.

Referências

Araujo, G., Griebler, D., Rockenbach, D. A., Danelutto, M., and Fernandes, L. G. (2021). NAS Parallel Benchmarks with CUDA and beyond. Software: Practice and Experience.

Sutton, R. S. and Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press.
Publicado
18/04/2022
SCHEER, Claudio; ARAUJO, Gabriell; GRIEBLER, Dalvan; MENEGUZZI, Felipe; FERNANDES, Luiz G.. Encontrando a Configuração de Threads por Bloco para os Kernels NPB-CUDA com Q-Learning. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO SUL (ERAD-RS), 22. , 2022, Curitiba. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 119-120. ISSN 2595-4164. DOI: https://doi.org/10.5753/eradrs.2022.19191.