Encontrando a Configuração de Threads por Bloco para os Kernels NPB-CUDA com Q-Learning
Resumo
Este trabalho apresenta um novo método que utiliza aprendizado de máquina para prever a melhor configuração de threads por bloco para aplicações de GPUs. Os resultados foram similares a estratégias manuais.Referências
Araujo, G., Griebler, D., Rockenbach, D. A., Danelutto, M., and Fernandes, L. G. (2021). NAS Parallel Benchmarks with CUDA and beyond. Software: Practice and Experience.
Sutton, R. S. and Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press.
Sutton, R. S. and Barto, A. G. (2018). Reinforcement learning: An introduction. MIT press.
Publicado
18/04/2022
Como Citar
SCHEER, Claudio; ARAUJO, Gabriell; GRIEBLER, Dalvan; MENEGUZZI, Felipe; FERNANDES, Luiz G..
Encontrando a Configuração de Threads por Bloco para os Kernels NPB-CUDA com Q-Learning. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO SUL (ERAD-RS), 22. , 2022, Curitiba.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2022
.
p. 119-120.
ISSN 2595-4164.
DOI: https://doi.org/10.5753/eradrs.2022.19191.