Otimização de Configurações de Threads por Bloco para Kernels GPU na Exploração Geofísica
Resumo
A busca por desempenho e eficiência energética em aplicações de exploração geofísica impulsiona a otimização dos recursos de hardware, especialmente em GPUs. Nessas arquiteturas, a configuração de execução de cada kernel é crucial, influenciando diretamente no desempenho e consumo de energia. Nesta pesquisa, propomos uma estratégia exaustiva de otimização de threads por bloco em tempo de execução com salvamento em disco, obtendo ganhos médios superiores a 20% no EDP (produto energia-tempo) em relação às execuções padrão do Fletcher.
Referências
Navaux, P. O. A., Lorenzon, A. F., and da Silva Serpa, M. (2023). Challenges in high-performance computing. Journal of the Brazilian Computer Society, 29(1):51–62.
NVIDIA, G. D. (2023). CUDA C++ Best Practices Guide.
Rigon, P. H., Schussler, B. S., Padoin, E. L., Lorenzon, A. F., Carissimi, A., and Navaux, P. O. (2023). Towards a Multi-GPU Implementation of a Seismic Application. In Latin American High Performance Computing Conference, pages 146–159. Springer.
Schussler, B. S., Rigon, P. H., Lorenzon, A. F., Carissimi, A., and Navaux, P. O. (2023). The Impact of CUDA Execution Configuration Parameters on the Performance and Energy of a Seismic Application. In Latin American High Performance Computing Conference, pages 170–183. Springer.