Otimizando o uso do Subsistema de Memória de GPUs para Aplicações Baseadas em Estênceis

Ricardo K. Lorenzoni; Matheus S. Serpa; Edson L. Padoin; Jairo Panetta; Philippe O. A. Navaux; Jean-François Méhaut

doi:10.5753/wperformance.2017.3352

Ricardo K. Lorenzoni UNIJUI
Matheus S. Serpa UFRGS
Edson L. Padoin UNIJUI / UFRGS
Jairo Panetta ITA
Philippe O. A. Navaux UFRGS
Jean-François Méhaut Universite Grenoble Alpes

DOI: https://doi.org/10.5753/wperformance.2017.3352

Resumo

O desempenho e a eficiência energética de sistemas paralelos são uma preocupação crescente para sistemas de larga escala. Pesquisas tem sido desenvolvidas em resposta a este problema focando na obtenção de sistemas com melhor eficiência energética. Neste contexto, este trabalho tem como objetivo melhorar o desempenho e a eficiência energética de aplicações baseadas em estênceis, pela otimização do uso do subsistema de memória de placas GPUs. Os resultados mostram, que o ganho de desempenho utilizando as otimizações propostas são de até 2,85 vezes comparados à versão original. A otimização que combina a internalização do eixo Z com o reuso de registradores resulta em uma redução de até 20,24% no consumo energético e um aumento de até 50% na eficiência energética.

Referências

Bergman, K., Borkar, S., Campbell, D., Carlson, W., Dally, W., Denneau, M., Franzon, P., Harrod, W., Hill, K., Hiller, J., et al. (2008). Exascale computing study: Technology challenges in achieving exascale systems. Defense Advanced Research Projects Agency Information Processing Techniques Office (DARPA IPTO), Tech. Rep, 15:1–297.

de la Cruz, R. and Araya-Polo, M. (2011). Towards a multi-level cache performance model for 3d stencil computation. Procedia Computer Science, 4:2146–2155.

Hamilton, B., Webb, C. J., Gray, A., and Bilbao, S. (2015). Large stencil operations for gpu-based 3-d acoustics simulations. Proc. Digital Audio Effects (DAFx),(Trondheim, Norway), pages 292–299.

Maruyama, N. and Aoki, T. (2014). Optimizing stencil computations for nvidia kepler gpus. In Proceedings of the 1st International Workshop on High-Performance Stencil Computations, Vienna, pages 89–95.

Nasciutti, T. C. and Panetta, J. (2016). Impacto da arquitetura de memória de gpgpus na velocidade da computação de estênceis. XVII Simpósio de Sistemas Computacionais, pages 64–75.