Otimizando o uso do Subsistema de Memória de GPUs para Aplicações Baseadas em Estênceis
Resumo
O desempenho e a eficiência energética de sistemas paralelos são uma preocupação crescente para sistemas de larga escala. Pesquisas tem sido desenvolvidas em resposta a este problema focando na obtenção de sistemas com melhor eficiência energética. Neste contexto, este trabalho tem como objetivo melhorar o desempenho e a eficiência energética de aplicações baseadas em estênceis, pela otimização do uso do subsistema de memória de placas GPUs. Os resultados mostram, que o ganho de desempenho utilizando as otimizações propostas são de até 2,85 vezes comparados à versão original. A otimização que combina a internalização do eixo Z com o reuso de registradores resulta em uma redução de até 20,24% no consumo energético e um aumento de até 50% na eficiência energética.
Referências
de la Cruz, R. and Araya-Polo, M. (2011). Towards a multi-level cache performance model for 3d stencil computation. Procedia Computer Science, 4:2146–2155.
Hamilton, B., Webb, C. J., Gray, A., and Bilbao, S. (2015). Large stencil operations for gpu-based 3-d acoustics simulations. Proc. Digital Audio Effects (DAFx),(Trondheim, Norway), pages 292–299.
Maruyama, N. and Aoki, T. (2014). Optimizing stencil computations for nvidia kepler gpus. In Proceedings of the 1st International Workshop on High-Performance Stencil Computations, Vienna, pages 89–95.
Nasciutti, T. C. and Panetta, J. (2016). Impacto da arquitetura de memória de gpgpus na velocidade da computação de estênceis. XVII Simpósio de Sistemas Computacionais, pages 64–75.