Análise de desempenho do cálculo matricial em sistemas paralelos utilizando AVX-512

Resumo


Em virtude dos processos de otimização em software advindos de tecnologias mais recentes, este estudo busca analisar a vantagem trazida por implementações de vetorização baseadas em hardware, neste caso, AVX2 e AVX-512, em um cenário de multiplicação matricial. Os resultados apresentam que a vetorização proporciona ganhos bastante expressivos, destacando-se o AVX-512.

Palavras-chave: Algoritmos Paralelos e Distribuídos, Aprendizado de Máquina, Ciência de Dados, Computação de Alto Desempenho

Referências

Capra, M., Bussolino, B., Marchisio, A., Masera, G., Martina, M., and Shafique, M. (2020). Hardware and software optimizations for accelerating deep neural networks: Survey of current trends, challenges, and the road ahead. IEEE Access, 8:225134-225180.

Cornea, M. (2015). Intel avx-512 instructions and their use in the implementation of math functions. Intel Corporation, pages 1-20.

Libório, André e Baldassin, A. (2021). Análise de desempenho do cálculo matricial em sistemas paralelos utilizando openmp. In Anais da XII Escola Regional de Alto Desempenho de São Paulo, pages 13-16. SBC.

M. Müller, B. Supinski, B. C. (2009). Evolving OpenMP in an Age of Extreme Parallelism. Springer.

Rathore, Y. and Kumar, D. (2014). Performance evaluation of matrix multiplication using openmp for single dual and multi-core machines. IOSR Journal of Engineering (IOSRJEN), 4:56-59.
Publicado
07/04/2022
LIBÓRIO, André; BALDASSIN, Alexandro; PAPA, João Paulo. Análise de desempenho do cálculo matricial em sistemas paralelos utilizando AVX-512. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DE SÃO PAULO (ERAD-SP), 13. , 2022, Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 17-20. DOI: https://doi.org/10.5753/eradsp.2022.222245.

Artigos mais lidos do(s) mesmo(s) autor(es)

1 2 3 > >>