Comparação de desempenho do algoritmo de treinamento de uma rede neural em GPU
Resumo
Neste trabalho, faz-se uma avaliação de desempenho de uma implementação em CUDA C do algoritmo de treinamento de uma rede neural. Obteve-se speedup de 3x em GPU comparado com o tempo da implementação em Python em CPU através das bibliotecas Keras e Tensorflow. 1.Referências
Haykin, S. S. (2001). Redes Neurais, 2nd ed. BOOKMAN COMPANHIA ED.
Kirk, David B. e Hwu, Wen-mei W. (2017). Programming Massively Parallel Processors: A Hands-on Approach. 3 a ed. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc. ISBN : 978-0-12-811986-0.
Kirk, David B. e Hwu, Wen-mei W. (2017). Programming Massively Parallel Processors: A Hands-on Approach. 3 a ed. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc. ISBN : 978-0-12-811986-0.
Publicado
14/04/2021
Como Citar
LIMA, Marcelo; ZOLA, Wagner.
Comparação de desempenho do algoritmo de treinamento de uma rede neural em GPU . In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO SUL (ERAD-RS), 21. , 2021, Evento Online.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2021
.
p. 131-132.
ISSN 2595-4164.
DOI: https://doi.org/10.5753/eradrs.2021.14804.