Comparação de desempenho do algoritmo de treinamento de uma rede neural em GPU

  • Marcelo Lima UFPR
  • Wagner Zola UFPR

Resumo


Neste trabalho, faz-se uma avaliação de desempenho de uma implementação em CUDA C do algoritmo de treinamento de uma rede neural. Obteve-se speedup de 3x em GPU comparado com o tempo da implementação em Python em CPU através das bibliotecas Keras e Tensorflow. 1.

Referências

Haykin, S. S. (2001). Redes Neurais, 2nd ed. BOOKMAN COMPANHIA ED.

Kirk, David B. e Hwu, Wen-mei W. (2017). Programming Massively Parallel Processors: A Hands-on Approach. 3 a ed. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc. ISBN : 978-0-12-811986-0.
Publicado
14/04/2021
LIMA, Marcelo; ZOLA, Wagner. Comparação de desempenho do algoritmo de treinamento de uma rede neural em GPU . In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO SUL (ERAD-RS), 21. , 2021, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 131-132. ISSN 2595-4164. DOI: https://doi.org/10.5753/eradrs.2021.14804.