Proposal for Applying Machine Learning in Kernel Optimization for GPUs

  • Bruno Machado Morales UFRGS
  • Cristiano Künas UFRGS
  • Thiago Araujo UFRGS
  • João Vitor Vargas Oliveira UFRGS
  • Philippe O. A. Navaux UFRGS

Abstract


A Inteligência Artificial (IA) está avançando e solucionando problemas cada vez mais desafiadores e transformando diversas áreas, como classificação de imagens, reconhecimento de fala e processamento de linguagem natural. No campo do Deep Learning (DL), as redes neurais profundas tem se destacado por sua capacidade de lidar com grandes volumes de dados e aprender representações complexas. A otimização do kernel desempenha um papel crucial, pois envolve aprimorar o desempenho das operações de baixo nível realizadas diretamente na unidade de processamento gráfico. A presente pesquisa foca na otimização do kernel como um passo fundamental para lidar com os desafios cada vez maiores impostos pelas aplicações modernas de IA.

References

Gadioli, D., Nobre, R., Pinto, P., Vitali, E., Ashouri, A. H., Palermo, G., Cardoso, J., and Silvano, C. (2018). Socrates—a seamless online compiler and system runtime autotuning framework for energy-aware applications. In 2018 Design, Automation & Test in Europe Conference & Exhibition (DATE), pages 1143–1146. IEEE.

Jam, M., Petit, E., Castro, P. d. O., Defour, D., Henry, G., and Jalby, W. (2025). Mlkaps: Machine learning and adaptive sampling for hpc kernel auto-tuning. arXiv preprint arXiv:2501.05811.

Tillet, P. and Cox, D. (2017). Input-aware auto-tuning of compute-bound hpc kernels. In Proceedings of the international conference for high performance computing, networking, storage and analysis, pages 1–12. Whaley, R. C. (2011). Atlas (automatically tuned linear algebra software). [link].
Published
2025-04-23
MORALES, Bruno Machado; KÜNAS, Cristiano; ARAUJO, Thiago; OLIVEIRA, João Vitor Vargas; NAVAUX, Philippe O. A.. Proposal for Applying Machine Learning in Kernel Optimization for GPUs. In: REGIONAL SCHOOL OF HIGH PERFORMANCE COMPUTING FROM SOUTHERN BRAZIL (ERAD-RS), 25. , 2025, Foz do Iguaçu/PR. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 153-154. ISSN 2595-4164. DOI: https://doi.org/10.5753/eradrs.2025.6809.