Proposta de Machine Learning aplicado na otimização de Kernel para GPUs

Bruno Machado Morales; Cristiano Künas; Thiago Araujo; João Vitor Vargas Oliveira; Philippe O. A. Navaux

doi:10.5753/eradrs.2025.6809

Bruno Machado Morales UFRGS
Cristiano Künas UFRGS
Thiago Araujo UFRGS
João Vitor Vargas Oliveira UFRGS
Philippe O. A. Navaux UFRGS

DOI: https://doi.org/10.5753/eradrs.2025.6809

Resumo

A Inteligência Artificial (IA) está avançando e solucionando problemas cada vez mais desafiadores e transformando diversas áreas, como classificação de imagens, reconhecimento de fala e processamento de linguagem natural. No campo do Deep Learning (DL), as redes neurais profundas tem se destacado por sua capacidade de lidar com grandes volumes de dados e aprender representações complexas. A otimização do kernel desempenha um papel crucial, pois envolve aprimorar o desempenho das operações de baixo nível realizadas diretamente na unidade de processamento gráfico. A presente pesquisa foca na otimização do kernel como um passo fundamental para lidar com os desafios cada vez maiores impostos pelas aplicações modernas de IA.

Referências

Gadioli, D., Nobre, R., Pinto, P., Vitali, E., Ashouri, A. H., Palermo, G., Cardoso, J., and Silvano, C. (2018). Socrates—a seamless online compiler and system runtime autotuning framework for energy-aware applications. In 2018 Design, Automation & Test in Europe Conference & Exhibition (DATE), pages 1143–1146. IEEE.

Jam, M., Petit, E., Castro, P. d. O., Defour, D., Henry, G., and Jalby, W. (2025). Mlkaps: Machine learning and adaptive sampling for hpc kernel auto-tuning. arXiv preprint arXiv:2501.05811.

Tillet, P. and Cox, D. (2017). Input-aware auto-tuning of compute-bound hpc kernels. In Proceedings of the international conference for high performance computing, networking, storage and analysis, pages 1–12. Whaley, R. C. (2011). Atlas (automatically tuned linear algebra software). [link].