Proposal for Applying Machine Learning in Kernel Optimization for GPUs
Abstract
A Inteligência Artificial (IA) está avançando e solucionando problemas cada vez mais desafiadores e transformando diversas áreas, como classificação de imagens, reconhecimento de fala e processamento de linguagem natural. No campo do Deep Learning (DL), as redes neurais profundas tem se destacado por sua capacidade de lidar com grandes volumes de dados e aprender representações complexas. A otimização do kernel desempenha um papel crucial, pois envolve aprimorar o desempenho das operações de baixo nível realizadas diretamente na unidade de processamento gráfico. A presente pesquisa foca na otimização do kernel como um passo fundamental para lidar com os desafios cada vez maiores impostos pelas aplicações modernas de IA.
References
Jam, M., Petit, E., Castro, P. d. O., Defour, D., Henry, G., and Jalby, W. (2025). Mlkaps: Machine learning and adaptive sampling for hpc kernel auto-tuning. arXiv preprint arXiv:2501.05811.
Tillet, P. and Cox, D. (2017). Input-aware auto-tuning of compute-bound hpc kernels. In Proceedings of the international conference for high performance computing, networking, storage and analysis, pages 1–12. Whaley, R. C. (2011). Atlas (automatically tuned linear algebra software). [link].
