Cattai, Pedro, Baldassin, Alexandro, E Dantas, Allberson. " Otimização de Inferência em LLMs na CPU: Análise do Cenário Atual" Anais da Escola Regional de Alto Desempenho de São Paulo (ERAD-SP) [Online], (28 maio 2025)