CATTAI, Pedro; BALDASSIN, Alexandro; DANTAS, Allberson. Otimização de Inferência em LLMs na CPU: Análise do Cenário Atual. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DE SÃO PAULO (ERAD-SP), 16. , 2025, São José do Rio Preto/SP. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 78-81. DOI: https://doi.org/10.5753/eradsp.2025.9731.