CATTAI, Pedro; BALDASSIN, Alexandro; DANTAS, Allberson.
Otimização de Inferência em LLMs na CPU: Análise do Cenário Atual. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DE SÃO PAULO (ERAD-SP), 16. , 2025, São José do Rio Preto/SP.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 78-81.
DOI: https://doi.org/10.5753/eradsp.2025.9731.