Cattai, P., Baldassin, A., & Dantas, A. (2025). Otimização de Inferência em LLMs na CPU: Análise do Cenário Atual. In Anais da XVI Escola Regional de Alto Desempenho de São Paulo, (pp. 78-81). Porto Alegre: SBC. doi:10.5753/eradsp.2025.9731