Cattai, P., Baldassin, A., & Dantas, A. 2025 mai 28. Otimização de Inferência em LLMs na CPU: Análise do Cenário Atual. Anais da Escola Regional de Alto Desempenho de São Paulo (ERAD-SP). [Online] :