Classificação de Tempo de Execução de Jobs de Simulação em HPC Usando LLMs e Engenharia de Prompt
Resumo
Este trabalho propõe o uso de Large Language Models (LLMs) e Engenharia de Prompt para classificar o tempo de execução de simulações de reservatórios em ambientes HPC, visando otimizar a alocação de recursos. Foram comparadas três estratégias (Ingênuo, Especialista e Few-Shot) utilizando 10.000 scripts. A abordagem Few-Shot, que incorporou estatísticas históricas, obteve o melhor desempenho com 76,83% de acurácia, superando métodos tradicionais ao interpretar a semântica dos códigos sem execução prévia. Embora promissores, os resultados em classes desbalanceadas indicam que futuras melhorias exigem estratégias de ajuste fino ou aumento de dados para aumentar a robustez da classificação em cenários complexos.
Referências
Chase, H. (2022). LangChain [Computer software]. GitHub. [link]
Liu, H., Ma, et al. (2025). ORA: Job Runtime Prediction for High-Performance Computing Platforms Using the Online Retrieval-Augmented Language Model. In Proceedings of the 39th ACM International Conference on Supercomputing, pages 884–894.
Meng, X., et al. (2025). A Review of Parallel Computing for Large-scale Reservoir Numerical Simulation. Archives of Computational Methods in Engineering, 32(7):4125–4162.
Middya, U., Manea, A., Alhubail, M., Ferguson, T., Byer, T., and Dogru, A. (2021). A massively parallel reservoir simulator on the GPU architecture. In SPE reservoir simulation conference, page D011S010R002. SPE.
Nunes, A. L., et al. (2025a). Two-Step Estimation Strategy for Predicting Petroleum Reservoir Simulation Jobs Runtime on an HPC Cluster. Concurrency and Computation: Practice and Experience, 37(4-5):e70026.
Nunes, A. L., et al. (2025b). Explorando Modelos Preditivos de Tempo de Execução de Simulações de Reservatório em Clusters HPC. In Escola Regional de Alto Desempenho da Região Sudeste (ERAD-SE), páginas 6–10. SBC.
Portella, F., et al. (2022). TunaOil: A tuning algorithm strategy for reservoir simulation workloads. Journal of Computational Science, 63:101783.
Tuczyński, T. and Stopa, J. (2023). Uncertainty quantification in reservoir simulation using modern data assimilation algorithm. Energies, 16(3):1153.
Wang, H., Dai, Y. Q., Yu, J., and Dong, Y. (2021). Predicting running time of aerodynamic jobs in HPC system by combining supervised and unsupervised learning method. Advances in Aerodynamics, 3(1):22.
Liu, H., Ma, et al. (2025). ORA: Job Runtime Prediction for High-Performance Computing Platforms Using the Online Retrieval-Augmented Language Model. In Proceedings of the 39th ACM International Conference on Supercomputing, pages 884–894.
Meng, X., et al. (2025). A Review of Parallel Computing for Large-scale Reservoir Numerical Simulation. Archives of Computational Methods in Engineering, 32(7):4125–4162.
Middya, U., Manea, A., Alhubail, M., Ferguson, T., Byer, T., and Dogru, A. (2021). A massively parallel reservoir simulator on the GPU architecture. In SPE reservoir simulation conference, page D011S010R002. SPE.
Nunes, A. L., et al. (2025a). Two-Step Estimation Strategy for Predicting Petroleum Reservoir Simulation Jobs Runtime on an HPC Cluster. Concurrency and Computation: Practice and Experience, 37(4-5):e70026.
Nunes, A. L., et al. (2025b). Explorando Modelos Preditivos de Tempo de Execução de Simulações de Reservatório em Clusters HPC. In Escola Regional de Alto Desempenho da Região Sudeste (ERAD-SE), páginas 6–10. SBC.
Portella, F., et al. (2022). TunaOil: A tuning algorithm strategy for reservoir simulation workloads. Journal of Computational Science, 63:101783.
Tuczyński, T. and Stopa, J. (2023). Uncertainty quantification in reservoir simulation using modern data assimilation algorithm. Energies, 16(3):1153.
Wang, H., Dai, Y. Q., Yu, J., and Dong, Y. (2021). Predicting running time of aerodynamic jobs in HPC system by combining supervised and unsupervised learning method. Advances in Aerodynamics, 3(1):22.
Publicado
08/07/2026
Como Citar
FRANCI, Luciana de C.; COSTA, Lucas A. F. da; NERI, Leonardo V.; SIMÕES, Jeffson Carneiro Silva; PORTELLA, Felipe A..
Classificação de Tempo de Execução de Jobs de Simulação em HPC Usando LLMs e Engenharia de Prompt. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO NORDESTE (ERAD-NE), 7. , 2026, Recife/PE.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2026
.
p. 42-46.
DOI: https://doi.org/10.5753/erad-ne.2026.25251.