Explorando Modelos Preditivos de Tempo de Execução de Simulações de Reservatório em Clusters HPC
Resumo
Este trabalho avalia modelos de aprendizado de máquina para a predição do tempo de execução de jobs de simulação de reservatórios petrolíferos em clusters HPC. Utilizando logs reais da Petrobras, testamos os algoritmos XGBoost e J48 com diferentes esquemas de discretização do atributo alvo. Nossos resultados demonstram que discretizações com classes mais amplas oferecem maior robustez e erro percentual significativamente menor e estável ao longo do tempo, enquanto classes granulares geram maior acurácia e erros percentuais mais elevados.Referências
Chen, T. and Guestrin, C. (2016). XGBoost: A Scalable Tree Boosting System. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pages 785–794.
Coats, K. H. (1982). Reservoir Simulation: State of the Art. Journal of Petroleum Technology, 34(8):1633–1642.
Kuchnik, M. et al. (2019). This is why ML-driven cluster scheduling remains widely impractical. Technical report, Carnegie Mellon University.
Lima, M. et al. (2024). Modelos de Predição do Tempo de Jobs Aplicados a um Ambiente de Produção de Alto Desempenho. In Anais do XXV Simpósio em Sistemas Computacionais de Alto Desempenho, pages 25–36, Porto Alegre, RS, Brasil. SBC.
Mohri, M., Rostamizadeh, A., and Talwalkar, A. (2018). Foundations of Machine Learning. MIT Press.
Nunes, A. L. et al. (2023). Prediction of Reservoir Simulation Jobs Times Using a Real-World SLURM Log. In Anais do XXIV Simpósio em Sistemas Computacionais de Alto Desempenho, pages 49–60. SBC.
Nunes, A. L. et al. (2024). A Framework for Executing Long Simulation Jobs Cheaply in the Cloud. In 2024 IEEE International Conference on Cloud Engineering (IC2E), pages 233–244. IEEE.
Nunes, A. L. et al. (2025). Two-Step Estimation Strategy for Predicting Petroleum Reservoir Simulation Jobs Runtime on an HPC Cluster. Concurrency and Computation: Practice and Experience, 37(4-5):e70026.
Portella, F., Buchaca, D., Rodrigues, J. R., and Berral, J. L. (2022). TunaOil: A tuning algorithm strategy for reservoir simulation workloads. Journal of Comput. Science, 63.
Quinlan, J. R. (2014). C4.5: Programs for Machine Learning. Elsevier.
Coats, K. H. (1982). Reservoir Simulation: State of the Art. Journal of Petroleum Technology, 34(8):1633–1642.
Kuchnik, M. et al. (2019). This is why ML-driven cluster scheduling remains widely impractical. Technical report, Carnegie Mellon University.
Lima, M. et al. (2024). Modelos de Predição do Tempo de Jobs Aplicados a um Ambiente de Produção de Alto Desempenho. In Anais do XXV Simpósio em Sistemas Computacionais de Alto Desempenho, pages 25–36, Porto Alegre, RS, Brasil. SBC.
Mohri, M., Rostamizadeh, A., and Talwalkar, A. (2018). Foundations of Machine Learning. MIT Press.
Nunes, A. L. et al. (2023). Prediction of Reservoir Simulation Jobs Times Using a Real-World SLURM Log. In Anais do XXIV Simpósio em Sistemas Computacionais de Alto Desempenho, pages 49–60. SBC.
Nunes, A. L. et al. (2024). A Framework for Executing Long Simulation Jobs Cheaply in the Cloud. In 2024 IEEE International Conference on Cloud Engineering (IC2E), pages 233–244. IEEE.
Nunes, A. L. et al. (2025). Two-Step Estimation Strategy for Predicting Petroleum Reservoir Simulation Jobs Runtime on an HPC Cluster. Concurrency and Computation: Practice and Experience, 37(4-5):e70026.
Portella, F., Buchaca, D., Rodrigues, J. R., and Berral, J. L. (2022). TunaOil: A tuning algorithm strategy for reservoir simulation workloads. Journal of Comput. Science, 63.
Quinlan, J. R. (2014). C4.5: Programs for Machine Learning. Elsevier.
Publicado
05/11/2025
Como Citar
NUNES, Alan L. et al.
Explorando Modelos Preditivos de Tempo de Execução de Simulações de Reservatório em Clusters HPC. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO SUDESTE (ERAD-SE), 10. , 2025, Niterói/RJ.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 6-10.
DOI: https://doi.org/10.5753/eradse.2025.16931.
