Using Reinforcement Learning for cost-effective sampling strategies in scalability analysis tools
Abstract
A crescente demanda por poder computacional em áreas como simulações científicas e inteligência artificial torna a análise de escalabilidade essencial em ambientes de Computação de Alto Desempenho (HPC). Este trabalho propõe uma estratégia baseada em Aprendizado por Reforço para reduzir o tempo dessa análise, mantendo sua acurácia. A abordagem será aplicada à ferramenta PaScal Suite, com um agente treinado para selecionar amostras mais econômicas.
References
da Silva, A. B., Cunha, D. A., Silva, V. R., de A. Furtunato, A. F., and Xavier-de Souza, S. (2017). Pascal viewer: A tool for the visualization of parallel scalability trends. In International Workshop on Extreme-Scale Programming Tools, pages 250–264. Springer.
Geimer, M., Wolf, F., Wylie, B. J., Ábrahám, E., Becker, D., and Mohr, B. (2010). The scalasca performance toolset architecture. Concurrency and computation: Practice and experience, 22(6):702–719.
Pacheco, P. (2011). An introduction to parallel programming. Elsevier.
Ritter, M., Calotoiu, A., Rinke, S., Reimann, T., Hoefler, T., and Wolf, F. (2020). Learning cost-effective sampling strategies for empirical performance modeling. In 2020 IEEE International Parallel and Distributed Processing Symposium (IPDPS), pages 884–895.
Geimer, M., Wolf, F., Wylie, B. J., Ábrahám, E., Becker, D., and Mohr, B. (2010). The scalasca performance toolset architecture. Concurrency and computation: Practice and experience, 22(6):702–719.
Pacheco, P. (2011). An introduction to parallel programming. Elsevier.
Ritter, M., Calotoiu, A., Rinke, S., Reimann, T., Hoefler, T., and Wolf, F. (2020). Learning cost-effective sampling strategies for empirical performance modeling. In 2020 IEEE International Parallel and Distributed Processing Symposium (IPDPS), pages 884–895.
Published
2025-07-02
How to Cite
RICI, Pedro; XAVIER-DE-SOUSA, Samuel.
Using Reinforcement Learning for cost-effective sampling strategies in scalability analysis tools. In: REGIONAL SCHOOL ON HIGH PERFORMANCE COMPUTING OF THE NORTHEAST REGION (ERAD-NE), 6. , 2025, Natal/RN.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 41-42.
DOI: https://doi.org/10.5753/erad-ne.2025.11750.