Análise e Otimização de Operações de E/S em Aplicações Científicas de Aprendizado de Máquina Orientada pelo Drishti

Arthur A. da Silva; Thiago Araújo; Cristiano A. Künas; Philippe O. A. Navaux

doi:10.5753/eradrs.2026.20562

Arthur A. da Silva UFRGS
Thiago Araújo UFRGS
Cristiano A. Künas UFRGS
Philippe O. A. Navaux UFRGS

DOI: https://doi.org/10.5753/eradrs.2026.20562

Resumo

O avanço do Aprendizado de Máquina Científico (SciML) evidenciou as operações de Entrada e Saída (E/S) como gargalos na Computação de Alto Desempenho (HPC). Usando a ferramenta Drishti para guiar otimizações de dados no benchmark PDEBench, avaliamos três redes (FNO, U-Net, PINN) e revelamos que a eficácia das técnicas depende estritamente da arquitetura. Em modelos limitados por E/S (FNO), o Alinhamento reduziu o tempo em ∼4% em discos NVMe locais. Em contraste, modelos densos (U-Net) mascaram a latência, e técnicas distribuídas como MPI-IO geram overhead. Demonstra-se que essas otimizações impõem um trade-off marginal à acurácia devido à estocasticidade da formação de lotes.

Referências

Azizzadenesheli, K., Kovachki, et al. (2024). Neural operators for accelerating scientific simulations and design. Nature Reviews Physics, 6(5):320–328.

Bez, J. L., Ather, H., and Byna, S. (2022). Drishti: Guiding end-users in the i/o optimization journey. In IEEE/ACM International Parallel Data Storage Workshop (PDSW), pages 1–6, Dallas, TX, USA.

Cappello, F. et al. (2025). Multifacets of lossy compression for scientific data in the joint-laboratory of extreme scale computing. Future Gener. Comput. Syst., 163:107323.

Dantas, M. F. L. (2022). Accelerating deep learning training on high-performance computing with storage tiering. Master’s thesis, Universidade do Minho (Portugal).

Gunda, S. K. et al. (2025). Accelerating scientific discovery with machine learning and hpc-based simulations. In Integr. Mach. Learn. HPC Simul. Anal., pages 229–52. IGI.

Lewis, N., Bez, J. L., and Byna, S. (2025). I/o in machine learning applications on hpc systems: A 360-degree survey. ACM Computing Surveys, 57(10):1–41.

Sharma, P., Chung, W. T., Akoush, B., and Ihme, M. (2023). A review of physics-informed machine learning in fluid mechanics. Energies.

Takamoto, M., Praditia, and othrs (2022). Pdebench: An extensive benchmark for scientific machine learning. NeurIPS, 35:1596–1611.

Toscano, J. D., Oommen, V., et al. (2025). From pinns to pikans: Recent advances in physics-informed machine learning. Mach. Learn. Comput. Sci. Eng., 1(1):15.

Xu, C., Snyder, S., Kulkarni, O., et al. (2023). Dxt: Darshan extended tracing. In Cray User Group (CUG) Meeting, number OSTI ID: 1490709. U.S. Department of Energy.