Análise e Otimização de Operações de E/S em Aplicações Científicas de Aprendizado de Máquina Orientada pelo Drishti
Resumo
O avanço do Aprendizado de Máquina Científico (SciML) evidenciou as operações de Entrada e Saída (E/S) como gargalos na Computação de Alto Desempenho (HPC). Usando a ferramenta Drishti para guiar otimizações de dados no benchmark PDEBench, avaliamos três redes (FNO, U-Net, PINN) e revelamos que a eficácia das técnicas depende estritamente da arquitetura. Em modelos limitados por E/S (FNO), o Alinhamento reduziu o tempo em ∼4% em discos NVMe locais. Em contraste, modelos densos (U-Net) mascaram a latência, e técnicas distribuídas como MPI-IO geram overhead. Demonstra-se que essas otimizações impõem um trade-off marginal à acurácia devido à estocasticidade da formação de lotes.
Referências
Bez, J. L., Ather, H., and Byna, S. (2022). Drishti: Guiding end-users in the i/o optimization journey. In IEEE/ACM International Parallel Data Storage Workshop (PDSW), pages 1–6, Dallas, TX, USA.
Cappello, F. et al. (2025). Multifacets of lossy compression for scientific data in the joint-laboratory of extreme scale computing. Future Gener. Comput. Syst., 163:107323.
Dantas, M. F. L. (2022). Accelerating deep learning training on high-performance computing with storage tiering. Master’s thesis, Universidade do Minho (Portugal).
Gunda, S. K. et al. (2025). Accelerating scientific discovery with machine learning and hpc-based simulations. In Integr. Mach. Learn. HPC Simul. Anal., pages 229–52. IGI.
Lewis, N., Bez, J. L., and Byna, S. (2025). I/o in machine learning applications on hpc systems: A 360-degree survey. ACM Computing Surveys, 57(10):1–41.
Sharma, P., Chung, W. T., Akoush, B., and Ihme, M. (2023). A review of physics-informed machine learning in fluid mechanics. Energies.
Takamoto, M., Praditia, and othrs (2022). Pdebench: An extensive benchmark for scientific machine learning. NeurIPS, 35:1596–1611.
Toscano, J. D., Oommen, V., et al. (2025). From pinns to pikans: Recent advances in physics-informed machine learning. Mach. Learn. Comput. Sci. Eng., 1(1):15.
Xu, C., Snyder, S., Kulkarni, O., et al. (2023). Dxt: Darshan extended tracing. In Cray User Group (CUG) Meeting, number OSTI ID: 1490709. U.S. Department of Energy.
