Implementação de overthread em uma aplicação de método numérico HOPMOC através de um algoritmo híbrido MPI/OpenMP

Gabriel Costa; Thiago Teixeira; Frederico Cabral; Carla Osthoff

doi:10.5753/wscad_estendido.2020.14091

Gabriel Costa LNCC
Thiago Teixeira LNCC
Frederico Cabral LNCC
Carla Osthoff LNCC

DOI: https://doi.org/10.5753/wscad_estendido.2020.14091

Resumo

Este artigo apresenta um estudo de uma estratégia de overthread aplicada ao método numérico Hopmoc, que consiste em alocar um número de processos e threads superior à quantidade de núcleos físicos disponíveis. Os resultados obtidos são apresentados e analisados por diferentes métricas. Por meio da abordagem de overthread mostramos que foi possível aumentar o desempenho da aplicação em ambiente paralelo para além da capacidade máxima de cores físicos da máquina, e que esse ganho é possível devido a eliminação das barreiras de sincronização nativas do OpenMP.

Referências

Bassi, F., Colombo, A., Crivellini, A., and Franciolini, M. (2016). Hybrid openmp/mpi In 7th parallelization of a high–order discontinuous galerkin cfd/caa solver. European Congress on Computational Methods in Applied Sciences and Engineering, ECCOMAS Congress, pages 7992–8012.

Cabral, F. L., Gonzaga de Oliveira, S. L., Osthoff, C., Costa, G. P., Brandão, D. N., and Kischinhevsky, M. (2019). An evaluation of MPI and OpenMP paradigms in nite-difference explicit methods for PDEs on shared-memory multi-and manycore systems. Concurrency and Computation: Practice and Experience, page e5642.

Cabral, F. L., Osthoff, C., Costa, G. P., Brandão, D., Kischinhevsky, M., and Gonzaga de Oliveira, S. L. (2017). Tuning up the TVD-HOPMOC method on Intel MIC Xeon Phi architectures with Intel Parallel Studio tools. In 2017 International Symposium on Computer Architecture and High Performance Computing Workshops (SBAC-PADW), pages 19–24. IEEE.

Cabral, F. L., Osthoff, C., Costa, G. P., Gonzaga de Oliveira, S. L., Brandão, D., and Kischinhevsky, M. (2018a). An OpenMP implementation of the TVD–Hopmoc method based on a synchronization mechanism using locks between adjacent threads In International Conference on Computational on Xeon Phi(TM) accelerators. Science, pages 701–707. Springer.

Cabral, F. L., Osthoff, C., Souto, R. P., Costa, G. P., Gonzaga de Oliveira, S. L., Brandão, D., and Kischinhevsky, M. (2018b). Fine-tuning an OpenMP-based TVD–Hopmoc method using Intel R(cid:13) Parallel Studio XE Tools on Intel R(cid:13) Xeon R(cid:13) architectures. In Latin American High Performance Computing Conference, pages 194–209. Springer.

Costa, G., Cabral, F., and Osthoff, C. (2019). Otimização do método hopmoc 1d com auxílio das ferramentas intel parallel studio. In Anais Estendidos do XX Simpósio em Sistemas Computacionais de Alto Desempenho, pages 41–48, Porto Alegre, RS, Brasil. SBC.

Diener, M., White, S., Kale, L. V., Campbell, M., Bodony, D. J., and Freund, J. B. (2017). Improving the memory access locality of hybrid mpi applications. In Proceedings of the 24th European MPI Users' Group Meeting, page 11. ACM.

Jeffers, J., Reinders, J., and Sodani, A. (2016). Intel Xeon Phi Processor High Performance Programming – Knights Landing Edition. Morgan Kaufmann, Burlington, MA, 2 edition.