Ajuste Dinâmico de Threads para Execução Eficiente de Aplicações Iterativas OpenMP

  • Marcio N Silva Universidade do Estado do Rio de Janeiro
  • Aline P Nascimento Universidade Federal Fluminense
  • Alexandre C Sena Universidade do Estado do Rio de Janeiro

Resumo


Duas abordagens distintas podem ser adotadas para aumentar o desempenho das aplicações paralelas em uma arquitetura de alto desempenho: (i) ferramentas de auto-tuning; (ii) tornar ou criar aplicações que consigam se adaptar ao ambiente disponı́vel. Enquanto a primeira solução requer que o programador adapte sua aplicação a ferramenta e execute um profiling do ambiente, a segunda estratégia é mais complexa, pois necessita que o cientista seja capaz de criar aplicações com algum grau de autonomia. Assim, este trabalho propõe e avalia uma estrategia para ajustar dinamicamente a quantidade de theads de aplicações iterativas OpenMP. Os resultados obtidos mostram a viabilidade da estratégia proposta, que foi capaz de executar a aplicação para o problema de leilão eficientemente.

Referências

Ansel, J., Kamil, S., Veeramachaneni, K., Ragan-Kelley, J., Bosboom, J., O’Reilly, U. M., and Amarasinghe, S. (2014). Opentuner: An extensible framework for program autotuning. In 2014 Inter. Conf. on Par. Arch. and Compilation Techniques, pages 303–315.

Bertsekas, D. P. (1979). A distributed algorithm for the assignment problem. Technical report, Lab. for Information and Decision Systems, M.I.T., Cambridge, MA.

El Maghraoui, K., Desell, T. J., Szymanski, B. K., and Varela, C. A. (2009). Malleable iterative mpi applications. Concurr. Comput. : Pract. Exper., 21(3):393–413.

Feitelson, D. G. and Rudolph, L. (1996). Toward convergence in job schedulers for parallel supercomputers. In Feitelson, D. G. and Rudolph, L., editors, Job Scheduling Strategies for Parallel Processing, pages 1–26. Springer Berlin Heidelberg.

Hartono, A., Norris, B., and Sadayappan, P. (2009). Annotation-based empirical performance tuning using orio. In 2009 IEEE International Symposium on Parallel Distributed Processing, pages 1–11.

Lorenzon, A. F., de Oliveira, C. C., Souza, J. D., and Beck, A. C. S. (2019). Aurora: Seamless optimization of openmp applications. IEEE Transactions on Parallel and Distributed Systems, 30(5):1007–1021.

Nascimento, A. P., Vasconcelos, C. N., Jamel, F. S., and Sena, A. C. (2016). A hybrid parallel algorithm for the auction algorithm in multicore systems. In Inter. Symp. on Computer Architecture and High Perf. Comp. Workshops (SBAC-PADW), pages 73–78.

Rasch, A., Haidl, M., and Gorlatch, S. (2017). ATF: A generic auto-tuning framework. In 2017 IEEE 19th International Conference on High Performance Computing and Communications, pages 64–71.

Russell, S. J. S. J. and Norvig, P. (2009). Artificial intelligence : a modern approach. Prentice Hall Press, 3 edition.

Sena, A., Ribeiro, F., Rebello, V., Nascimento, A., and Boeres, C. (2013). Autonomic malleability in iterative mpi applications. In 2013 25th International Symposium on Computer Architecture and High Performance Computing, pages 192–199.

Sena, A. C., Nascimento, A., Vasconcelos, C., and Marzulo, L. A. J. (2017). Execução eficiente do algoritmo de leilão nas novas arquiteturas multicore. Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD), 18(1/2017).

Sudarsan, R. and Ribbens, C. J. (2010). Design and performance of a scheduling framework for resizable parallel applications. Parallel Comp., 36(1):48 – 64.
Publicado
12/11/2019
SILVA, Marcio N; NASCIMENTO, Aline P; SENA, Alexandre C. Ajuste Dinâmico de Threads para Execução Eficiente de Aplicações Iterativas OpenMP. In: WORKSHOP DE COMPUTAÇÃO HETEROGÊNEA - SIMPÓSIO EM SISTEMAS COMPUTACIONAIS DE ALTO DESEMPENHO (SSCAD), 20. , 2019, Campo Grande. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 84-95. DOI: https://doi.org/10.5753/wscad_estendido.2019.8702.