Ajuste Dinâmico de Threads para Execução Eficiente de Aplicações Iterativas OpenMP

Marcio N Silva; Aline P Nascimento; Alexandre C Sena

doi:10.5753/wscad_estendido.2019.8702

Marcio N Silva Universidade do Estado do Rio de Janeiro
Aline P Nascimento Universidade Federal Fluminense
Alexandre C Sena Universidade do Estado do Rio de Janeiro

DOI: https://doi.org/10.5753/wscad_estendido.2019.8702

Resumo

Duas abordagens distintas podem ser adotadas para aumentar o desempenho das aplicações paralelas em uma arquitetura de alto desempenho: (i) ferramentas de auto-tuning; (ii) tornar ou criar aplicações que consigam se adaptar ao ambiente disponı́vel. Enquanto a primeira solução requer que o programador adapte sua aplicação a ferramenta e execute um profiling do ambiente, a segunda estratégia é mais complexa, pois necessita que o cientista seja capaz de criar aplicações com algum grau de autonomia. Assim, este trabalho propõe e avalia uma estrategia para ajustar dinamicamente a quantidade de theads de aplicações iterativas OpenMP. Os resultados obtidos mostram a viabilidade da estratégia proposta, que foi capaz de executar a aplicação para o problema de leilão eficientemente.

Referências

Ansel, J., Kamil, S., Veeramachaneni, K., Ragan-Kelley, J., Bosboom, J., O’Reilly, U. M., and Amarasinghe, S. (2014). Opentuner: An extensible framework for program autotuning. In 2014 Inter. Conf. on Par. Arch. and Compilation Techniques, pages 303–315.

Bertsekas, D. P. (1979). A distributed algorithm for the assignment problem. Technical report, Lab. for Information and Decision Systems, M.I.T., Cambridge, MA.

El Maghraoui, K., Desell, T. J., Szymanski, B. K., and Varela, C. A. (2009). Malleable iterative mpi applications. Concurr. Comput. : Pract. Exper., 21(3):393–413.

Feitelson, D. G. and Rudolph, L. (1996). Toward convergence in job schedulers for parallel supercomputers. In Feitelson, D. G. and Rudolph, L., editors, Job Scheduling Strategies for Parallel Processing, pages 1–26. Springer Berlin Heidelberg.

Hartono, A., Norris, B., and Sadayappan, P. (2009). Annotation-based empirical performance tuning using orio. In 2009 IEEE International Symposium on Parallel Distributed Processing, pages 1–11.

Lorenzon, A. F., de Oliveira, C. C., Souza, J. D., and Beck, A. C. S. (2019). Aurora: Seamless optimization of openmp applications. IEEE Transactions on Parallel and Distributed Systems, 30(5):1007–1021.

Nascimento, A. P., Vasconcelos, C. N., Jamel, F. S., and Sena, A. C. (2016). A hybrid parallel algorithm for the auction algorithm in multicore systems. In Inter. Symp. on Computer Architecture and High Perf. Comp. Workshops (SBAC-PADW), pages 73–78.

Rasch, A., Haidl, M., and Gorlatch, S. (2017). ATF: A generic auto-tuning framework. In 2017 IEEE 19th International Conference on High Performance Computing and Communications, pages 64–71.

Russell, S. J. S. J. and Norvig, P. (2009). Artificial intelligence : a modern approach. Prentice Hall Press, 3 edition.

Sena, A., Ribeiro, F., Rebello, V., Nascimento, A., and Boeres, C. (2013). Autonomic malleability in iterative mpi applications. In 2013 25th International Symposium on Computer Architecture and High Performance Computing, pages 192–199.

Sena, A. C., Nascimento, A., Vasconcelos, C., and Marzulo, L. A. J. (2017). Execução eficiente do algoritmo de leilão nas novas arquiteturas multicore. Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD), 18(1/2017).

Sudarsan, R. and Ribbens, C. J. (2010). Design and performance of a scheduling framework for resizable parallel applications. Parallel Comp., 36(1):48 – 64.