Avaliação do uso eficiente de algoritmos paralelos de filogenia em supercomputadores
Resumo
Ambientes de processamento de alto desempenho (PAD) são requeridos pela bioinformática, em especial nas áreas de filogenia e evolução de organismos. O presente trabalho apresenta uma análise comportamental da ferramenta de filogenia RAxML em ambientes de PAD. O RAxML implementa paralelismo e distribuição de tarefas pelo uso de threads e bibliotecas MPI. As execuções foram realizadas nos clusters do supercomputador Santos Dumont (SDumont). Os resultados em termos de eficiência evidenciam que o impacto é gerado pela variação da configuração, acoplamento e uso do RAxML e do SDumont. Essa informação permitirá um melhor entendimento e uso eficiente desses ambientes especializados.
Referências
Aho, A. et al. (2006). Compilers: Principles, Techniques, and Tools. 2. ed. Addison Wesley.
Felsenstein, J. (1985). Confidence Limits on Phylogenies: An Approach Using the Bootstrap. Evolution, v. 39, n. 4, p. 783–791.
Felsenstein, J. (1996). Inferring phylogenies from protein sequences by parsimony, distance, and likelihood methods. Methods in Enzymology, v. 266, p. 418–427.
Pfeiffer, W. e Stamatakis, A. (2010). Hybrid MPI/Pthreads parallelization of the RAxML phylogenetics code. IEEE. [link].
Ronquist, F. e Huelsenbeck, J. P. (2003). MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics (Oxford, England), v. 19, n. 12, p. 1572–1574.
Stamatakis, A. (2014). RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies. Bioinformatics, v. 30, n. 9, p. 1312–1313.
