Desempenho de Workflows Científicos de Transcriptômica em Arquiteturas de Memória Distribuída e Compartilhada do Santos Dumont

  • Albert Emidio LNCC / FAETERJ-RJ
  • Reiglan Soares LNCC / FAETERJ-RJ
  • Lucas Cruz LNCC
  • Micaella Coelho LNCC
  • Kary Ocaña LNCC
  • Carla Osthoff LNCC
  • Diego Carvalho CEFET-RJ

Resumo


Experimentos científicos em larga escala são complexos devido à modelagem, execução e análise de grandes volumes de dados. Na bioinformática, esses experimentos são estruturados como workflows científicos, usando sistemas de gerência de workflows e computação de alto desempenho. Este artigo apresenta uma análise computacional do desempenho do workflow de transcriptômica ParslRNA-Seq entre arquiteturas com memória distribuída e memória compartilhada mais recentes do supercomputador Santos Dumont, demonstrando como a escolha das máquinas pode influenciar o desempenho.

Referências

C. Ané, "Detecting phylogenetic breakpoints and discordance from genome-wide alignments for species tree reconstruction," Genome Biology and Evolution, vol. 3, pp. 246–258, 2011.

L. Cruz, M. Coelho, R. Terra, D. Carvalho, L. Gadelha, C. Osthoff, and K. Ocaña, "Workflows Científicos de RNA-Seq em Ambientes Distribuídos de Alto Desempenho: Otimização de Desempenho e Análises de Dados de Expressão Diferencial de Genes," in Anais do Brazilian e-Science Workshop (BreSci), 2021. DOI: 10.5753/bresci.2021.15789.

J. P. Huelsenbeck and F. Ronquist, "Mrbayes: Bayesian inference of phylogenetic trees," Bioinformatics, vol. 17, no. 8, pp. 754–755, 2001.

K. A. C. S. Ocaña, M. Galheigo, C. Osthoff, L. M. R. Gadelha, F. Porto, A. T. A. Gomes, D. Oliveira, and A. T. Vasconcelos, "BioinfoPortal: A scientific gateway for integrating bioinformatics applications on the Brazilian national high-performance computing network," Future Generation Computer Systems, vol. 107, pp. 192–214, 2020.

S. Snir and S. Rao, "Quartet maxcut: a fast algorithm for amalgamating quartet trees," Molecular phylogenetics and evolution, vol. 62, no. 1, pp. 1–8, 2012.

N. W. Stenz, B. Larget, D. A. Baum, and C. Ané, "Exploring tree-like and non-tree-like patterns using genome sequences: an example using the inbreeding plant species arabidopsis thaliana (l.) heynh," Systematic Biology, vol. 64, no. 5, pp. 809–823, 2015.

S. H. H. Taipe et al., "An Evaluation of Direct and Indirect Memory Accesses in Fluid Flow Simulator," in Computational Science and Its Applications – ICCSA 2023, Lecture Notes in Computer Science, vol. 13956, O. Gervasi et al., Eds. Cham: Springer, 2023. DOI: 10.1007/978-3-031-36805-9_3.

Babuji, Y., Woodard, A., Li, Z., Katz, D. S., Clifford, B., Kumar, R., Lacinski, L., Chard, R., Wozniak, J., Foster, I., Wilde, M., and Chard, K. (2019). Parsl: Pervasive parallel programming in Python. In 28th ACM International Symposium on High-Performance Parallel and Distributed Computing (HPDC)

Silva, R. R. and Yokoyama, R. S. (2011). Avaliação do desempenho de threads em user level utilizando o sistema operacional Linux. Revista de Informática Teórica e Aplicada.
Publicado
23/10/2024
EMIDIO, Albert; SOARES, Reiglan; CRUZ, Lucas; COELHO, Micaella; OCAÑA, Kary; OSTHOFF, Carla; CARVALHO, Diego. Desempenho de Workflows Científicos de Transcriptômica em Arquiteturas de Memória Distribuída e Compartilhada do Santos Dumont. In: WORKSHOP DE INICIAÇÃO CIENTÍFICA - SIMPÓSIO EM SISTEMAS COMPUTACIONAIS DE ALTO DESEMPENHO (SSCAD), 25. , 2024, São Carlos/SP. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 97-104. DOI: https://doi.org/10.5753/sscad_estendido.2024.244368.