Gerência e Análises de Workflows aplicados a Redes Filogenéticas de Genomas de Dengue no Brasil

  • Rafael Terra LNCC http://orcid.org/0000-0002-3811-4527
  • Micaella Coelho LNCC
  • Lucas Cruz LNCC / CEFET/RJ
  • Marco Garcia-Zapata UFG
  • Luiz Gadelha LNCC
  • Carla Osthoff LNCC
  • Diego Carvalho CEFET/RJ
  • Kary Ocaña LNCC / CEFET/RJ

Resumo


Processos evolutivos e dispersão de genomas de Dengue no Brasil são relevantes na direção do impacto e vigilância endemo-epidêmico e social de arboviroses emergentes. Árvores e redes filogenéticas permitem exibir eventos evolutivos e reticulados em vírus originados pela alta diversidade e taxa de mutação de recombinação homóloga frequente. Apresentamos um workflow científico paralelo e distribuído para redes filogenéticas desenhado para trabalhar com a diversidade de ferramentas e recursos em experimentos da biologia computacional e acoplados a ambientes de computação de alto desempenho. Apresentamos uma melhoria no tempo de execução de aproximadamente 5 vezes em comparação com a execução sequencial em análises de genomas de dengue e com identificação de eventos de recombinação.
Palavras-chave: redes filogenéticas, dengue, workflows científicos, computação de alto desempenho

Referências

Babuji, Y. N., Chard, K., Foster, I. T., Katz, D. S., Wilde, M., Woodard, A., & Wozniak, J. M. (2018, June). Parsl: Scalable Parallel Scripting in Python. In IWSG.

Baum, D. (2008). Reading a phylogenetic tree: the meaning of monophyletic groups. Nature Education, 1(1), 190.

Huson, D. H., Rupp, R., & Scornavacca, C. (2010). Phylogenetic networks: concepts, algorithms and applications. Cambridge University Press.

Larget, B. R., Kotha, S. K., Dewey, C. N., and Ane, C. (2010). Bucky: gene tree/species tree reconciliation with bayesian concordance analysis. Bioinformatics, 26(22):2910–2911.

OPAS, Organização Pan-Americana da Saúde, W. (2021). Dengue, organização pan-americana da saúde (em português). https://www.paho.org/pt/topicos/dengue. Acessado em 23 de março de 2021.

Ronquist, F., & Huelsenbeck, J. P. (2003). MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics, 19(12), 1572-1574.

Schneider, A. D. B., Jacob Machado, D., Guirales, S., & Janies, D. A. (2020). FLAVi: An enhanced annotator for viral genomes of Flaviviridae. Viruses, 12(8), 892.

Snir, S., & Rao, S. (2012). Quartet MaxCut: a fast algorithm for amalgamating quartet trees. Molecular phylogenetics and evolution, 62(1), 1-8.

Solís-Lemus, C., & Ané, C. (2016). Inferring phylogenetic networks with maximum pseudolikelihood under incomplete lineage sorting. PLoS genetics, 12(3), e1005896.

Stamatakis, A. (2014). RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies. Bioinformatics, 30(9), 1312-1313.

Villabona-Arenas, C. J., de Brito, A. F., & de Andrade Zanotto, P. M. (2013). Genomic mosaicism in two strains of dengue virus type 3. Infection, Genetics and Evolution, 18, 202-212.

WHO, W. (2021).Dengue and severe dengue.https://www.who.int/news-room/fact-sheets/detail/dengue-and-severe-dengue. Acessado em 23 de março de 2021.

Wilde, M., Hategan, M., Wozniak, J. M., Clifford, B., Katz, D. S., & Foster, I. (2011). Swift: A language for distributed parallel scripting. Parallel Computing, 37(9), 633-652.

Zhang, C., Rabiee, M., Sayyari, E., & Mirarab, S. (2018). ASTRAL-III: polynomial time species tree reconstruction from partially resolved gene trees. BMC bioinformatics, 19(6), 15-30.
Publicado
18/07/2021
TERRA, Rafael; COELHO, Micaella; CRUZ, Lucas; GARCIA-ZAPATA, Marco; GADELHA, Luiz; OSTHOFF, Carla; CARVALHO, Diego; OCAÑA, Kary. Gerência e Análises de Workflows aplicados a Redes Filogenéticas de Genomas de Dengue no Brasil. In: BRAZILIAN E-SCIENCE WORKSHOP (BRESCI), 15. , 2021, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 49-56. ISSN 2763-8774. DOI: https://doi.org/10.5753/bresci.2021.15788.