Gerência e Análises de Workflows aplicados a Redes Filogenéticas de Genomas de Dengue no Brasil
Resumo
Processos evolutivos e dispersão de genomas de Dengue no Brasil são relevantes na direção do impacto e vigilância endemo-epidêmico e social de arboviroses emergentes. Árvores e redes filogenéticas permitem exibir eventos evolutivos e reticulados em vírus originados pela alta diversidade e taxa de mutação de recombinação homóloga frequente. Apresentamos um workflow científico paralelo e distribuído para redes filogenéticas desenhado para trabalhar com a diversidade de ferramentas e recursos em experimentos da biologia computacional e acoplados a ambientes de computação de alto desempenho. Apresentamos uma melhoria no tempo de execução de aproximadamente 5 vezes em comparação com a execução sequencial em análises de genomas de dengue e com identificação de eventos de recombinação.
Palavras-chave:
redes filogenéticas, dengue, workflows científicos, computação de alto desempenho
Referências
Babuji, Y. N., Chard, K., Foster, I. T., Katz, D. S., Wilde, M., Woodard, A., & Wozniak, J. M. (2018, June). Parsl: Scalable Parallel Scripting in Python. In IWSG.
Baum, D. (2008). Reading a phylogenetic tree: the meaning of monophyletic groups. Nature Education, 1(1), 190.
Huson, D. H., Rupp, R., & Scornavacca, C. (2010). Phylogenetic networks: concepts, algorithms and applications. Cambridge University Press.
Larget, B. R., Kotha, S. K., Dewey, C. N., and Ane, C. (2010). Bucky: gene tree/species tree reconciliation with bayesian concordance analysis. Bioinformatics, 26(22):2910–2911.
OPAS, Organização Pan-Americana da Saúde, W. (2021). Dengue, organização pan-americana da saúde (em português). https://www.paho.org/pt/topicos/dengue. Acessado em 23 de março de 2021.
Ronquist, F., & Huelsenbeck, J. P. (2003). MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics, 19(12), 1572-1574.
Schneider, A. D. B., Jacob Machado, D., Guirales, S., & Janies, D. A. (2020). FLAVi: An enhanced annotator for viral genomes of Flaviviridae. Viruses, 12(8), 892.
Snir, S., & Rao, S. (2012). Quartet MaxCut: a fast algorithm for amalgamating quartet trees. Molecular phylogenetics and evolution, 62(1), 1-8.
Solís-Lemus, C., & Ané, C. (2016). Inferring phylogenetic networks with maximum pseudolikelihood under incomplete lineage sorting. PLoS genetics, 12(3), e1005896.
Stamatakis, A. (2014). RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies. Bioinformatics, 30(9), 1312-1313.
Villabona-Arenas, C. J., de Brito, A. F., & de Andrade Zanotto, P. M. (2013). Genomic mosaicism in two strains of dengue virus type 3. Infection, Genetics and Evolution, 18, 202-212.
WHO, W. (2021).Dengue and severe dengue.https://www.who.int/news-room/fact-sheets/detail/dengue-and-severe-dengue. Acessado em 23 de março de 2021.
Wilde, M., Hategan, M., Wozniak, J. M., Clifford, B., Katz, D. S., & Foster, I. (2011). Swift: A language for distributed parallel scripting. Parallel Computing, 37(9), 633-652.
Zhang, C., Rabiee, M., Sayyari, E., & Mirarab, S. (2018). ASTRAL-III: polynomial time species tree reconstruction from partially resolved gene trees. BMC bioinformatics, 19(6), 15-30.
Baum, D. (2008). Reading a phylogenetic tree: the meaning of monophyletic groups. Nature Education, 1(1), 190.
Huson, D. H., Rupp, R., & Scornavacca, C. (2010). Phylogenetic networks: concepts, algorithms and applications. Cambridge University Press.
Larget, B. R., Kotha, S. K., Dewey, C. N., and Ane, C. (2010). Bucky: gene tree/species tree reconciliation with bayesian concordance analysis. Bioinformatics, 26(22):2910–2911.
OPAS, Organização Pan-Americana da Saúde, W. (2021). Dengue, organização pan-americana da saúde (em português). https://www.paho.org/pt/topicos/dengue. Acessado em 23 de março de 2021.
Ronquist, F., & Huelsenbeck, J. P. (2003). MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics, 19(12), 1572-1574.
Schneider, A. D. B., Jacob Machado, D., Guirales, S., & Janies, D. A. (2020). FLAVi: An enhanced annotator for viral genomes of Flaviviridae. Viruses, 12(8), 892.
Snir, S., & Rao, S. (2012). Quartet MaxCut: a fast algorithm for amalgamating quartet trees. Molecular phylogenetics and evolution, 62(1), 1-8.
Solís-Lemus, C., & Ané, C. (2016). Inferring phylogenetic networks with maximum pseudolikelihood under incomplete lineage sorting. PLoS genetics, 12(3), e1005896.
Stamatakis, A. (2014). RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies. Bioinformatics, 30(9), 1312-1313.
Villabona-Arenas, C. J., de Brito, A. F., & de Andrade Zanotto, P. M. (2013). Genomic mosaicism in two strains of dengue virus type 3. Infection, Genetics and Evolution, 18, 202-212.
WHO, W. (2021).Dengue and severe dengue.https://www.who.int/news-room/fact-sheets/detail/dengue-and-severe-dengue. Acessado em 23 de março de 2021.
Wilde, M., Hategan, M., Wozniak, J. M., Clifford, B., Katz, D. S., & Foster, I. (2011). Swift: A language for distributed parallel scripting. Parallel Computing, 37(9), 633-652.
Zhang, C., Rabiee, M., Sayyari, E., & Mirarab, S. (2018). ASTRAL-III: polynomial time species tree reconstruction from partially resolved gene trees. BMC bioinformatics, 19(6), 15-30.
Publicado
18/07/2021
Como Citar
TERRA, Rafael; COELHO, Micaella; CRUZ, Lucas; GARCIA-ZAPATA, Marco; GADELHA, Luiz; OSTHOFF, Carla; CARVALHO, Diego; OCAÑA, Kary.
Gerência e Análises de Workflows aplicados a Redes Filogenéticas de Genomas de Dengue no Brasil. In: BRAZILIAN E-SCIENCE WORKSHOP (BRESCI), 15. , 2021, Evento Online.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2021
.
p. 49-56.
ISSN 2763-8774.
DOI: https://doi.org/10.5753/bresci.2021.15788.