Avaliação da aplicação de paralelismo em classificadores taxonômicos usando Qiime2

  • Caetano Müller PUCRS
  • Junior Löff PUCRS
  • Dalvan Griebler PUCRS
  • Eduardo Eizirik PUCRS

Resumo


A classificação de sequências de DNA usando algoritmos de aprendizado de máquina ainda tem espaço para evoluir, tanto na qualidade do resultado quanto na eficiência computacional dos algoritmos. Nesse trabalho, realizou-se uma avaliação de desempenho em dois algoritmos de aprendizado de máquina da ferramenta Qiime2 para classificação de sequências de DNA. Os resultados mostram que o desempenho melhorou em até 9,65 vezes utilizando 9 threads.

Referências

Bokulich, N. A., Kaehler, B. D., Rideout, J. R., Dillon, M., et al. (2018). Optimizing taxonomic classification of marker-gene amplicon sequences with qiime 2’s q2-feature-classifier plugin. Microbiome, 6(1):1–17.

Bolyen, E., Rideout, J. R., Dillon, M. R., Bokulich, N. A., et al. (2019). Reproducible, interactive, scalable and extensible microbiome data science using qiime 2. Nature biotechnology, 37(8):852–857.

Loff, J., Griebler, D., Sandes, E., Melo, A., and Fernandes, L. G. (2018). Suporte ao Paralelismo Multi-Core com FastFlow e TBB em uma Aplicação de Alinhamento de Sequências de DNA. In ERAD-RS, page 2, Porto Alegre, BR. SBC.

Lu, J. and Salzberg, S. L. (2020). Ultrafast and accurate 16s rrna microbial community analysis using kraken 2. Microbiome, 8(1):1–11.

Quast, C., Pruesse, E., Yilmaz, P., Gerken, J., et al. (2012). The silva ribosomal rna gene database project: improved data processing and web-based tools. Nucleic acids research, 41(D1):D590–D596.
Publicado
18/04/2022
MÜLLER, Caetano; LÖFF, Junior; GRIEBLER, Dalvan; EIZIRIK, Eduardo. Avaliação da aplicação de paralelismo em classificadores taxonômicos usando Qiime2. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO SUL (ERAD-RS), 22. , 2022, Curitiba. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 25-28. ISSN 2595-4164. DOI: https://doi.org/10.5753/eradrs.2022.19152.