Avaliação da aplicação de paralelismo em classificadores taxonômicos usando Qiime2
Resumo
A classificação de sequências de DNA usando algoritmos de aprendizado de máquina ainda tem espaço para evoluir, tanto na qualidade do resultado quanto na eficiência computacional dos algoritmos. Nesse trabalho, realizou-se uma avaliação de desempenho em dois algoritmos de aprendizado de máquina da ferramenta Qiime2 para classificação de sequências de DNA. Os resultados mostram que o desempenho melhorou em até 9,65 vezes utilizando 9 threads.
Referências
Bolyen, E., Rideout, J. R., Dillon, M. R., Bokulich, N. A., et al. (2019). Reproducible, interactive, scalable and extensible microbiome data science using qiime 2. Nature biotechnology, 37(8):852–857.
Loff, J., Griebler, D., Sandes, E., Melo, A., and Fernandes, L. G. (2018). Suporte ao Paralelismo Multi-Core com FastFlow e TBB em uma Aplicação de Alinhamento de Sequências de DNA. In ERAD-RS, page 2, Porto Alegre, BR. SBC.
Lu, J. and Salzberg, S. L. (2020). Ultrafast and accurate 16s rrna microbial community analysis using kraken 2. Microbiome, 8(1):1–11.
Quast, C., Pruesse, E., Yilmaz, P., Gerken, J., et al. (2012). The silva ribosomal rna gene database project: improved data processing and web-based tools. Nucleic acids research, 41(D1):D590–D596.