Otimização do espaço de memória das estruturas internas de um contabilizador de frequência de repetição de k-mers

  • Matheus P. Ferreira Mackenzie
  • Fabio T. Ishikawa Mackenzie
  • Fabricio G. Vilasbôas Mackenzie
  • Calebe P. Bianchini Mackenzie

Resumo

Nesse artigo apresentamos o CFRK-MC, um contabilizador da frequência de repetição de k-mers otimizado para ambientes de memória compartilhada baseado no CFRK. O CFRK-MC apresentou uma redução de 11,5x no tempo total de execução em relação à versão original, apresentando também uma redução consistente de ocupação de memória.

Referências

Chen, Y., Ye, W., Zhang, Y., and Xu, Y. (2015). High speed BLASTN: an accelerated MegaBLAST search tool. Nucleic Acids Research, 43(16):7762–7768.

Head, S. R., Komori, H. K., LaMere, S. A., Whisenant, T., Van Nieuwerburgh, F., Salomon, D. R., and Ordoukhanian, P. (2014). Library construction for next-generation sequencing: overviews and challenges. Biotechniques, 56(2):61–77.

Marçais, G. and Kingsford, C. (2011). A fast, lock-free approach for efficient parallel counting of occurrences of k-mers. Bioinformatics, 27(6):764–770.

Morgado, A. C. d. Q. (1991). Análise combinatória e probabilidade. Sociedade Brasileira de Matemática.

Onate, F. P., Batto, J.-M., Juste, C., Fadlallah, J., Fougeroux, C., Gouas, D., Pons, N., Kennedy, S., Levenez, F., Dore, J., et al. (2015). Quality control of microbiota metagenomics by k-mer analysis. BMC genomics, 16(1):1–10.

Vilasbôas, F. G. (2017). Método computacional baseado em gpu para contabilização de k-mers aplicado a metagenomas. Master’s thesis, Laboratório Nacional de Computação Científica, Brasil.

Zerbino, D. R. and Birney, E. (2008). Velvet: algorithms for de novo short read assembly using de bruijn graphs. Genome research, 18(5):821–829.

Zhang, Q., Pell, J., Canino-Koning, R., Howe, A. C., and Brown, C. T. (2014). These are not the k-mers you are looking for: Efficient online k-mer counting using a probabilistic data structure. PLOS ONE, 9(7):1–13.
Publicado
2021-05-06
Como Citar
FERREIRA, Matheus P. et al. Otimização do espaço de memória das estruturas internas de um contabilizador de frequência de repetição de k-mers. Anais da Escola Regional de Alto Desempenho de São Paulo (ERAD-SP), [S.l.], p. 17-20, maio 2021. ISSN 0000-0000. Disponível em: <https://sol.sbc.org.br/index.php/eradsp/article/view/16695>. Acesso em: 18 maio 2024. doi: https://doi.org/10.5753/eradsp.2021.16695.
Seção
Trabalhos de Iniciação Científica