Análise de viabilidade de ferramenta para correção híbrida de sequências genômicas em ambiente de memória compartilhada com FPGA
Resumo
A análise do genoma compreende pesquisas com amplo escopo, com foco em doenças e em tratamento das mesmas. Em apoio a tais atividades, pesquisadores valem-se de ferramentas computacionais para montagens de genomas. Este trabalho apresenta uma análise de viabilidade de uma ferramenta para correção hı́brida de sequências genômicas, etapa esta necessária para a montagem do genoma. É proposta uma arquitetura para ambientes heterogêneos, com implementação feita em CPU e uma placa FPGA. Os resultados obtidos no levantamento dos dados teóricos e práticos apontam que a implementação com o acelerador em hardware possui ganhos de desempenho de até cerca de 19 vezes em relação à versão sequencial, podendo aumentar a depender da tecnologia de comunicação utilizada.
Referências
Del Angel, V. D., Hjerde, E., Sterck, L., Capella-Gutierrez, S., Notredame, C., Pettersson, O. V., Amselem, J., Bouri, L., Bocs, S., Klopp, C., et al. (2018). Ten steps to get started in genome assembly and annotation. F1000Research, 7.
Goodwin, S., McPherson, J. D., and McCombie, W. R. (2016). Coming of age: ten years of next-generation sequencing technologies. Nature Reviews Genetics, 17(6):333.
Hu, Y. and Georgiou, P. (2015). A real-time de novo dna sequencing assembly platform based on an fpga implementation. IEEE/ACM transactions on computational biology and bioinformatics, 13(2):291–300.
Koren, S., Walenz, B. P., Berlin, K., Miller, J. R., Bergman, N. H., and Phillippy, A. M. (2017). Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation. Genome research, 27(5):722–736.
Mahram, A. and Herbordt, M. C. (2012). Fmsa: Fpga-accelerated clustalw-based multiple sequence alignment through pipelined prefiltering. In 2012 IEEE 20th International Symposium on Field-Programmable Custom Computing Machines, pages 177–183.
Ramachandran, A., Heo, Y., Hwu, W., Ma, J., and Chen, D. (2015). Fpga accelerated dna error correction. In 2015 Design, Automation Test in Europe Conference Exhibition (DATE), pages 1371–1376.
Salmela, L. and Rivals, E. (2014). Lordec: accurate and efficient long read error correction. Bioinformatics, 30(24):3506–3514.
Varma, B. S. C., Paul, K., Balakrishnan, M., and Lavenier, D. (2013). Fassem: Fpga based acceleration of de novo genome assembly. In 2013 IEEE 21st Annual International Symposium on Field-Programmable Custom Computing Machines, pages 173–176.