Avaliação do desempenho relativo de bancos de dados NoSQL para arquivos de genótipos

  • Vinícius Junqueira Schettino UFJF
  • Arthur Lorenzi Almeida UFJF
  • Leojayme Rodrigues Manso Silva UFJF
  • Wagner Arbex UFJF / EMBRAPA

Resumo


A bioinformática e a genômica trabalham com bases de dados fora do padrão tradicional ou clássico que, por sua vez, caracterizam-se pela organização tabular e pelo tratamento destas em SGBDRs. Arquivos de genótipos são exemplos de bases de dados não clássicas e são caracterizados por serem gerados como arquivos textos, com dados desbalanceados, com alta dimensionalidade e por ocuparem muito espaço, entre outros aspectos. Os SGBDRs não têm se mostrado uma boa solução para o tratamento de tais bases e, portanto, o presente trabalho busca avaliar o desempenho relativo entre bancos de dados NoSQL que representam duas famílias de diferentes modelo de dados, a partir de cenários de teste para a manipulação de arquivos de genótipo.

Referências

Aniceto, R., Xavier, R., Guimarães, V., Hondo, F., Holanda, M., Walter, M. E., and Lifschitz, S. (2015). Evaluating the cassandra NoSQL database approach for genomic data persistency. International Journal of Genomics, 2015.

Brookes, A. J. (1999). The essence of SNPs. Gene, 2(234):177–186.

Caetano, A. R. (2009). Marcadores SNP: conceitos básicos, aplicações no manejo e no melhoramento animal e perspectivas para o futuro. Rev. Bras. de Zootecnia, 38:64–71.

Cooper, B. F., Silberstein, A., Tam, E., Ramakrishnan, R., and Sears, R. (2010). Benchmarking cloud serving systems with ycsb. In Proceedings of the 1st ACM Symposium on Cloud Computing, SoCC ’10, pages 143–154, New York, NY, USA. ACM.

Edlich, S. (2016). NoSQL. http://www.nosql-database.org/.

Hecht, R. and Jablonski, S. (2011). NoSQL evaluation: A use case oriented survey. In 2011 International Conference on Cloud and Service Computing, pages 336–341. IEEE.

Li, Y. and Manoharan, S. (2013). A performance comparison of sql and nosql databases. In Communications, Computers and Signal Processing (PACRIM), 2013 IEEE Pacific Rim Conference on, pages 15–19.

Mail.Ru Group (2016). Tarantool. http://tarantool.org/.

MongoDB, Inc. (2016). MongoDB for giant ideas. https://www.mongodb.org/.

Veronika Abramova; Jorge Bernardino and Pedro Furtado (2014). Experimental Evaluation of Nosql Databases. International Journal of Database Management Systems (IJDMS), 6(3):1–16.
Publicado
04/07/2016
SCHETTINO, Vinícius Junqueira; ALMEIDA, Arthur Lorenzi; SILVA, Leojayme Rodrigues Manso; ARBEX, Wagner. Avaliação do desempenho relativo de bancos de dados NoSQL para arquivos de genótipos. In: BRAZILIAN E-SCIENCE WORKSHOP (BRESCI), 10. , 2016, Porto Alegre. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2016 . p. 306-309. ISSN 2763-8774. DOI: https://doi.org/10.5753/bresci.2016.9128.