Enriquecimento de Dados de Proveniência de Análises Filogenéticas com Dados do NCBI: uma Abordagem Prática

  • Lucas S. Tito UFF
  • Kary A. C. S. Ocaña LNCC
  • Daniel de Oliveira UFF

Resumo


Esse artigo apresenta uma proposta de abordagem, chamada BioIntegrator, para integração e enriquecimento de bases de dados de proveniência de análises filogenéticas com metadados presentes em fontes externas. Tal abordagem visa oferecer maior capacidade analítica aos cientistas em suas tarefas diárias. Apesar de ser um trabalho em andamento, a abordagem proposta tem um potencial claro no que tange a análise e validação de resultados dos experimentos.

Referências

Chawathe, S., Garcia-Molina, H., Hammer, J., Ireland, K., Papakonstantinou, Y., Ullman, J., and Widom, J. The tsimmis project: Integration of heterogeneous information sources.

de Oliveira, D., Ogasawara, E., Baião, F., and Mattoso, M. (2010). Scicumulus: A lightweight cloud middleware to explore many task computing paradigm in scientific workflows. In 2010 IEEE CLOUD, pages 378–385.

de Oliveira, D., Silva, V., and Mattoso, M. (2015). How much domain data should be in provenance databases? In TaPP 15, Scotland.

de Oliveira, W. M., Ocaña, K. A. C. S., de Oliveira, D., and Braganholo, V. (2017). Querying provenance along with external domain data using prolog. JIDM, 8(1):3–18.

Federhen, S. (2011). The ncbi taxonomy database. Nucleic acids research, 40(D1):D136–D143.

Felsenstein, J. (1996). [24] inferring phylogenies from protein sequences by parsimony, distance, and likelihood methods. In M. in enzym., volume 266, pages 418–427.

Freire, J., Koop, D., Santos, E., and Silva, C. T. (2008). Provenance for computational tasks: A survey. Computing in Science and Engg., 10(3):11–21.

Halevy, A. Y. (2000). Theory of answering queries using views. SIGMOD Rec., 29(4):40–47.

Hernandez, T. and Kambhampati, S. (2004). Integration of biological sources: Current systems and challenges ahead. SIGMOD Rec., 33(3):51–60.

Ocaña, K. A. C. S., de Oliveira, D., Ogasawara, E., Dávila, A. M. R., Lima, A. A. B., and Mattoso, M. (2011). Sciphy: A cloud-based workflow for phylogenetic analysis of drug targets in protozoan genomes. In BSB, pages 66–70.

Thiam Yui, C., Liang, L. J., Jik Soon, W., and Husain, W. (2011). A survey on data integration in bioinformatics. In Inf. Eng. and Inf. Sci., pages 16–28.

Widom, J. (1995). Research problems in data warehousing. In CIKM’95, CIKM ’95, pages 25–30, New York, NY, USA. ACM.
Publicado
26/07/2018
TITO, Lucas S.; OCAÑA, Kary A. C. S.; DE OLIVEIRA, Daniel. Enriquecimento de Dados de Proveniência de Análises Filogenéticas com Dados do NCBI: uma Abordagem Prática. In: BRAZILIAN E-SCIENCE WORKSHOP (BRESCI), 12. , 2018, Natal. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018 . p. 85-88. ISSN 2763-8774. DOI: https://doi.org/10.5753/bresci.2018.3279.