Enriquecimento de Dados de Proveniência de Análises Filogenéticas com Dados do NCBI: uma Abordagem Prática
Resumo
Esse artigo apresenta uma proposta de abordagem, chamada BioIntegrator, para integração e enriquecimento de bases de dados de proveniência de análises filogenéticas com metadados presentes em fontes externas. Tal abordagem visa oferecer maior capacidade analítica aos cientistas em suas tarefas diárias. Apesar de ser um trabalho em andamento, a abordagem proposta tem um potencial claro no que tange a análise e validação de resultados dos experimentos.
Referências
de Oliveira, D., Ogasawara, E., Baião, F., and Mattoso, M. (2010). Scicumulus: A lightweight cloud middleware to explore many task computing paradigm in scientific workflows. In 2010 IEEE CLOUD, pages 378–385.
de Oliveira, D., Silva, V., and Mattoso, M. (2015). How much domain data should be in provenance databases? In TaPP 15, Scotland.
de Oliveira, W. M., Ocaña, K. A. C. S., de Oliveira, D., and Braganholo, V. (2017). Querying provenance along with external domain data using prolog. JIDM, 8(1):3–18.
Federhen, S. (2011). The ncbi taxonomy database. Nucleic acids research, 40(D1):D136–D143.
Felsenstein, J. (1996). [24] inferring phylogenies from protein sequences by parsimony, distance, and likelihood methods. In M. in enzym., volume 266, pages 418–427.
Freire, J., Koop, D., Santos, E., and Silva, C. T. (2008). Provenance for computational tasks: A survey. Computing in Science and Engg., 10(3):11–21.
Halevy, A. Y. (2000). Theory of answering queries using views. SIGMOD Rec., 29(4):40–47.
Hernandez, T. and Kambhampati, S. (2004). Integration of biological sources: Current systems and challenges ahead. SIGMOD Rec., 33(3):51–60.
Ocaña, K. A. C. S., de Oliveira, D., Ogasawara, E., Dávila, A. M. R., Lima, A. A. B., and Mattoso, M. (2011). Sciphy: A cloud-based workflow for phylogenetic analysis of drug targets in protozoan genomes. In BSB, pages 66–70.
Thiam Yui, C., Liang, L. J., Jik Soon, W., and Husain, W. (2011). A survey on data integration in bioinformatics. In Inf. Eng. and Inf. Sci., pages 16–28.
Widom, J. (1995). Research problems in data warehousing. In CIKM’95, CIKM ’95, pages 25–30, New York, NY, USA. ACM.
