SiBBr: Uma Infraestrutura para Coleta, Integração e Análise de Dados sobre a Biodiversidade Brasileira

  • Luiz Gadelha LNCC
  • Pedro Guimarães LNCC
  • Ana Maria Moura LNCC
  • Debora Drucker Embrapa
  • Eduardo Dalcin JBRJ
  • Guilherme Gall LNCC
  • Jurandir Tavares Jr. LNCC
  • Daniele Palazzi LNCC
  • Maira Poltosi LNCC
  • Fabio Porto LNCC
  • Francisco Moura LNCC
  • Wagner Leo LNCC

Resumo


Neste artigo descrevemos o Sistema de Informação sobre a Biodiversidade Brasileira, que tem como objetivo fornecer uma infraestrutura para coleta, integração e análise de dados produzidos e disponibilizados por diversas instituições da área. A arquitetura de software do sistema é descrita, bem como o fluxo de coleta e indexação de dados de ocorrências e listas de espécies, um dos componentes já implementados. É apresentada a implementação de um workflow científico escalável para a modelagem da distribuição de espécies, uma das aplicações mais utilizadas na análise da biodiversidade. Finalmente, são descritos trabalhos em andamento como a integração de dados socioeconômicos e o gerenciamento de dados ecológicos.

Referências

Amaral, R., et al. (2014). Supporting biodiversity studies with the EUBrazilOpenBio Hybrid Data Infrastructure. Concurrency and Computation: Practice and Experience.

ALA. http://www.ala.org.au. Acessado em abril de 2014.

BioMetada. http://service.ncddc.noaa.gov/rdn/www/metadata-standards/documents/BIO - Metadata.pdf. Acessado em abril de 2014.

Cardinale, B. J et al. (2012). Biodiversity loss and its impact on humanity. Nature, 486(7401), 59–67.

CBD, http://www.cbd.int. Acessada em abril de 2014.

Chapin III, F. Stuart et al. Consequences of Changing Biodiversity. Nature 405, no. 6783 (2000): 234–242.

DataONE, http://www.dataone.org. Acessado em abril de 2014.

Deelman, E., D. Gannon, M. Shields, and I. Taylor. Workflows and e-Science: An Overview of Workflow System Features and Capabilities. Future Generation Computer Systems 25, no. 5 (2009): 528–540.

Drucker, D. P. (2011, Julho). Avanços na Integração e Gerenciamento de Dados Ecológicos. Natureza & Conservação, 9(1), pp. 115-120.

Edwards, J. L. (2000). Interoperability of Biodiversity Databases: Biodiversity Information on Every Desktop. Science, 289(5488), 2312–2314.

Fegraus, E. et al. Maximizing the Value of Ecological Data with Structured Metadata: An Introduction to Ecological Metadata Language (EML) and Principles for Metadata Creation. Bull. of the Ecological Society of America 86 (2005): 158–168.

Gadelha, L. et al. (2012). MTCProv: a practical provenance query framework for manytask scientific computing. Distributed and Parallel Databases, 30(5-6), 351–370.

GBIF, http://www.gbif.org. Acessado em abril de 2014.

GeoNetwork, http://geonetwork-opensource.org/. Acessado em abril de 2014.

Gomes, A. T. A., Bastos, B. F., Medeiros, V., & Moreira, V. M. (2014). Experiences of the Brazilian national high-performance computing network on the rapid prototyping of science gateways. Concurrency and Computation: Practice and Experience.

Halperin, D. et al. (2013). Real-time collaborative analysis with (almost) pure SQL: a case study in biogeochemical oceanography. In Proceedings of the 25th International Conference on Scientific and Statistical Database Management – SSDBM. ACM.

Hobern, D. et al. Global Biodiversity Information Outlook - Delivering Biodiversity Knowledge in the Information Age. GBIF Secretariat, 2013.

HIT, https://code.google.com/p/gbif-indexingtoolkit/. Acessado em abril de 2014.

INDE, http://www.inde.gov.br. Acessado em abril de 2014.

IPCC, http://www.ipcc.ch. Acessado em abril de 2014.

IPT, https://code.google.com/p/gbif-providertoolkit/. Acessado em abril de 2014.

Jones MB et al., 2006. The new bioinformatics: integrating ecological data from the gene to the biosphere. Annual Review of Ecology, Evolution, and Systematics, 37:519-44.

KNB, https://knb.ecoinformatics.org/. Acessado em abril de 2014.

LTER, http://www.ilternet.edu/. Acessado em abril de 2014.

Michener, W., J. Porter, M. Servilla, & K. Vanderbilt. Long Term Ecological Research and Information Management. Ecological Informatics 6, no. 1 (2011): 13–24.

Michener, W. K. et al. Participatory design of DataONE—Enabling cyberinfrastructure for the biological and environmental sciences. Ecological Informatics 11, 5–15 (2012).

Muñoz, M. et al. openModeller: a generic approach to species’ potential distribution modelling. GeoInformatica 15, 111–135 (2011).

Phillips, S. J., Dudík, M., & Schapire, R. E. (2004). A maximum entropy approach to species distribution modeling. In Twenty-first International Conference on Machine Learning - ICML ’04 (p. 83). ACM Press.

Portal de Espécies e Ocorrências, SiBBr (versão de homologação). http://gbif.sibbr.gov.br/portal. Acessado em abril de 2014.

SiBBr Github. http://gihub.com/sibbr. Acessado em abril de 2014.

SiB Colombia. http://www.sib-colombia.net. Acessado em abril de 2014.

SINAPAD, http://www.lncc.br/sinapad. Acessado em abril de 2014.

speciesLink. http://splink.cria.org.br. Acessado em abril de 2014.

Soberón, Jorge, e Townsend Peterson. Biodiversity Informatics: Managing and Applying Primary Biodiversity Data. Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences 359, no. 1444 (2004): 689–698.

Townsend Peterson, A. et al. (2011). Ecological Niches and Geographic Distributions (p. 328). Princeton University Press.

Wieczorek, John et al.. Darwin Core: An Evolving Community-Developed Biodiversity Data Standard. PLoS ONE 7, no. 1 (2012): e29715.

Wilde, M. et al. (2011). Swift: A language for distributed parallel scripting. Parallel Computing, 37(9), 633–652.
Publicado
28/07/2014
Como Citar

Selecione um Formato
GADELHA, Luiz et al. SiBBr: Uma Infraestrutura para Coleta, Integração e Análise de Dados sobre a Biodiversidade Brasileira. In: BRAZILIAN E-SCIENCE WORKSHOP (BRESCI), 8. , 2014, Brasília. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2014 . p. 37-44. ISSN 2763-8774.