SiBBr: Uma Infraestrutura para Coleta, Integração e Análise de Dados sobre a Biodiversidade Brasileira

  • Luiz Gadelha LNCC
  • Pedro Guimarães LNCC
  • Ana Maria Moura LNCC
  • Debora Drucker Embrapa
  • Eduardo Dalcin JBRJ
  • Guilherme Gall LNCC
  • Jurandir Tavares Jr. LNCC
  • Daniele Palazzi LNCC
  • Maira Poltosi LNCC
  • Fabio Porto LNCC
  • Francisco Moura LNCC
  • Wagner Leo LNCC


Neste artigo descrevemos o Sistema de Informação sobre a Biodiversidade Brasileira, que tem como objetivo fornecer uma infraestrutura para coleta, integração e análise de dados produzidos e disponibilizados por diversas instituições da área. A arquitetura de software do sistema é descrita, bem como o fluxo de coleta e indexação de dados de ocorrências e listas de espécies, um dos componentes já implementados. É apresentada a implementação de um workflow científico escalável para a modelagem da distribuição de espécies, uma das aplicações mais utilizadas na análise da biodiversidade. Finalmente, são descritos trabalhos em andamento como a integração de dados socioeconômicos e o gerenciamento de dados ecológicos.


Amaral, R., et al. (2014). Supporting biodiversity studies with the EUBrazilOpenBio Hybrid Data Infrastructure. Concurrency and Computation: Practice and Experience.

ALA. Acessado em abril de 2014.

BioMetada. - Metadata.pdf. Acessado em abril de 2014.

Cardinale, B. J et al. (2012). Biodiversity loss and its impact on humanity. Nature, 486(7401), 59–67.

CBD, Acessada em abril de 2014.

Chapin III, F. Stuart et al. Consequences of Changing Biodiversity. Nature 405, no. 6783 (2000): 234–242.

DataONE, Acessado em abril de 2014.

Deelman, E., D. Gannon, M. Shields, and I. Taylor. Workflows and e-Science: An Overview of Workflow System Features and Capabilities. Future Generation Computer Systems 25, no. 5 (2009): 528–540.

Drucker, D. P. (2011, Julho). Avanços na Integração e Gerenciamento de Dados Ecológicos. Natureza & Conservação, 9(1), pp. 115-120.

Edwards, J. L. (2000). Interoperability of Biodiversity Databases: Biodiversity Information on Every Desktop. Science, 289(5488), 2312–2314.

Fegraus, E. et al. Maximizing the Value of Ecological Data with Structured Metadata: An Introduction to Ecological Metadata Language (EML) and Principles for Metadata Creation. Bull. of the Ecological Society of America 86 (2005): 158–168.

Gadelha, L. et al. (2012). MTCProv: a practical provenance query framework for manytask scientific computing. Distributed and Parallel Databases, 30(5-6), 351–370.

GBIF, Acessado em abril de 2014.

GeoNetwork, Acessado em abril de 2014.

Gomes, A. T. A., Bastos, B. F., Medeiros, V., & Moreira, V. M. (2014). Experiences of the Brazilian national high-performance computing network on the rapid prototyping of science gateways. Concurrency and Computation: Practice and Experience.

Halperin, D. et al. (2013). Real-time collaborative analysis with (almost) pure SQL: a case study in biogeochemical oceanography. In Proceedings of the 25th International Conference on Scientific and Statistical Database Management – SSDBM. ACM.

Hobern, D. et al. Global Biodiversity Information Outlook - Delivering Biodiversity Knowledge in the Information Age. GBIF Secretariat, 2013.

HIT, Acessado em abril de 2014.

INDE, Acessado em abril de 2014.

IPCC, Acessado em abril de 2014.

IPT, Acessado em abril de 2014.

Jones MB et al., 2006. The new bioinformatics: integrating ecological data from the gene to the biosphere. Annual Review of Ecology, Evolution, and Systematics, 37:519-44.

KNB, Acessado em abril de 2014.

LTER, Acessado em abril de 2014.

Michener, W., J. Porter, M. Servilla, & K. Vanderbilt. Long Term Ecological Research and Information Management. Ecological Informatics 6, no. 1 (2011): 13–24.

Michener, W. K. et al. Participatory design of DataONE—Enabling cyberinfrastructure for the biological and environmental sciences. Ecological Informatics 11, 5–15 (2012).

Muñoz, M. et al. openModeller: a generic approach to species’ potential distribution modelling. GeoInformatica 15, 111–135 (2011).

Phillips, S. J., Dudík, M., & Schapire, R. E. (2004). A maximum entropy approach to species distribution modeling. In Twenty-first International Conference on Machine Learning - ICML ’04 (p. 83). ACM Press.

Portal de Espécies e Ocorrências, SiBBr (versão de homologação). Acessado em abril de 2014.

SiBBr Github. Acessado em abril de 2014.

SiB Colombia. Acessado em abril de 2014.

SINAPAD, Acessado em abril de 2014.

speciesLink. Acessado em abril de 2014.

Soberón, Jorge, e Townsend Peterson. Biodiversity Informatics: Managing and Applying Primary Biodiversity Data. Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences 359, no. 1444 (2004): 689–698.

Townsend Peterson, A. et al. (2011). Ecological Niches and Geographic Distributions (p. 328). Princeton University Press.

Wieczorek, John et al.. Darwin Core: An Evolving Community-Developed Biodiversity Data Standard. PLoS ONE 7, no. 1 (2012): e29715.

Wilde, M. et al. (2011). Swift: A language for distributed parallel scripting. Parallel Computing, 37(9), 633–652.
GADELHA, Luiz et al. SiBBr: Uma Infraestrutura para Coleta, Integração e Análise de Dados sobre a Biodiversidade Brasileira. In: BRAZILIAN E-SCIENCE WORKSHOP (BRESCI), 8. , 2014, Brasília. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2014 . p. 37-44. ISSN 2763-8774.