SiBBr: Uma Infraestrutura para Coleta, Integração e Análise de Dados sobre a Biodiversidade Brasileira
Resumo
Neste artigo descrevemos o Sistema de Informação sobre a Biodiversidade Brasileira, que tem como objetivo fornecer uma infraestrutura para coleta, integração e análise de dados produzidos e disponibilizados por diversas instituições da área. A arquitetura de software do sistema é descrita, bem como o fluxo de coleta e indexação de dados de ocorrências e listas de espécies, um dos componentes já implementados. É apresentada a implementação de um workflow científico escalável para a modelagem da distribuição de espécies, uma das aplicações mais utilizadas na análise da biodiversidade. Finalmente, são descritos trabalhos em andamento como a integração de dados socioeconômicos e o gerenciamento de dados ecológicos.
Referências
ALA. http://www.ala.org.au. Acessado em abril de 2014.
BioMetada. http://service.ncddc.noaa.gov/rdn/www/metadata-standards/documents/BIO - Metadata.pdf. Acessado em abril de 2014.
Cardinale, B. J et al. (2012). Biodiversity loss and its impact on humanity. Nature, 486(7401), 59–67.
CBD, http://www.cbd.int. Acessada em abril de 2014.
Chapin III, F. Stuart et al. Consequences of Changing Biodiversity. Nature 405, no. 6783 (2000): 234–242.
DataONE, http://www.dataone.org. Acessado em abril de 2014.
Deelman, E., D. Gannon, M. Shields, and I. Taylor. Workflows and e-Science: An Overview of Workflow System Features and Capabilities. Future Generation Computer Systems 25, no. 5 (2009): 528–540.
Drucker, D. P. (2011, Julho). Avanços na Integração e Gerenciamento de Dados Ecológicos. Natureza & Conservação, 9(1), pp. 115-120.
Edwards, J. L. (2000). Interoperability of Biodiversity Databases: Biodiversity Information on Every Desktop. Science, 289(5488), 2312–2314.
Fegraus, E. et al. Maximizing the Value of Ecological Data with Structured Metadata: An Introduction to Ecological Metadata Language (EML) and Principles for Metadata Creation. Bull. of the Ecological Society of America 86 (2005): 158–168.
Gadelha, L. et al. (2012). MTCProv: a practical provenance query framework for manytask scientific computing. Distributed and Parallel Databases, 30(5-6), 351–370.
GBIF, http://www.gbif.org. Acessado em abril de 2014.
GeoNetwork, http://geonetwork-opensource.org/. Acessado em abril de 2014.
Gomes, A. T. A., Bastos, B. F., Medeiros, V., & Moreira, V. M. (2014). Experiences of the Brazilian national high-performance computing network on the rapid prototyping of science gateways. Concurrency and Computation: Practice and Experience.
Halperin, D. et al. (2013). Real-time collaborative analysis with (almost) pure SQL: a case study in biogeochemical oceanography. In Proceedings of the 25th International Conference on Scientific and Statistical Database Management – SSDBM. ACM.
Hobern, D. et al. Global Biodiversity Information Outlook - Delivering Biodiversity Knowledge in the Information Age. GBIF Secretariat, 2013.
HIT, https://code.google.com/p/gbif-indexingtoolkit/. Acessado em abril de 2014.
INDE, http://www.inde.gov.br. Acessado em abril de 2014.
IPCC, http://www.ipcc.ch. Acessado em abril de 2014.
IPT, https://code.google.com/p/gbif-providertoolkit/. Acessado em abril de 2014.
Jones MB et al., 2006. The new bioinformatics: integrating ecological data from the gene to the biosphere. Annual Review of Ecology, Evolution, and Systematics, 37:519-44.
KNB, https://knb.ecoinformatics.org/. Acessado em abril de 2014.
LTER, http://www.ilternet.edu/. Acessado em abril de 2014.
Michener, W., J. Porter, M. Servilla, & K. Vanderbilt. Long Term Ecological Research and Information Management. Ecological Informatics 6, no. 1 (2011): 13–24.
Michener, W. K. et al. Participatory design of DataONE—Enabling cyberinfrastructure for the biological and environmental sciences. Ecological Informatics 11, 5–15 (2012).
Muñoz, M. et al. openModeller: a generic approach to species’ potential distribution modelling. GeoInformatica 15, 111–135 (2011).
Phillips, S. J., Dudík, M., & Schapire, R. E. (2004). A maximum entropy approach to species distribution modeling. In Twenty-first International Conference on Machine Learning - ICML ’04 (p. 83). ACM Press.
Portal de Espécies e Ocorrências, SiBBr (versão de homologação). http://gbif.sibbr.gov.br/portal. Acessado em abril de 2014.
SiBBr Github. http://gihub.com/sibbr. Acessado em abril de 2014.
SiB Colombia. http://www.sib-colombia.net. Acessado em abril de 2014.
SINAPAD, http://www.lncc.br/sinapad. Acessado em abril de 2014.
speciesLink. http://splink.cria.org.br. Acessado em abril de 2014.
Soberón, Jorge, e Townsend Peterson. Biodiversity Informatics: Managing and Applying Primary Biodiversity Data. Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences 359, no. 1444 (2004): 689–698.
Townsend Peterson, A. et al. (2011). Ecological Niches and Geographic Distributions (p. 328). Princeton University Press.
Wieczorek, John et al.. Darwin Core: An Evolving Community-Developed Biodiversity Data Standard. PLoS ONE 7, no. 1 (2012): e29715.
Wilde, M. et al. (2011). Swift: A language for distributed parallel scripting. Parallel Computing, 37(9), 633–652.