Datasets Curados e Enriquecidos com Proveniência da Campanha Nacional de Vacinação Contra COVID-19

  • Marcus Vinicius Ferreira Gonçalves Universidade Federal do Rio de Janeiro (UFRJ) / Fundação Oswaldo Cruz (Fiocruz) http://orcid.org/0000-0001-9550-9624
  • Jamile Santos dos Santos Universidade Federal do Rio de Janeiro http://orcid.org/0000-0002-6422-6127
  • Caio Zava Ferreira Universidade Federal do Rio de Janeiro
  • Jorge Zavaleta Universidade Federal do Rio de Janeiro https://orcid.org/0000-0002-4747-8613
  • Sérgio Manuel Serra da Cruz Universidade Federal do Rio de Janeiro / Universidade Federal Rural do Rio de Janeiro
  • Jonice Oliveira Sampaio Universidade Federal do Rio de Janeiro

Resumo


A pandemia da COVID-19 é uma ameaça global. Se, por um lado, contabilizamos muitas perdas de vidas, por outro lado tem-se acelerado a geração de datasets e demandas analíticas urgentes. Dentre as estratégias de combate, destacam-se a vacinação e as investigações epidemiológicas centradas em dados. Este artigo apresenta o processo de construção de datasets curados e anotados com metadados de proveniência retrospectiva, tendo como base os dados de registro da Campanha de Vacinação contra COVID-19 no Brasil. O dataset contém milhares de registros tratados até Março de 2021. Os dados foram analisados, investigados, tratados e cruzados com outras fontes, de modo a corrigi-los e complementá-los, resultando em datasets curados e alinhados aos princípios FAIR.
Palavras-chave: Ciência de Dados, COVID-19, Proveniência de Dados, FAIR, Workflows, Data paper

Referências

Barbosa Pina, D., Kunstmann, L., de Oliveira, D., Valduriez, P., and Mattoso, M. (2020). Uma abordagem para coleta e analise de dados de configurações em redes neurais profundas. In Proceedings of 2nd SBBD DSW, pages 187–192.

Buneman, P., Khanna, S., and Wang-Chiew, T. (2001). Why and where: A characterization of data provenance. In International conference on database theory, pages 316–330. Springer.

Clarindo, J. P., Fontes, W., and Coutinho, F. (2020). Qualisus: um dataset sobre dados da saude pública no brasil. In Proceedings of 2nd SBBD DSW, pages 418–428.

Martins, W. A., de Oliveira, G. M. M., Brandao, A. A., Mourilhe-Rocha, R., Mesquita, E. T., Saraiva, J. F. K., Bacal, F., and Lopes, M. A. C. Q. (2021). Vacinação do Cardiopata contra COVID-19: As Razões da Prioridade. Arquivos Brasileiros de Cardiologia, 116:213 – 218.

Mathieu, E., Ritchie, H., Ortiz-Ospina, E., Roser, M., Hasell, J., Appel, C., Giattino, C., and Rodes-Guirao, L. (2021). A global database of covid-19 vaccinations. Nature human behaviour, pages 1–7.

Ministerio da Saúde - Brasil (2021). Portaria nº 69, de 14 de janeiro de 2021. Institui a obrigatoriedade de registro de aplicação de vacinas contra a covid-19 nos sistemas de informação do ministério da saúde. [Acessado em 13 abr. 2021].

Missier, P., Belhajjame, K., and Cheney, J. (2013). The w3c prov family of specifications for modelling provenance metadata. In Proceedings of the 16th International Conference on Extending Database Technology, pages 773–776.

Oliveira, L. A., Muraro, R., Cristina, A. P., Andrade, A., Cecconello, S., and Lalucci, M. M. (2021). Vacinação contra a covid-19 em mato grosso: primeiros resultados. Nota Tecnica - Universidade Federal de Mato Grosso.

Rocha, T. A. H., Boitrago, G. M., Monica, R. B., Almeida, D. G. d., Silva, N. C. d., Silva, D. M., Terabe, S. H., Staton, C., Facchini, L. A., and Vissoci, J. R. N. (2021). Plano nacional de vacinação contra a covid-19: uso de inteligência artificial espacial para superação de desafios. Ciencia & Saude Coletiva, 26:1885–1898.

Sikos, L. F. and Philp, D. (2020). Provenance-aware knowledge representation: A survey of data models and contextualized knowledge graphs. Data Science and Engineering, 5:293–316.

Squire, M. (2015). Clean Data: Save time by discovering effortless strategies for cleaning, organizing, and manipulating your data. Birmingham, Packt Publishing Ltd.

Wilkinson, M. D., Dumontier, M., Aalbersberg, I. J., Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., da Silva Santos, L. B., Bourne, P. E., et al. (2016). The fair guiding principles for scientific data management and stewardship. Scientific data, 3(1):1–9.
Publicado
04/10/2021
GONÇALVES, Marcus Vinicius Ferreira; DOS SANTOS, Jamile Santos; FERREIRA, Caio Zava; ZAVALETA, Jorge; CRUZ, Sérgio Manuel Serra da; SAMPAIO, Jonice Oliveira. Datasets Curados e Enriquecidos com Proveniência da Campanha Nacional de Vacinação Contra COVID-19. In: DATASET SHOWCASE WORKSHOP (DSW), 3. , 2021, Rio de Janeiro. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 148-159. DOI: https://doi.org/10.5753/dsw.2021.17423.