Cured and Enriched Datasets from the National Vaccination Campaign Against COVID-19
Abstract
The COVID-19 pandemic is a global threat. If, on the one hand, we account for many losses, on the other hand, the generation of datasets and urgent analytical demands has accelerated. Among the combat strategies, vaccination and data-centered epidemiological investigations stand out. This dataset paper presents the process of building cured and annotated datasets with provenance metadata. The main dataset is based on the registration data of the Vaccination Campaign against COVID-19 in Brazil. The dataset contains thousands of records processed up to March 2021. The data were analyzed, investigated, treated and cross-checked with other sources, in order to correct and complement them, resulting in cured datasets and aligned to the FAIR principles.
Keywords:
Data Science, COVID-19, Data Provenance, FAIR, Workflows, Data paper
References
Barbosa Pina, D., Kunstmann, L., de Oliveira, D., Valduriez, P., and Mattoso, M. (2020). Uma abordagem para coleta e analise de dados de configurações em redes neurais profundas. In Proceedings of 2nd SBBD DSW, pages 187–192.
Buneman, P., Khanna, S., and Wang-Chiew, T. (2001). Why and where: A characterization of data provenance. In International conference on database theory, pages 316–330. Springer.
Clarindo, J. P., Fontes, W., and Coutinho, F. (2020). Qualisus: um dataset sobre dados da saude pública no brasil. In Proceedings of 2nd SBBD DSW, pages 418–428.
Martins, W. A., de Oliveira, G. M. M., Brandao, A. A., Mourilhe-Rocha, R., Mesquita, E. T., Saraiva, J. F. K., Bacal, F., and Lopes, M. A. C. Q. (2021). Vacinação do Cardiopata contra COVID-19: As Razões da Prioridade. Arquivos Brasileiros de Cardiologia, 116:213 – 218.
Mathieu, E., Ritchie, H., Ortiz-Ospina, E., Roser, M., Hasell, J., Appel, C., Giattino, C., and Rodes-Guirao, L. (2021). A global database of covid-19 vaccinations. Nature human behaviour, pages 1–7.
Ministerio da Saúde - Brasil (2021). Portaria nº 69, de 14 de janeiro de 2021. Institui a obrigatoriedade de registro de aplicação de vacinas contra a covid-19 nos sistemas de informação do ministério da saúde. [Acessado em 13 abr. 2021].
Missier, P., Belhajjame, K., and Cheney, J. (2013). The w3c prov family of specifications for modelling provenance metadata. In Proceedings of the 16th International Conference on Extending Database Technology, pages 773–776.
Oliveira, L. A., Muraro, R., Cristina, A. P., Andrade, A., Cecconello, S., and Lalucci, M. M. (2021). Vacinação contra a covid-19 em mato grosso: primeiros resultados. Nota Tecnica - Universidade Federal de Mato Grosso.
Rocha, T. A. H., Boitrago, G. M., Monica, R. B., Almeida, D. G. d., Silva, N. C. d., Silva, D. M., Terabe, S. H., Staton, C., Facchini, L. A., and Vissoci, J. R. N. (2021). Plano nacional de vacinação contra a covid-19: uso de inteligência artificial espacial para superação de desafios. Ciencia & Saude Coletiva, 26:1885–1898.
Sikos, L. F. and Philp, D. (2020). Provenance-aware knowledge representation: A survey of data models and contextualized knowledge graphs. Data Science and Engineering, 5:293–316.
Squire, M. (2015). Clean Data: Save time by discovering effortless strategies for cleaning, organizing, and manipulating your data. Birmingham, Packt Publishing Ltd.
Wilkinson, M. D., Dumontier, M., Aalbersberg, I. J., Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., da Silva Santos, L. B., Bourne, P. E., et al. (2016). The fair guiding principles for scientific data management and stewardship. Scientific data, 3(1):1–9.
Buneman, P., Khanna, S., and Wang-Chiew, T. (2001). Why and where: A characterization of data provenance. In International conference on database theory, pages 316–330. Springer.
Clarindo, J. P., Fontes, W., and Coutinho, F. (2020). Qualisus: um dataset sobre dados da saude pública no brasil. In Proceedings of 2nd SBBD DSW, pages 418–428.
Martins, W. A., de Oliveira, G. M. M., Brandao, A. A., Mourilhe-Rocha, R., Mesquita, E. T., Saraiva, J. F. K., Bacal, F., and Lopes, M. A. C. Q. (2021). Vacinação do Cardiopata contra COVID-19: As Razões da Prioridade. Arquivos Brasileiros de Cardiologia, 116:213 – 218.
Mathieu, E., Ritchie, H., Ortiz-Ospina, E., Roser, M., Hasell, J., Appel, C., Giattino, C., and Rodes-Guirao, L. (2021). A global database of covid-19 vaccinations. Nature human behaviour, pages 1–7.
Ministerio da Saúde - Brasil (2021). Portaria nº 69, de 14 de janeiro de 2021. Institui a obrigatoriedade de registro de aplicação de vacinas contra a covid-19 nos sistemas de informação do ministério da saúde. [Acessado em 13 abr. 2021].
Missier, P., Belhajjame, K., and Cheney, J. (2013). The w3c prov family of specifications for modelling provenance metadata. In Proceedings of the 16th International Conference on Extending Database Technology, pages 773–776.
Oliveira, L. A., Muraro, R., Cristina, A. P., Andrade, A., Cecconello, S., and Lalucci, M. M. (2021). Vacinação contra a covid-19 em mato grosso: primeiros resultados. Nota Tecnica - Universidade Federal de Mato Grosso.
Rocha, T. A. H., Boitrago, G. M., Monica, R. B., Almeida, D. G. d., Silva, N. C. d., Silva, D. M., Terabe, S. H., Staton, C., Facchini, L. A., and Vissoci, J. R. N. (2021). Plano nacional de vacinação contra a covid-19: uso de inteligência artificial espacial para superação de desafios. Ciencia & Saude Coletiva, 26:1885–1898.
Sikos, L. F. and Philp, D. (2020). Provenance-aware knowledge representation: A survey of data models and contextualized knowledge graphs. Data Science and Engineering, 5:293–316.
Squire, M. (2015). Clean Data: Save time by discovering effortless strategies for cleaning, organizing, and manipulating your data. Birmingham, Packt Publishing Ltd.
Wilkinson, M. D., Dumontier, M., Aalbersberg, I. J., Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., da Silva Santos, L. B., Bourne, P. E., et al. (2016). The fair guiding principles for scientific data management and stewardship. Scientific data, 3(1):1–9.
Published
2021-10-04
How to Cite
GONÇALVES, Marcus Vinicius Ferreira; DOS SANTOS, Jamile Santos; FERREIRA, Caio Zava; ZAVALETA, Jorge; CRUZ, Sérgio Manuel Serra da; SAMPAIO, Jonice Oliveira.
Cured and Enriched Datasets from the National Vaccination Campaign Against COVID-19. In: DATASET SHOWCASE WORKSHOP (DSW), 3. , 2021, Rio de Janeiro.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2021
.
p. 148-159.
DOI: https://doi.org/10.5753/dsw.2021.17423.
