Criação de Planos de Gestão de Dados em Projetos de Ciência de Dados para Detecção de Fake News Apoiados pelos princípios FAIR
Resumo
Pesquisadores da área de Ciência de Dados vivenciam uma realidade cada vez mais multifacetada no que diz respeito à governança de dados. Mudança do paradigma de silos de dados desconectados para planos de gestão de dados (PGD) e repositórios padronizados online aderentes aos princípios FAIR ainda não é uma realidade. Este texto discute, compara plataformas e, descreve o percurso semi-automatizado de criação PGD, com aplicação em projetos de Machine Learning adotados na detecção de Fake News. Como resultados, oferecemos um trajeto para elaboração de PGDs na plataforma DS-Wizard e a oferta de um artigo do tipo executável sobre o projeto que pode ser executado pelos leitores.
Palavras-chave:
Plano de gestão de dados, fake-news, princípios Fair, métodos de Machine Learning
Referências
Aguia. Plano de Gestão de Dados. Agência USP de Gestão Da Informação Acadêmica. https://www.aguia.usp.br/apoio-pesquisador/dados-pesquisa/planogestao-dados-2/, 2021.
Argos. Argos - Tool for Data Management Plan. https://argos.openaire.eu/splash/. 2021.
DataFirst. Welcome DataFirst. DataFirst. https://datafirst.uct.ac.za/. 2021.
DDI. Data Document Initiative. Document, Discover and Interoperate. https://ddialliance.org/. 2021.
DLS. Stages of Research Data Management: Share & Publish. Digital Library Services. http://www.digitalservices.lib.uct.ac.za/dls/services/rdm/sharepublish. 2021.
Dmptool. dmptool: Build your Data Management Plan. https://dmptool.org/about_us. 2021.
DOI. Digital Object Identifier System. The DOI System. https://www.doi.org/index.html, 2021.
Ds-wizard. Data Stewardship Wizard. DSW. https://ds-wizard.org/, 2021.
Dublin Core. Dublin Core. Innovation in Metadata Design, Implementation & Best Practice: Dublin Core Metadata Initiative. https://dublincore.org/specifications/dublin-core/, 2021.
European Commission. H2020 Programme. Guidelines on FAIR Data Management in Horizon 2020. [link], 2016.
Fundação Oswaldo Cruz. Grupo de Trabalho em Ciência Aberta. Termo de Referência: Gestão e Abertura de Dados para Pesquisa na Fiocruz. https://www.arca.fiocruz.br/handle/icict/26803, 2018.
Henning, P. C. Não basta um Plano de Gestão de Dados: é preciso ser FAIR. In Icict (Ed.), Encontro da Rede Sudeste de Repositórios Institucionais (Issue 1). Icict. https://www.arca.fiocruz.br/handle/icict/33372, 2019.
Karimova, Y., Ribeiro, C., and David, G. Institutional Support for Data Management Plans: Five Case Studies. Metadata and Semantic Research: 14th International Conference, MTSR 2020, 1355, 308–319. https://doi.org/10.1007/978-3-030-71903-6_29, 2021.
Koers, H., Bangert, D., Hermans, E., van Horik, R., de Jong, M., and Mokrane, M. Recommendations for Services in a FAIR Data Ecosystem. Patterns, 1(5), 100058. https://doi.org/10.1016/j.patter.2020.100058, 2020.
Koutkias, V. From Data Silos to Standardized, Linked, and FAIR Data for Pharmacovigilance: Current Advances and Challenges with Observational Healthcare Data. Drug Safety, 42(5), 583–586. https://doi.org/10.1007/s40264-018-00793-z, 2019.
Lefebvre, A., Bakhtiari, B., and Spruit, M. Exploring research data management planning challenges in practice. It - Information Technology, 62(1), 29–37. https://doi.org/10.1515/itit-2019-0029, 2020.
Pasquetto, I. V., Randles, B. M., and Borgman, C. L. On the Reuse of Scientific Data. Data Science Journal, 16(8), 1–9. https://doi.org/10.5334/dsj-2017-008, 2017.
Pergl, R., Hooft, R., Suchánek, M., Knaisl, V., and Slifka, J. "Data Stewardship Wizard": A Tool Bringing Together Researchers, Data Stewards, and Data Experts around Data Management Planning. Data Science Journal, 18(1). https://doi.org/10.5334/dsj-2019-059, 2019.
Sayogo, D. S., and Pardo, T. A. Exploring the determinants of scientific data sharing: Understanding the motivation to publish research data. Government Information Quarterly, 30(SUPPL. 1), S19–S31. https://doi.org/10.1016/j.giq.2012.06.011, 2013.
Simms, S. R., and Jones, S. Next-Generation Data Management Plans: Global, Machine-Actionable, FAIR. International Journal of Digital Curation, 12(1), 36–45. https://doi.org/10.2218/ijdc.v12i1.513, 2017.
Veiga, V. S. de O., Henning, P., Dib, S., Penedo, E., Lima, J. D. C., Silva, L. O. B. da, and Pires, L. F. Plano de gestão de dados fair: uma proposta para a Fiocruz. Liinc Em Revista, 15(2), 275–286. https://doi.org/10.18617/liinc.v15i2.5030, 2019.
Wilkinson, M. D., Dumontier, M., Aalbersberg, Ij. J., Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., da Silva Santos, L. B., Bourne, P. E., Bouwman, J., Brookes, A. J., Clark, T., Crosas, M., Dillo, I., Dumon, O., Edmunds, S., Evelo, C. T., Finkers, R., Mons, B. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 3(1), 160018. https://doi.org/10.1038/sdata.2016. 18, 2016.
Wilkinson, M. D., Verborgh, R., da Silva Santos, L. O. B., Clark, T., Swertz, M. A., Kelpin, F. D. L., Gray, A. J. G., Schultes, E. A., van Mulligen, E. M., Ciccarese, P., Kuzniar, A., Gavai, A., Thompson, M., Kaliyaperumal, R., Bolleman, J. T., and Dumontier, M. Interoperability and FAIRness through a novel combination of Web technologies. PeerJ Computer Science, 2017(4). https://doi.org/10.7717/peerj-cs. 110, 2017.
Williams, M., Bagwell, J., and Nahm Zozus, M. Data management plans: the missing perspective. Journal of Biomedical Informatics, 71, 130–142. https://doi.org/10.1016/j.jbi.2017.05.004, 2017.
Argos. Argos - Tool for Data Management Plan. https://argos.openaire.eu/splash/. 2021.
DataFirst. Welcome DataFirst. DataFirst. https://datafirst.uct.ac.za/. 2021.
DDI. Data Document Initiative. Document, Discover and Interoperate. https://ddialliance.org/. 2021.
DLS. Stages of Research Data Management: Share & Publish. Digital Library Services. http://www.digitalservices.lib.uct.ac.za/dls/services/rdm/sharepublish. 2021.
Dmptool. dmptool: Build your Data Management Plan. https://dmptool.org/about_us. 2021.
DOI. Digital Object Identifier System. The DOI System. https://www.doi.org/index.html, 2021.
Ds-wizard. Data Stewardship Wizard. DSW. https://ds-wizard.org/, 2021.
Dublin Core. Dublin Core. Innovation in Metadata Design, Implementation & Best Practice: Dublin Core Metadata Initiative. https://dublincore.org/specifications/dublin-core/, 2021.
European Commission. H2020 Programme. Guidelines on FAIR Data Management in Horizon 2020. [link], 2016.
Fundação Oswaldo Cruz. Grupo de Trabalho em Ciência Aberta. Termo de Referência: Gestão e Abertura de Dados para Pesquisa na Fiocruz. https://www.arca.fiocruz.br/handle/icict/26803, 2018.
Henning, P. C. Não basta um Plano de Gestão de Dados: é preciso ser FAIR. In Icict (Ed.), Encontro da Rede Sudeste de Repositórios Institucionais (Issue 1). Icict. https://www.arca.fiocruz.br/handle/icict/33372, 2019.
Karimova, Y., Ribeiro, C., and David, G. Institutional Support for Data Management Plans: Five Case Studies. Metadata and Semantic Research: 14th International Conference, MTSR 2020, 1355, 308–319. https://doi.org/10.1007/978-3-030-71903-6_29, 2021.
Koers, H., Bangert, D., Hermans, E., van Horik, R., de Jong, M., and Mokrane, M. Recommendations for Services in a FAIR Data Ecosystem. Patterns, 1(5), 100058. https://doi.org/10.1016/j.patter.2020.100058, 2020.
Koutkias, V. From Data Silos to Standardized, Linked, and FAIR Data for Pharmacovigilance: Current Advances and Challenges with Observational Healthcare Data. Drug Safety, 42(5), 583–586. https://doi.org/10.1007/s40264-018-00793-z, 2019.
Lefebvre, A., Bakhtiari, B., and Spruit, M. Exploring research data management planning challenges in practice. It - Information Technology, 62(1), 29–37. https://doi.org/10.1515/itit-2019-0029, 2020.
Pasquetto, I. V., Randles, B. M., and Borgman, C. L. On the Reuse of Scientific Data. Data Science Journal, 16(8), 1–9. https://doi.org/10.5334/dsj-2017-008, 2017.
Pergl, R., Hooft, R., Suchánek, M., Knaisl, V., and Slifka, J. "Data Stewardship Wizard": A Tool Bringing Together Researchers, Data Stewards, and Data Experts around Data Management Planning. Data Science Journal, 18(1). https://doi.org/10.5334/dsj-2019-059, 2019.
Sayogo, D. S., and Pardo, T. A. Exploring the determinants of scientific data sharing: Understanding the motivation to publish research data. Government Information Quarterly, 30(SUPPL. 1), S19–S31. https://doi.org/10.1016/j.giq.2012.06.011, 2013.
Simms, S. R., and Jones, S. Next-Generation Data Management Plans: Global, Machine-Actionable, FAIR. International Journal of Digital Curation, 12(1), 36–45. https://doi.org/10.2218/ijdc.v12i1.513, 2017.
Veiga, V. S. de O., Henning, P., Dib, S., Penedo, E., Lima, J. D. C., Silva, L. O. B. da, and Pires, L. F. Plano de gestão de dados fair: uma proposta para a Fiocruz. Liinc Em Revista, 15(2), 275–286. https://doi.org/10.18617/liinc.v15i2.5030, 2019.
Wilkinson, M. D., Dumontier, M., Aalbersberg, Ij. J., Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., da Silva Santos, L. B., Bourne, P. E., Bouwman, J., Brookes, A. J., Clark, T., Crosas, M., Dillo, I., Dumon, O., Edmunds, S., Evelo, C. T., Finkers, R., Mons, B. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 3(1), 160018. https://doi.org/10.1038/sdata.2016. 18, 2016.
Wilkinson, M. D., Verborgh, R., da Silva Santos, L. O. B., Clark, T., Swertz, M. A., Kelpin, F. D. L., Gray, A. J. G., Schultes, E. A., van Mulligen, E. M., Ciccarese, P., Kuzniar, A., Gavai, A., Thompson, M., Kaliyaperumal, R., Bolleman, J. T., and Dumontier, M. Interoperability and FAIRness through a novel combination of Web technologies. PeerJ Computer Science, 2017(4). https://doi.org/10.7717/peerj-cs. 110, 2017.
Williams, M., Bagwell, J., and Nahm Zozus, M. Data management plans: the missing perspective. Journal of Biomedical Informatics, 71, 130–142. https://doi.org/10.1016/j.jbi.2017.05.004, 2017.
Publicado
01/09/2021
Como Citar
ZAVALETA, Jorge; PINHEIRO, Annatércia; CERCEAU, Renato; LIMA, Cabral; CAMPOS, Maria Luiza Machado; DA CRUZ, Sérgio Manuel Serra.
Criação de Planos de Gestão de Dados em Projetos de Ciência de Dados para Detecção de Fake News Apoiados pelos princípios FAIR. In: ESCOLA REGIONAL DE SISTEMAS DE INFORMAÇÃO DO RIO DE JANEIRO (ERSI-RJ), 7. , 2021, Evento Online.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2021
.
p. 72-79.
DOI: https://doi.org/10.5753/ersirj.2021.16981.