Extração de Esquemas de Documentos JSON: O que há de Novo?
Resumo
JavaScript Object Notation (JSON) tem se difundido de forma rápida e universal sendo um dos formatos mais utilizados para trocar e publicar dados. Ele é caracterizado por não ter um esquema rígido associado aos dados armazenados. Assim, neste sentido, este trabalho tem como objetivo estender o mapeamento sistemático realizado em [Imhof et al. 2017] para apresentar o que há de novo em termos de abordagens e técnicas para extrair esquemas de documentos JSON. Foram analisados sete trabalhos e verificado que a área de extração de esquemas JSON é bastante ativa e novos conceitos de extração tem surgido e.g, abordagens baseadas em aprendizado de máquina.Referências
Abdelhedi, F., Brahim, A. A., Rajhi, H., Ferhat, R. T., and Zurfluh, G. (2021). Automatic extraction of a document-oriented nosql schema. In ICEIS (1), pages 192-199.
Baazizi, M.-A., Colazzo, D., Ghelli, G., and Sartiani, C. (2019a). Parametric schema inference for massive json datasets. The VLDB Journal, 28:497-521.
Baazizi, M.-A., Colazzo, D., Ghelli, G., and Sartiani, C. (2019b). Schemas and types for json data: From theory to practice. In SIGMOD/PODS 2019.
Bouchou, B. and Duarte, D. (2007). Assisting XML schema evolution that preserve validity. In Simpósio Brasileiro de Banco de Dados SBBD, pages 270-284.
Bray, T. (2014). The javascript object notation (JSON) data interchange format. Technical report, Datatracker.
Frozza, A. A., dos Santos Mello, R., and da Costa, F. d. S. (2018). An approach for schema extraction of json and extended json document collections. In 2018 IEEE International Conference on Information Reuse and Integration (IRI), pages 356-363. IEEE.
Imhof, R., Frozza, A. A., and dos Santos Mello, R. (2017). Um survey sobre extração de esquemas de documentos json. In Anais da XIII Escola Regional de Banco de Dados. SBC.
Klessinger, S., Klettke, M., Störl, U., and Scherzinger, S. (2022). Extracting json schemas with tagged unions. coordinates, 30:10.
Namba, J. (2021). Enhancing json schema discovery by uncovering hidden data. In PhD@ VLDB.
Spoth, W., Kennedy, O., Lu, Y., Hammerschmidt, B., and Liu, Z. H. (2021). Reducing ambiguity in json schema discovery. In Proceedings of the 2021 International Conference on Management of Data, pages 1732-1744.
Thilagam, P. S. et al. (2022). Clustvariants: An approach for schema variants extraction from json document collections. In 2022 IEEE IAS Global Conference on Emerging Technologies (GlobConET), pages 515-520. IEEE.
Zouari, F., Kabachi, N., Boukadi, K., and Ghedira Guegan, C. (2021). Data management in the data lake: A systematic mapping. In Proceedings of the 25th International Database Engineering & Applications Symposium, pages 280-284.
Baazizi, M.-A., Colazzo, D., Ghelli, G., and Sartiani, C. (2019a). Parametric schema inference for massive json datasets. The VLDB Journal, 28:497-521.
Baazizi, M.-A., Colazzo, D., Ghelli, G., and Sartiani, C. (2019b). Schemas and types for json data: From theory to practice. In SIGMOD/PODS 2019.
Bouchou, B. and Duarte, D. (2007). Assisting XML schema evolution that preserve validity. In Simpósio Brasileiro de Banco de Dados SBBD, pages 270-284.
Bray, T. (2014). The javascript object notation (JSON) data interchange format. Technical report, Datatracker.
Frozza, A. A., dos Santos Mello, R., and da Costa, F. d. S. (2018). An approach for schema extraction of json and extended json document collections. In 2018 IEEE International Conference on Information Reuse and Integration (IRI), pages 356-363. IEEE.
Imhof, R., Frozza, A. A., and dos Santos Mello, R. (2017). Um survey sobre extração de esquemas de documentos json. In Anais da XIII Escola Regional de Banco de Dados. SBC.
Klessinger, S., Klettke, M., Störl, U., and Scherzinger, S. (2022). Extracting json schemas with tagged unions. coordinates, 30:10.
Namba, J. (2021). Enhancing json schema discovery by uncovering hidden data. In PhD@ VLDB.
Spoth, W., Kennedy, O., Lu, Y., Hammerschmidt, B., and Liu, Z. H. (2021). Reducing ambiguity in json schema discovery. In Proceedings of the 2021 International Conference on Management of Data, pages 1732-1744.
Thilagam, P. S. et al. (2022). Clustvariants: An approach for schema variants extraction from json document collections. In 2022 IEEE IAS Global Conference on Emerging Technologies (GlobConET), pages 515-520. IEEE.
Zouari, F., Kabachi, N., Boukadi, K., and Ghedira Guegan, C. (2021). Data management in the data lake: A systematic mapping. In Proceedings of the 25th International Database Engineering & Applications Symposium, pages 280-284.
Publicado
11/04/2023
Como Citar
BANHARA, Natália; DUARTE, Denio; SCHREINER, Geomar.
Extração de Esquemas de Documentos JSON: O que há de Novo?. In: ESCOLA REGIONAL DE BANCO DE DADOS (ERBD), 18. , 2023, Palmas/PR.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2023
.
p. 11-20.
ISSN 2595-413X.
DOI: https://doi.org/10.5753/erbd.2023.229421.