Evolução Incremental de Esquemas de Banco de Dados Orientado a Documentos
Resumo
Os bancos de dados NoSQL desempenham um papel crucial, oferecendo flexibilidade na gestão de diversos tipos de dados. No entanto, a gestão eficiente desses dados apresenta desafios devido à ausência ou desatualização de esquemas pré-definidos. Este artigo propõe uma abordagem para a evolução incremental de esquemas em bancos de dados NoSQL orientados a documentos, visando manter os esquemas atualizados com base em novos documentos inseridos. Os resultados experimentais mostram que a abordagem consegue ser mais rápida do que a abordagem em lote que precisa ser aplicada em todo o conjunto de dados (novos e antigos), sendo em média 1,93 e 2,85 vezes mais rápida para conjuntos de dados de metadados de livros e Twitter, respectivamente.
Palavras-chave:
Evolução Incremental de Esquemas, Esquema JSON, NoSQL, Banco de Dados Orientado a Documentos
Referências
Abdelhédi, F., Rajhi, H., and Zurfluh, G. (2022). Extraction process of the logical schema of a document-oriented nosql database. In Proceedings of the 10th International Conference on Model-Driven Engineering and Software Development (MODELSWARD 2022), pages 61–71.
Amorim, A., Murrugarra-Llerena, N., Silva, V., de Oliveira, D., and Paes, A. (2022). Modelagem de tópicos em textos curtos: uma avaliação experimental. In Anais do XXXVII Simpósio Brasileiro de Bancos de Dados, pages 254–266, Porto Alegre, RS, Brasil. SBC.
Atmatzides, N., Bedo, M., and de Oliveira, D. (2022). Adoção de sgbds nosql em empresas brasileiras: um levantamento preliminar. In Anais do XXXVII Simpósio Brasileiro de Bancos de Dados, pages 385–390, Porto Alegre, RS, Brasil. SBC.
Baazizi, M.-A., Colazzo, D., Ghelli, G., and Sartiani, C. (2019). Parametric schema inference for massive json datasets. The VLDB Journal, 28:497–521.
Cánovas Izquierdo, J. L. and Cabot, J. (2013). Discovering implicit schemas in json data. In Web Engineering: 13th International Conference, ICWE 2013, Aalborg, Denmark, July 8-12, 2013. Proceedings 13, pages 68–83. Springer.
Foundation, P. S. (2024). Deepdiff: Deep difference and search of any python object/data. recreate objects by adding deltas to each other. Accessed: 2024-07-26.
Frozza, A. A., dos Santos Mello, R., and da Costa, F. d. S. (2018). An approach for schema extraction of json and extended json document collections. In IEEE International Conference on Information Reuse and Integration (IRI), pages 356–363.
Hashem, H. and Ranc, D. (2016). Evaluating nosql document oriented data model. In 2016 IEEE 4th International Conference on Future Internet of Things and Cloud Workshops (FiCloudW), pages 51–56.
Izquierdo, J. L. C. and Cabot, J. (2016). Jsondiscoverer: Visualizing the schema lurking behind json documents. Knowledge-Based Systems, 103:52–55.
Klettke, M., Awolin, H., Störl, U., Müller, D., and Scherzinger, S. (2017). Uncovering the evolution history of data lakes. In 2017 IEEE international conference on big data (Big Data), pages 2462–2471. IEEE.
Latták, I. V. and Koupil, P. (2022). A comparative analysis of json schema inference algorithms. In Proceedings of the 17th International Conference on Evaluation of Novel Approaches to Software Engineering (ENASE 2022), pages 379–386.
Li, X., Sun, L., Ling, M., and Peng, Y. (2023). A survey of graph neural network based recommendation in social networks. Neurocomputing, 549:126441.
Phillips, J. (2016). Ecommerce analytics: analyze and improve the impact of your digital strategy. FT Press.
Purnomo, Y. J. (2023). Digital marketing strategy to increase sales conversion on e-commerce platforms. Journal of Contemporary Administration and Management (ADMAN), 1(2):54–62.
Sevilla Ruiz, D., Morales, S. F., and García Molina, J. (2015). Inferring versioned schemas from nosql databases and its applications. In Conceptual Modeling: 34th International Conference, ER 2015, Stockholm, Sweden, October 19-22, 2015, Proceedings 34, pages 467–480. Springer.
Amorim, A., Murrugarra-Llerena, N., Silva, V., de Oliveira, D., and Paes, A. (2022). Modelagem de tópicos em textos curtos: uma avaliação experimental. In Anais do XXXVII Simpósio Brasileiro de Bancos de Dados, pages 254–266, Porto Alegre, RS, Brasil. SBC.
Atmatzides, N., Bedo, M., and de Oliveira, D. (2022). Adoção de sgbds nosql em empresas brasileiras: um levantamento preliminar. In Anais do XXXVII Simpósio Brasileiro de Bancos de Dados, pages 385–390, Porto Alegre, RS, Brasil. SBC.
Baazizi, M.-A., Colazzo, D., Ghelli, G., and Sartiani, C. (2019). Parametric schema inference for massive json datasets. The VLDB Journal, 28:497–521.
Cánovas Izquierdo, J. L. and Cabot, J. (2013). Discovering implicit schemas in json data. In Web Engineering: 13th International Conference, ICWE 2013, Aalborg, Denmark, July 8-12, 2013. Proceedings 13, pages 68–83. Springer.
Foundation, P. S. (2024). Deepdiff: Deep difference and search of any python object/data. recreate objects by adding deltas to each other. Accessed: 2024-07-26.
Frozza, A. A., dos Santos Mello, R., and da Costa, F. d. S. (2018). An approach for schema extraction of json and extended json document collections. In IEEE International Conference on Information Reuse and Integration (IRI), pages 356–363.
Hashem, H. and Ranc, D. (2016). Evaluating nosql document oriented data model. In 2016 IEEE 4th International Conference on Future Internet of Things and Cloud Workshops (FiCloudW), pages 51–56.
Izquierdo, J. L. C. and Cabot, J. (2016). Jsondiscoverer: Visualizing the schema lurking behind json documents. Knowledge-Based Systems, 103:52–55.
Klettke, M., Awolin, H., Störl, U., Müller, D., and Scherzinger, S. (2017). Uncovering the evolution history of data lakes. In 2017 IEEE international conference on big data (Big Data), pages 2462–2471. IEEE.
Latták, I. V. and Koupil, P. (2022). A comparative analysis of json schema inference algorithms. In Proceedings of the 17th International Conference on Evaluation of Novel Approaches to Software Engineering (ENASE 2022), pages 379–386.
Li, X., Sun, L., Ling, M., and Peng, Y. (2023). A survey of graph neural network based recommendation in social networks. Neurocomputing, 549:126441.
Phillips, J. (2016). Ecommerce analytics: analyze and improve the impact of your digital strategy. FT Press.
Purnomo, Y. J. (2023). Digital marketing strategy to increase sales conversion on e-commerce platforms. Journal of Contemporary Administration and Management (ADMAN), 1(2):54–62.
Sevilla Ruiz, D., Morales, S. F., and García Molina, J. (2015). Inferring versioned schemas from nosql databases and its applications. In Conceptual Modeling: 34th International Conference, ER 2015, Stockholm, Sweden, October 19-22, 2015, Proceedings 34, pages 467–480. Springer.
Publicado
14/10/2024
Como Citar
RODRIGUES, Eleonilia Monteiro; PIRES, Carlos Eduardo S.; N. FILHO, Dimas Cassimiro do.
Evolução Incremental de Esquemas de Banco de Dados Orientado a Documentos. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 39. , 2024, Florianópolis/SC.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2024
.
p. 260-273.
ISSN 2763-8979.
DOI: https://doi.org/10.5753/sbbd.2024.240265.