Armazenamento Otimizado de Dados RDF em um SGBD Relacional
Resumo
Diversas propostas utilizam Sistemas Gerenciadores de Bancos de Dados Relacionais (SGBDRs) para o armazenamento de dados RDF. O mapeamento direto de RDF para uma tabela de triplas resulta em um desempenho ineficiente no processamento de consultas. Este artigo propõe AORR (Armazenamento Otimizado de dados RDF em SGBDR), um método que identifica entidades de dados para gerar tabelas. Além disto, AORR se diferencia de trabalhos relacionados por possibilitar a tradução de consultas SPARQL-SQL, bem como atualizações incrementais da base. Um estudo experimental mostrou que AORR apresenta desempenho superior em consultas, comparado a uma proposta alternativa que também adota o conceito de tabelas de entidades.
Referências
Aluç, G., Ozsu, M. T., and Daudjee, K. (2014). Workload matters: Why rdf databases need a new design. Proceedings of the VLDB Endowment, 7(10):837–840.
Bornea, M., Dolby, J., Kementsietsidis, A., Srinivas, K., Dantressangle, P., Udrea, O., and Bhattacharjee, B. (2013). Building an efficient rdf store over a relational database. In ACM SIGMOD.
He, L., Shao, B., Li, Y., Xia, H., Xiao, Y., Chen, E., and Chen, L. J. (2017). Stylus: A strongly-typed store for serving massive rdf data. Proc. VLDB Endow., 11(2):203–216.
MahmoudiNasab, H. and Sakr, S. (2010). An experimental evaluation of relational rdf storage and querying techniques. In Proc. of DASFAA, pages 215–226.
Pauluk, J. G., Duarte, M. M. G., Prado, R. L., and Hara, C. S. (2018). Processamento de Consultas SPARQL em uma Base Relacional de Entidades. In SBBD - Short Papers.
Penteado, R. R. M., Schroeder, R., and Hara, C. S. (2015). Exploração de grafos RDF com distribuição controlada. In Anais do XXX SBBD - Short Papers, pages 69–74.
Pham, M.-D., Passing, L., Erling, O., and Boncz, P. (2015). Deriving an emergent relational schema from rdf data. Proc. of the 24th WWW Conf., pages 864–874.
Ramunajam, S., Gupta, A., Khan, L., Seida, S., and Thurasaisingham, B. (2009). R2d: Extracting relational structure from rdf stores. In Proc. of the IEEE/ACM WIC, pages 361–366.
Scabora, L. C., Oliveira, P. H., Kaster, D. S., Traina, A. J. M., and Traina-Jr, C. (2017). Relational graph data management on the edge: Grouping vertices’ neighborhood with edge-k. In Anais do XXXII SBBD, pages 124–135.
Zeng, K., Yang, J., Wang, H., Shao, B., and Wang, Z. (2013). A distributed graph engine for web scale rdf data. Proc. of the VLDB Endowment, 6(4):265–276.