Integrando Bases Autônomas Externas no Processamento de Consultas em Bases RDF Distribuídas

  • Hugo Paulino Bonfim Takiuchi Universidade Federal do Paraná
  • Raqueline Ritter de Moura Penteado Universidade Estadual de Maringá
  • Carmem Satie Hara Universidade Federal do Paraná

Resumo


No modelo RDF, uma consulta pode envolver tanto dados armazenados em bases autônomas de terceiros e acessados através de endpoints SPARQL, bem como dados armazenados em uma base proprietária. Sistemas federados processam esse tipo de consulta acessando as bases externa e proprietária como caixas-pretas. Um moderador envia subconsultas para as bases, que retornam os resultados das requisições. Por outro lado, um sistema RDF tradicional não acessa bases externas, mas utiliza sua base proprietária como caixa-branca, o que permite otimizações nas estratégias de processamento interno do sistema. Este artigo propõe uma alternativa a arquitetura federada, chamada de FeSHyD, que explora uma base proprietária distribuída, permitindo a comunicação dos seus servidores com bases de terceiros durante o processamento de consultas. A proposta promove o processamento paralelo de consultas na base proprietária, descentralizando a tarefa do moderador dos sistemas federados. Experimentos iniciais mostraram que o FeSHyD pode reduzir o tempo de resposta de consultas quando comparado com sistemas federados.

Palavras-chave: Busca federada, consulta SPARQL, bases de dados híbridas distribuídas, integração de sistemas distribuídos, ordenação das subconsultas

Referências

Abdelaziz, I., Mansour, E., Ouzzani, M., Aboulnaga, A., and Kalnis, P. (2017). Lusail: a system for querying linked data at scale. Proc. of the VLDB Endowment, 11(4)

da Cunha, D. R. B. and Loscio, B. F. (2014). oLinDa: uma abordagem para decomposição de consultas em federações de dados interligados. In Anais do XXIX do SBDD

Gorlitz, O. and Staab, S. (2011). Splendid: SPARQL endpoint federation exploiting VoID descriptions. In Proc. of the 2nd Int. Conference on Consuming Linked Data.

Ladwig, G. and Tran, T. (2011). SIHJoin: Querying remote and local linked data. In The Semantic Web: Research and Applications. Springer Berlin Heidelberg.

Nikolov, A., Haase, P., Trame, J., and Kozlov, A. (2017). Ephedra: Efficiently combining RDF data and services using SPARQL federation. In Int. Conference on Knowledge Engineering and the Semantic Web. Springer

Penteado, R. R. M., Takiuchi, H. P. B., and Hara, C. S. (2019). PAbS: Um processador de consultas SPARQL sobre bases distribuídas. In Anais do XXXIV SBDD, Demos track.

Rakhmawati, N. A., Umbrich, J., Karnstedt, M., Hasnain, A., and Hausenblas, M. (2013). Querying over federated SPARQL endpoints-a state of the art survey. ArXiv:1306.1723

Schwarte, A., Haase, P., Hose, K., Schenkel, R., and Schmidt, M. (2011). Fedx: Optimization techniques for federated query processing on linked data. In Int. Semantic Web Conference.
Publicado
28/09/2020
TAKIUCHI, Hugo Paulino Bonfim; PENTEADO, Raqueline Ritter de Moura; HARA, Carmem Satie. Integrando Bases Autônomas Externas no Processamento de Consultas em Bases RDF Distribuídas. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 35. , 2020, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2020 . p. 37-48. ISSN 2763-8979. DOI: https://doi.org/10.5753/sbbd.2020.13623.