Comunicação em bloco na exploração de grafos em bases RDF distribuídas
Resumo
Sistemas RDF distribuídos adotam estratégias de comunicação que trocam resultados intermediários entre servidores durante a execução distribuída de consultas. Este artigo analisa o impacto do agrupamento de resultados intermediários em blocos, com a finalidade de reduzir a quantidade de transmissões. A comunicação em blocos foi implementada em um processador de consultas SPARQL baseado em um algoritmo de exploração de grafos. Resultados experimentais mostram que esta estratégia de comunicação pode melhorar o desempenho de consultas distribuídas. Trabalhos futuros envolvem alterações no processador analisado a fim de considerar o agrupamento no cálculo do custo de comunicação do otimizador de consultas.
Referências
Goasdoué, F., Kaoudi, Z., Manolescu, I., Quiané-Ruiz, J., and Zampetakis, S. (2013). CliqueSquare: efficient Hadoopbased RDF query processing. In BDA’13 - Journées de Bases de Données Avancées.
Ozsu, M. T. and Valduriez, P. (2011). Principles of Distributed Database Systems, 3rd Ed. DOI: https://doi.org/10.1007/978-1-4419-8834-8
Penteado, R. R. M., Schroeder, R., and Hara, C. S. (2016). Exploring controlled RDF distribution. In IEEE CloudCom 2016, Luxembourg, December 12-15, 2016, pages 160–167. DOI: https://doi.org/10.1109/CloudCom.2016.0038
Rohloff (2010). High-performance, Massively Scalable Distributed Systems Using the MapReduce Software Framework: The SHARD Triple-store. In Programming Support Innovations for Emerging Distributed Applications,pages 4:1–4:5, New York, NY, USA. ACM. DOI: https://doi.org/10.1145/1940747.1940751