MapReduce vs Bancos de Dados Paralelos no cálculo de medidas de centralidade em grafos

  • Fabiano Fernandes FACCAMP
  • Eduardo Yero FACCAMP

Resumo


Os últimos anos têm visto uma explosão sem precedentes na quantidade de dados gerados. Muitos destes dados podem ser modelados através de grafos, principalmente aqueles provenientes de redes sociais. Este artigo analisa a efetividade de dois paradigmas: o modelo MapReduce e os Sistemas de Gerenciamento de Bancos de Dados Paralelos (SGBD paralelo) para cálculo de medidas de centralidade em grafos (raio e diâmetro). Resultados preliminares indicam que os SGBD paralelos conseguem calcular as medidas de centralidade de forma mais eficiente do que as soluções baseadas em MapReduce.

Referências

Balouek, D., Lèbre, A., & Quesnel, F. (2013). Flauncher and DVMS -- Deploying and Scheduling Thousands of Virtual Machines on Hundreds of Nodes Distributed Geographically. Finalist of the IEEE International Scalable Computing Challenge (SCALE 2013).

Dean, J., & Ghemawat, S. (2008). MapReduce: Simplied Data Processing on Large Clusters. ACM Digital Library, 107-113.

Del Vecchio, R., Lima, L., Galvão, D., & Loures, R. (2009). Medidas de Centralidade da Teoria dos Grafos aplicada a Fundos de Ações no Brasil. XLI Simpósio Brasileiro de Pesquisa Operacional, Porto Seguro.

Nascimento, J. P., & Murta, C. (2012). Um algoritmo paralelo em Hadoop para Cálculo de Centralidade em Grafos Grandes. XXX Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos. Ouro Preto: SBC.

Stonebraker, M., Abadi, D., DeWitt, D., & Madden, S. (2010). MapReduce and parallel DBMSs: friends or foes? Communications of the ACM. 53(1):64-71.
Publicado
28/07/2014
FERNANDES, Fabiano; YERO, Eduardo. MapReduce vs Bancos de Dados Paralelos no cálculo de medidas de centralidade em grafos. In: WORKSHOP EM DESEMPENHO DE SISTEMAS COMPUTACIONAIS E DE COMUNICAÇÃO (WPERFORMANCE), 13. , 2014, Brasília. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2014 . p. 198-202. ISSN 2595-6167.