Métricas e Critérios de Disparo para Instrumentar o Balanceamento de Réplicas no HDFS

  • Rhauani Weber Aita Fazul UFSM
  • Patrícia Pitthan Barcelos UFSM

Resumo


O HDFS Balancer é a solução nativa do Apache Hadoop para o balanceamento de dados por meio de rearranjo de réplicas. Atualmente, é responsabilidade do administrador do sistema monitorar o estado do HDFS e, quando necessário, executar o balanceador. Este trabalho elenca um conjunto de métricas de interesse e critérios de disparo para que o processo de balanceamento de réplicas no HDFS se torne transparente. Por meio das definições apresentadas, as decisões do melhor momento para disparo do HDFS Balancer podem ser automatizadas, removendo a necessidade de intervenção manual.

Referências

Fazul, R. W. A. and Barcelos, P. P. (2022). An event-driven strategy for reactive replica balancing on apache hadoop distributed file system. In Proceedings of the 37th Annual ACM Symposium on Applied Computing. (no prelo).

Shvachko, K., Kuang, H., Radia, S., and Chansler, R. (2010). The hadoop distributed file system. In 2010 IEEE 26th Symposium on Mass Storage Systems and Technologies (MSST), pages 1–10. IEEE.

White, T. (2015). Hadoop: The Definitive Guide. O’Reilly Media, Inc., 4th edition.
Publicado
18/04/2022
FAZUL, Rhauani Weber Aita; BARCELOS, Patrícia Pitthan. Métricas e Critérios de Disparo para Instrumentar o Balanceamento de Réplicas no HDFS. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO SUL (ERAD-RS), 22. , 2022, Curitiba. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 83-84. ISSN 2595-4164. DOI: https://doi.org/10.5753/eradrs.2022.19173.