Proposta de validação de uma arquitetura para checkpoint din âmico no Apache Hadoop

  • Paulo V. M. Cardoso
  • Patrícia Pitthan Barcelos

Resumo


A análise da eficiência de recuperação de um sistema em determinados cenários de falha é essencial para validar a viabilidade dos mecanismos de tolerância a falhas. Este trabalho propõe uma alternativa dinâmica para o estabelecimento de checkpoints no Apache Hadoop e define um cenário para sua validação com falhas no nó mestre da ferramenta. 1. Introdução Sistemas de alto desempenho devem evitar a ocorrência de erros, tornando-se necessário o emprego de técnicas de tolerância a falhas. O Checkpoint and Recovery (CR) consiste em uma técnica reativa de recuperação de erros por retorno cujo objetivo é conduzir o sistema a uma condição consistente, através do salvamento periódico do seu estado em momentos anteriores a falhas (checkpoint). A recuperação acontece após uma falha e se resume em recuperar o andamento normal do sistema.
Publicado
06/04/2018
CARDOSO, Paulo V. M.; BARCELOS, Patrícia Pitthan. Proposta de validação de uma arquitetura para checkpoint din âmico no Apache Hadoop. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO SUL (ERAD-RS) , 2018, Porto Alegre. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018 . ISSN 2595-4164.