Proposta de validação de uma arquitetura para checkpoint din âmico no Apache Hadoop

  • Paulo V. M. Cardoso
  • Patrícia Pitthan Barcelos

Abstract


A análise da eficiência de recuperação de um sistema em determinados cenários de falha é essencial para validar a viabilidade dos mecanismos de tolerância a falhas. Este trabalho propõe uma alternativa dinâmica para o estabelecimento de checkpoints no Apache Hadoop e define um cenário para sua validação com falhas no nó mestre da ferramenta. 1. Introdução Sistemas de alto desempenho devem evitar a ocorrência de erros, tornando-se necessário o emprego de técnicas de tolerância a falhas. O Checkpoint and Recovery (CR) consiste em uma técnica reativa de recuperação de erros por retorno cujo objetivo é conduzir o sistema a uma condição consistente, através do salvamento periódico do seu estado em momentos anteriores a falhas (checkpoint). A recuperação acontece após uma falha e se resume em recuperar o andamento normal do sistema.
Published
2018-04-06
CARDOSO, Paulo V. M.; BARCELOS, Patrícia Pitthan. Proposta de validação de uma arquitetura para checkpoint din âmico no Apache Hadoop. In: REGIONAL SCHOOL OF HIGH PERFORMANCE COMPUTING FROM SOUTHERN BRAZIL (ERAD-RS) , 2018, Porto Alegre. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018 . ISSN 2595-4164.