Tolerância a Falhas de Workflows Científicos Executados em Nuvens Usando Checkpoints

  • Leonardo de Jesus UFF
  • Daniel de Oliveira UFF
  • Lúcia Drummond UFF


Workflows científicos são modelos compostos por tarefas, dados e dependências cujo objetivo é representar experimentos científicos baseados em simulações. Estes experimentos tem alta demanda por recursos computacionais uma vez que envolvem o processamento de um grande volume de dados por diversos softwares diferentes. Assim, a utilização de técnicas de Computação de Alto Desempenho na implementação de workflows científicos fornece o apoio necessário à realização desses experimentos com maior qualidade de serviço. Para gerenciar todo este processo são necessários Sistemas de Gerência de Workflows Científicos (SGWfC). Entretanto, uma vez que ambientes de Computação de Alto Desempenho envolvem um grande número de variados recursos trabalhando em paralelo, aumenta-se a probabilidade de ocorrência de falhas em algum destes. Portanto, os SGWfC precisam ser tolerantes a tais falhas. Este trabalho busca implementar técnicas de tolerância a falhas em tais sistemas de forma a aumentar a sua resiliência e, consequentemente, diminuir o tempo total de execução e os custos envolvidos.


DE JESUS, Leonardo; DE OLIVEIRA, Daniel; DRUMMOND, Lúcia. Tolerância a Falhas de Workflows Científicos Executados em Nuvens Usando Checkpoints. In: SIMPÓSIO EM SISTEMAS COMPUTACIONAIS DE ALTO DESEMPENHO (SSCAD), 17. , 2016, Aracajú. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2016 . p. 239-250. DOI: