Uma Estratégia Adaptativa para Melhorar a Precisão do Timeout de Detectores de Falhas na Internet

  • Rogério C. Turchetti
  • Elias P. Duarte Jr.

Resumo


O timeout é um mecanismo regularmente utilizado por detectores de falhas para o monitoramento de processos de sistemas distribuídos. Para evitar falsas suspeitas e a espera prolongada para detectar falhas que efetivamente ocorreram, é importante que o timeout seja preciso. Neste trabalho é proposta uma estratégia denominada de tuningφ que reajusta o valor do timeout de acordo com os tempos de comunicação obtidos, buscando refletir o comportamento real da rede. Em especial, adaptamos o cálculo proposto por Jacobson ajustando automaticamente pesos para constante que, no algoritmo original, são valores fixos. A estratégia proposta foi avaliada no contexto de detecção de falhas de processos na Internet. Os experimentos demonstraram que tuningφ reduz expressivamente o número de falsas suspeitas, não atingindo 1% do número de falsas suspeitas cometidas pelo algoritmo original. Além disso, tuningφ apresentou uma redução no tempo de detecção de falhas mantendo um bom desempenho no tempo médio para correção de falsas suspeitas.
Publicado
06/05/2018
TURCHETTI, Rogério C.; JR., Elias P. Duarte. Uma Estratégia Adaptativa para Melhorar a Precisão do Timeout de Detectores de Falhas na Internet. In: WORKSHOP DE TESTES E TOLERÂNCIA A FALHAS (WTF), 19. , 2018, Campos do Jordão. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018 . ISSN 2595-2684.