Avaliação de um Mecanismo de Checkpointing para o MyGrid

  • Jeysonn Isaac Balbinot UFRGS
  • Ingrid Jansch-Pôrto UFRGS
  • Hélio Miranda Silva UFRGS
  • Taisy Silva Weber UFRGS

Resumo


A heterogeneidade, complexidade e diversidade de software e hardware dos grids tornam a probabilidade de defeitos maior que em sistemas distribuídos tradicionais. O MyGrid é um middleware que dá suporte à execução de aplicações do tipo Bag-of-Tasks em um grid. O controle das aplicações é feito por um nodo central que se torna ponto único de falha. Para evitar a perda de computação no caso de colapso deste, foi proposto um mecanismo de recuperação por retorno vinculado ao código do escalonador. Este trabalho avalia, via simulação, o impacto deste mecanismo no desempenho das aplicações, utilizando a ferramenta SimGrid.

Referências

Casanova, H.; Legrand, A.; Marchal, L. Scheduling Distributed Applications: the SimGrid Simulation Framework. Proceedings of the IEEE International Symposium on Cluster Computing and the Grid (CCGrid'03), 2003.

Casanova, H. Simgrid: A Toolkit for the Simulation of Application Scheduling. Proceedings of the IEEE International Symposium on Cluster Computing and the Grid (CCGrid'01), p. 430-437, May 2001.

Cirne, W.; Paranhos, D.; Costa, L.; Santos-Neto, E.; Brasileiro, F.; Sauvé, J.; Silva, F. A. B.; Barros, C. O.; Silveira, C. Running Bag-of-Tasks Applications on Computational Grids: The MyGrid Approach. Proceedings of the ICCP'2003 - International Conference on Parallel Processing - October 2003.

Cirne, W.; Brasileiro, F.; Sauvé, J.; Andrade, N.; Paranhos, D.; Santos-Neto, E.; Medeiros, R. Grid computing for bag of tasks applications. Proceedings of 3rd IFIP Conference on E-Commerce, E-Business and E-Government - Sept. 2003.

Cirne, W. Grids Computacionais: Arquiteturas, Tecnologias e Aplicações. III ERAD - Escola Regional de Alto Desempenho, Santa Maria, RS. Janeiro 2003.

Foster, I. What is the Grid? A Three Point Checklist. GRID today online magazine, July 2002.

Foster, I.; Kesselman, C.; Tuecke, S. The anatomy of the Grid: Enabling scalable virtual organizations. LNCS, 2150:1. 2001.

Medeiros, R.; Cirne, W.; Brasileiro, F.; Sauvé, J. Faults in Grids: Why are they so bad and What can be done about it?. Grid Computing, 2003. Proceedings. Fourth International Workshop, p. 18-24, Nov. 17, 2003.

MyGrid Homepage: MyGrid Online Manual. In: http://www.ourgrid.org/mygrid.

Paranhos, D.; Cirne, W.; Brasileiro, F. Trading Cycles Information: Using Replication to Schedule Bag-of-Tasks Applications on Computational Grids. Proceedings of the Euro-Par 2003: International Conference on Parallel and Distributed Computing. August, 2003.

Pradhan, D. K. Fault-Tolerant Computer System Design. Upper Saddle River: Prentice Hall, 1996.

Santos-Neto, E. Escalonamento de Aplicações que Processam Grandes Quantidades de Dados em Grids Computacionais. 2004. 71 f. Dissertação (Mestrado em Informática) – CCT – UFCG, Campina Grande.

Santos-Neto, E.; Cirne, W.; Brasilero, F.; Lima, A. Exploiting Replication and Data Reuse to Efficiently Schedule Data-Intensive Applications on Grids. Proceedings of the 10 th Workshop on Job Scheduling Strategies for Parallel Processing, June 2004.

SimGrid Homepage. In: http://gcl.ucsd.edu/simgrid.
Publicado
09/05/2005
BALBINOT, Jeysonn Isaac; JANSCH-PÔRTO, Ingrid; SILVA, Hélio Miranda; WEBER, Taisy Silva. Avaliação de um Mecanismo de Checkpointing para o MyGrid. In: WORKSHOP DE TESTES E TOLERÂNCIA A FALHAS (WTF), 6. , 2005, Fortaleza/CE. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2005 . p. 37-48. ISSN 2595-2684. DOI: https://doi.org/10.5753/wtf.2005.23366.