Algoritmo de Reconfiguração na Máquina T-Node em Caso de Falhas

  • Raul Ceretta Nunes UFRGS
  • Philippe Olivier Alexandre Navaux INPG / UFRGS
  • Ingrid Jansch-Pôrto INPG / UFRGS

Resumo


Neste artigo é apresentado um algoritmo para a execução de reconfiguração na máquina T-NODE na ocorrência de falhas. T-NODE [TEL91] é uma máquina paralela que usa transputers como blocos básicos; foi projetada para aplicacões de alto desempenho e não apresenta, em seu projeto original, qualquer característica especial de tolerância a falhas. No texto, são apresentados brevemente alguns conceitos básicos de sistemas tolerantes a falhas: o ambiente arquitetural da máquina T-NODE, e a motivação para o desenvolvimento da pesquisa. Na seqüência, são descritas as principais características dos transputers e da máquina T-NODE; para esta descrição, são consideradas as necessidades e o ponto de vista de reconfiguração. Então é apresentado o algoritmo para reconfigurar a T-NODE quando forem detectadas falhas nos módulos básicos, que correspondem aos transputers e suas memórias locais. O artigo é concluído com uma discusão sobre melhoramentos possíveis e com as conclusões obtidas a partir deste trabalho.

Referências

DUTT, S. and HAYES, J. P. Design and Reconfiguration Strategies for Near-Optimal K-Fault-Tolerant Tree Architectures. International Symp. On Fault-Tolerant Computing, FTCS-18. New York: IEEE, 1988.

FLYNN, M. J. Very High-Speed Computing Systems. Proceedings of the IEEE, n. 54, Dezembro 1966.

HASAN, N. and LIU, L. Minimum Fault Coverage in Reconfigurable Arrays. International Symp. On Fault-Tolerant Computing, FTCS-18. New York: TEEE,1988. p.348-53

HOARE, C. A. R. Communicating Sequencial Process. Communications of the ACM. v.21, n.8, Agosto, 1978. p.666-677.

INMOS LIMITED. IMS 1424. Bristol: INMOS, 1984. 31p. (Preliminary data)

INMOS LIMITED. IMS T800 Transputer. In: Transputer databook. Bath: Bath, 1988. p.43-111

INMOS LIMITED. OCCAM 2 Reference Manual. Cambridge: Prentice Hall, 1988, 133p. (Series in Computer Science)

LAPRIE, J.C. Dependable computing and fault-tolerance: concepts and terminology. In: international Symp. On Fault-Tolerant Computing, FTCS-15. New York: IEEE, 1985. p.2-11

LOWRIE, M. and FUCHS, W. Reconfigurable Tree Architectures Using Subtree Oriented Fault Tolerance. IEEE Transactions on Computers, v. C-36, n.10, Outubro 1987, p. 1172-1182

NEGRINI, R.; SAMI, M.; STEFANELLI, R. Fault tolerance techniques for array structures used in supercomputing. Computer, v.19, n.2, Fevereiro 1986. p.78-87

NICOLE, D. A. Reconfigurable transputer processor architecture. Southampton: Southamptom Transputer Support Centre, 1988. 18p. (ESPRIT Project 1085, Tech. Report, n.2)

NUNES, R.C. Um estudo de confiabilidade da arquitetura do T-NODE. Porto Alegre: CPGCC da UFRGS, 1992. 62p. (Trabalho Individual, n.252)

POUNTAIN, D. and MAY, D. A tutorial introduction to OCCAM programming. BSP Professional Books, 1988.

SIEWIOREK, D.; SWARZ, R. The theory and practice of reliable system design. Bedford: Digital, 1982. 772p.

TELMAT INFORMATIQUE. The Configuration File for Standalone Enviroments. Technical Report n.2, Maio 1990. 9p. (In: T-NODE Technical Reports)

TELMAT INFORMATIQUE. T-NODE hardware manual. Soultz: Telmat Informatique, 1991. v.1
Publicado
07/09/1993
NUNES, Raul Ceretta; NAVAUX, Philippe Olivier Alexandre; JANSCH-PÔRTO, Ingrid. Algoritmo de Reconfiguração na Máquina T-Node em Caso de Falhas. In: INTERNATIONAL SYMPOSIUM ON COMPUTER ARCHITECTURE AND HIGH PERFORMANCE COMPUTING (SBAC-PAD), 5. , 1993, Florianópolis/SC. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 1993 . p. 344-357. DOI: https://doi.org/10.5753/sbac-pad.1993.23043.