Gerência de Processos em Sistemas Operacionais Distribuídos
Resumo
O módulo de um sistema operacional distribuído encarregado das funções de manipulação de processos é usualmente denominado Gerente de Processos. Suas duas tarefas primordiais, além daquelas encontradas em sistemas centralizados tradicionais, são a manutenção do equilíbrio da carga dos processadores do sistema e a recuperação (até um estado previamente conhecido) de processos situados em um processador que eventualmente tenha falhado, de forma transparente ao usuário. Os algoritmos empregados pelo Gerente de Processos, no entanto, precisam ser cuidadosamente projetados para que não se constituam em escoadouro dos recursos computacionais do sistema. Este trabalho aborda aspectos relacionados à gerência de processos em sistemas operacionais distribuídos tolerantes a falhas, com ênfase em políticas transparentes de recuperação de processos e balanceamento de carga.
Referências
BACON, David F. Transparent recovery in distributed systems. ACM Operating Systems Review, New York, v.25, n.2, p.91-94, Apr. 1991.
BARCELLOS, Antônio M. P.; BELMONTE FILHO, Valdir R.; LUZ, Marcos V. I.; STEIN, Benhur de O. DIX: Projeto e implementação de um sistema operacional distribuído para uma rede de estações de trabalho. Porto Alegre: CPGCC da UFRGS. Out. 1990. (Relatório de Pesquisa).
BELMONTE FILHO, Valdir R. Gerência de Processos em Sistemas Distribuídos Tolerantes a Falhas. Porto Alegre: CPGCC da UFRGS, Fev. 1992. (a ser publicado).
BORG, Anita: BLAU, Wolfgang; GRAETSCH, Wolfgang; HERRMANN, Ferdinand: OBERLE, Wolfgang. Fault tolerance under UNIX. ACM Transactions on Computer Systems, New York, v.7, n.1, p.1-24, Feb. 1989.
CAMPBELL, Roy H.; RANDELL, Brian. Error recovery in asynchronous systems. IEEE Transactions on Software Engineering, New York, v. SE-12, n.8, p.811-826. Aug. 1986.
CHERITON, David R. The V distributed system. Communications of the ACM, New York, v.31, n.3, p.314-333, Mar. 1988.
CMELIK, R. F.; GEHANI, N. H.; ROOME, W. D. Fault tolerant concurrent C: a tool for writing fault tolerant distributed programs. In: SYMPOSIUM ON FAULT TOLERANT COMPUTING SYSTEMS, 18., 1988, Tokyo. Proceedings... New York: IEEE Computer Society Press, 1988. 388p.
DOUGLIS, Fred: OUSTERHOUT, John. Transparent process migration: design alternatives and the Sprite implementation. Software Practice and Experience, New York, v.21, n.8, p.757-785, Aug. 1991.
JOHNSON, David: ZWAENEPOEL, Willy. Transparent optimistic rollback recovery. ACM Operating Systems Review, New York, v.25. n.2. p.99-102, Apr. 1991.
KOO, Richard; TOUEG, Sam. Checkpointing and rollback-recovery for distributed systems. IEEE Transactions on Software Engineering, New York, v. SE-13, n.1, p.23-31. Jan. 1987.
LEISS, E. L.; REDDY. H. N. Distributed load balancing algorithms: design and performance analysis. Houston: Research Computation Laboratory, University of Houston, 1991. (Research Report).
LIN, Frank C. H.: KELLER, Robert M. The gradient model load balancing method. IEEE Transactions on Software Engineering. New York. v. SE-13, n.1, p.32-38, Jan. 1987.
NI. Lionel M.: XU, Chong-wei; GENDREAU, Thomas B. A distributed drafting algorithm for load balancing. IEEE Transactions on Software Engineering, New York, v. SE-11, n.10, p.1153-1161, Oct. 1985.
ROSA, Fernando R. Programação de aplicações distribuídas baseadas em objetos. Porto Alegre: CPGCC da UFRGS, Nov. 1992. (a ser publicado).
RUSSEL, Lavid L. State restoration in systems of communicating processes. IEEE Transactions on Software Engineering. New York, v. SE-6. n.2. p.183-194. Mar. 1980.
STEIN. Benhur de O. Projeto do núcleo de um sistema operacional distribuído. Porto Alegre: CPGCC da UFRGS. Out. 1992.
STROM. Robert E.; YEMINI. Shaula. Optimistic recovery in distributed systems. ACM Transactions on Computer Systems. New York. v.3. n.3. p.204-226, Aug. 1985.
SVOBODOVA, Liba. File servers for network-based distributed systems. ACM Computing Surveys. New York, v.16, n.4, p.353-398, Dec. 1984.
TANNENBAUM. Andrew S.: RENESSE. Robbert van. Distributed Operating Systems. ACM Computing Surveys. New York. v.17, n.4, p.419-470, Dec. 1985.
THEIMER, Marvin M: LANTZ. Keith A. Finding idle machines in a workstation-based distributed system. IEEE Transactions on Software Engineering. New York. v.15, n.11, p.1444-1458, Sept. 1989.
ZAYAS, Edward R. Attacking the process migration bottleneck. ACM Operating Systems Review, New York, v.21, n.5, p.13-24, July 1987.