Desenvolvimento de um Detector de Defeitos para Sistemas Distribuídos baseado em Redes Neurais Artificiais
Resumo
Detectores de defeitos são mecanismos importantes para a implementação de sistemas distribuídos tolerantes a falhas, i.e., sistemas que garantam serviços continuados mesmo na presença de falhas. Em sistemas distribuídos assíncronos, sem limites de tempo conhecidos para a transferência de mensagens e/ou computação de ações locais, detectores de defeito perfeitos (ou confiáveis) não podem ser implementados. Nesses ambientes, falhas podem apenas ser suspeitadas. Uma forma de diminuir a ocorrência de falsas suspeitas é a utilização de timeouts adaptativos que possam ser calculados em função, por exemplo, da carga da rede de comunicação. Em [2] discutimos o uso desses timeouts adaptativos para a implementação do módulo CTI (Connectivity Time Indicator) que, por sua vez, foi utilizado para implementar detectores de defeitos não confiáveis do tipo <>S [1]. Em outro artigo [11], mostramos como o CTI pode ser usado para, além de detectar defeitos, controlar os níveis de qualidade de serviço (QoS) de comunicação entre processos distribuídos, no nível da aplicação. No presente artigo mostramos uma implementação do módulo CTI através de Redes Neurais Artificiais que interagem com agentes SNMP (Simple Network Management Protocol)[5] e MIB (Management Information Base)[6] para predizer tempos de conectividade baseados nas características operacionais dinâmicas de uma rede IP (Internet Protocol) como congestão, perda de pacotes, etc.
Referências
Macêdo R., Failure Detection in Asynchronous Distributed Systems. Proc. of II Workshop on Tests and Fault-Tolerance, pp. 76-81, July 2000, Curitiba, Brazil.
Rietman, E.A. and Frye, R.C. Neural Control of a Nonlinear System with Inherent Time Delays. Conference on Analysis of Neural Network Applications, pp.140-145, 1991.
Chow, M. and Yee, S.O. Real Time Application of Artificial Neural Networks for Incipient Fault Detection of Induction Machines. Proceedings of the 3rd International Conference on Industrial and Engineering Applications of Artificial Intelligence and Expert Systems (IEA/AIE 90), pp. 1030-36, Charleston, USA, July 1990.
Case, J., Fedor, M., Schoffstall, M., Davin, J. Connected: An Internet Encyclopedia – A Simple Network Management Protocol at www address http://deese.univ-lemans.fr:8003/connected/RFC/1157/index.html
McCloghrie, K., Rose, M. Connected: An Internet Encyclopedia – Management Information Base for Network Management of TCP/IP-based internets: MIB-II at www address http://deese.univ-lemans.fr:8003/connected/RFC/1213/index.html
Russell, S. and Norvig, P. Artificial Intelligence - A Modern Approach. 1st ed. New Jersey, Prentice-Hall, 1995.
Haykin, S. Neural Networks – A Comprehensive Foundation. 1 st ed. New York, Macmillan, 1994.
Sotoma, I. and Madeira, E.R.M. DPCP (Discard Past Consider Present) – A Novel Approach to Adaptive Fault Detection in Distributed Systems. 8 th IEEE Workshop on Future Trends of Distributed Computing Systems (FTDCS’2001), vol.1, pp.76-82, Bologna, Italy, October 2001.
Hood, C. S. and Ji, C. Intelligent Agents for Proactive Fault Detection. Internet Computing, v.2, n.2, pp.65-72, March/April, 1998.
Batalha, M. and Macêdo R.J.A.Um Serviço Tolerante a Falhas para o Gerenciamento de Sistemas Distribuídos Sobre CORBA. Proceedings of the Latin-American Conference on Informatics (CLEI’2001). Mérida, Venezuela. September/2001.
Chen W., Toueg, S. and Aguilera, M.K. On the Quality of Service of Failure Detectors. Proceedings of the International Conference on Dependable Systems and Networks (DSN 2000), New York, June 2000.
Hiramatsu, A. Training Techinques for Neural Network Applications in ATM. IEEE Communications Magazine, pp.58-67, October 1995.
Shokri, E. and Beltas, P. An Experiment with Adaptive Fault Tolerance in Highly-Constraint Systems. Proceedings of the Fifth International Workshop on Object-Oriented Real-Time Dependable Systems, California, USA, November 1999.