Construção de Planos BDI a partir de Políticas Ótimas de POMDPs, com Aplicação na Programação em AgentSpeak usando o Jason

  • Diego R. Pereira UCPel
  • Luciano V. Gonçalves UCPel
  • Graçaliz P. Dimuro UCPel

Resumo


Com base na análise da abordagem híbrida BDI-POMDP encontrada na literatura, este artigo introduz o algoritmo policyToBDIplan que constrói planos em AgentSpeak para agentes BDI que obedecem uma política ótima POMDP, apresentando um exemplo ilustrativo de sua aplicação utilizando o Jason. Políticas de POMDPs são mapeadas para planos de agentes BDI, de acordo com uma dada intenção, considerando que os planos derivados de uma política ótima de um POMDP são aqueles adotados pelo agente BDI que seleciona o plano com a maior utilidade, e uma reconsideração de estratégia ótima.

Referências

Bordini, R. H., Hübner, J. F., and Wooldrige, M. (2007). Programming Multi-agent Systems in AgentSpeak Using Jason. Wiley Series in Agent Technology. John Wiley & Sons, Chichester.

Dimuro, G. P., Costa, A. C. R., Gonçalves, L. V., and Hübner, A. (2007). Centralized regulation of social exchanges between personality-based agents. In Coordination, Organizations, Institutions, and Norms in Agent Systems II, volume 4386 of LNCS, pages 338–355. Springer, Berlin.

Kaelbling, L. P., Littman, M. L., and Cassandra, A. R. (1998). Planning and acting in partially observable stochastic domains. Artificial Intelligence, 101(1-2):99–134.

Lovejoy, W. S. (1991). A survey of algorithmic methods for partially observed Markov decision processes. Annals of Operations Research, 28(1–4):47–66.

Meuleau, N., Hauskrecht, M., Kim, K.-E., Peshkin, L., Kaelbling, L. P., Dean, T., and Boutilier, C. (1998). Solving very large Weakly Coupled Markov Decision Processes. In Proc. of the 15th Nat. Conf. on Artificial Intelligence, 10th Conf. on Innovative Applications of Artificial Intelligence, pages 165–172, Menlo Park. AAAI Press.

Nair, R. and Tambe, M. (2005). Hybrid BDI-POMDP framework for multiagent teaming. Journal of Artificial Intelligence Research, 23:367–420.

Parr, R. (1998). Flexible decomposition algorithms for weakly coupled markov decision problems. In Cooper, G. F. and Moral, S., editors, Proc. 14th Conf. Uncertainty in Artificial Intelligence, Madison, pages 422–430. Morgan Kaufmann.

Paruchuri, P., Bowring, E., Nair, R., Pearce, J., Schurr, N., Tambe, M., and Varakantham, P. (2006). Multiagent teamwork: Hybrid approaches. In Computer Society of India Communications. CSI. (Invited Talk, avaliable at [link]).

Pereira, D. R. (2008). Construção de planos BDI a partir de políticas ótimas de POMDPs, com aplicação na auto-regulação de trocas sociais em sistemas multiagentes. Dissertação de mestrado, PPGINF/UCPel, Pelotas, RS.

Pereira, D. R. and Dimuro, G. P. (2007). Um algoritmo para extração de um plano BDI que obedece uma política MDP Ótima. In Anais do Workshop-Escola de Sistemas de Agentes para Ambientes Colaborativos, Pelotas. PPGINF/UCPel.

Puterman, M. L. (1994). Markov Decision Processes–Discrete Stochastic Dynamic Programming. John Wiley & Sons, New York.

Rao, A. S. (1996). AgentSpeak(L): BDI agents speak out in a logical computable language. In van Hoe, R., editor, Seventh European Workshop on Modelling Autonomous Agents in a Multi-Agent World, volume 1038 of LNCS, pages 42–55. Springer, Berlin.

Rao, A. S. and Georgeff, M. P. (1992). An abstract architecture for rational agents. In Nebel, B., Rich, C., and Swartout, W. R., editors, Proceedings of the 3rd International Conference on Principles of Knowledge Representation and Reasoning (KR’92), Cambridge, MA, October 25–29, 1992, pages 439–449. Morgan Kaufmann.

Simari, G. I. and Parsons, S. (2006). On the relationship between MDPs and the BDI architecture. In Nakashima, H., Wellman, M. P., Weiss, G., and Stone, P., editors, 5th International Joint Conference on Autonomous Agents and Multiagent Systems (AAMAS 2006), Hakodate, Japan, May 8-12, 2006, pages 1041–1048. ACM.

Wooldridge, M. (2000). Reasoning about Rational Agents. Intelligent Robots and Autonomous Agents. The MIT Press, Cambridge, Massachusetts.
Publicado
28/05/2008
PEREIRA, Diego R.; GONÇALVES, Luciano V.; DIMURO, Graçaliz P.. Construção de Planos BDI a partir de Políticas Ótimas de POMDPs, com Aplicação na Programação em AgentSpeak usando o Jason. In: WORKSHOP-ESCOLA DE SISTEMAS DE AGENTES, SEUS AMBIENTES E APLICAÇÕES (WESAAC), 2. , 2008, Santa Cruz do Sul/RS. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2008 . p. 64-73. ISSN 2326-5434. DOI: https://doi.org/10.5753/wesaac.2008.33078.