Jogos Markovianos Alternados com Probabilidades Imprecisas dadas por Conjuntos Credais
Resumo
Jogos Markovianos Alternados (AMGs) são usados para representar sequencias de decisões com efeitos probabiĺısticos e são particularmente úteis para modelar interações por múltiplos agentes. No entanto, na prática é frequentemente imposśıvel obter um valor preciso para cada probabilidade de transição. Uma variante dos AMGs foi proposta recentemente, onde imprecisão em valores de probabilidades é representada por intervalos de probabilidade. Neste artigo apresentamos uma variante mais geral de AMGs que permite que a imprecisão seja expressa por conjuntos credais (conjuntos de distribuições de probabilidades). Também definimos um algoritmo que encontra o valor de equiĺıbrio para o modelo proposto.
Referências
Cozman, F. G. (2000). Credal networks. In AI Journal, pages 120(2):199–233.
Delgado, K. V. (2010). Processos de decisão Markovianos fatorados com probabilidades imprecisas. PhD thesis, IME-USP, Brasil.
Delgado, K. V., de Barros, L. N., Cozman, F. G., and Shirota, R. (2009). Representing and solving factored Markov decision processes with imprecise probabilities. In ISIPTA, pages 169–178. Durham, United Kingdom.
Delgado, K. V., Sanner, S., and de Barros, L. N. (2011). Efficient solutions to factored MDPs with imprecise transition probabilities. In AI Journal. Accepted 03 January 2011.
Ferguson, T. S. (Accesso em 18 fevereiro de 2011.). Game Theory. [link].
Fudenberg, D. and Tirole, J. (1991). Game Theory. Cambridge, MA.
Givan, R., Leach, S., and Dean, T. (2000). Bounded-parameter Markov decision processes. In AI Journal, pages (39)71–109.
Kurano, M., Song, J., Hosaka, M., and Huang, Y. (1998). Controlled Markov set-chains with discounting. In J. Appl. Prob., pages (35)293–302.
Littman, M. L. (1996). Algorithms for Sequential Decision Making. PhD thesis, Department of Computer Science - Brown University.
Osborne, M. J. and Rubinstein, A. (1994). A Course in Game Theory. Cambridge, MA.
Owen, G. (1982). Game Theory: Second Edition. Orlando, Florida.
Parthasarathy, T. and Raghavan, T. E. S. (1971). Some topics in two-person games. New York.
Puterman, M. L. (1994). Markov Decision Processes. New York.
Quaeghebeur, E. and de Cooman, G. (2009). Learning in games using the imprecise Dirichlet model. In Inc., E. S., editor, Int. J. Approx. Reasoning, pages (50)243–256. New York, NY, USA.
Russell, S. J. and Norvig, P. (2003). Artificial Intelligence - A modern Approach. Prentice-Hall, New Jersey.
Satia, J. K. and Lave Jr., R. E. (1973). Markovian decision processes with uncertain transition probabilities. In Operations Research, pages (21)728–740.
Shapley, L. S. (1953). Stochastic games. In Proceedings of the National Academy of Sciences, pages 39 (10):1095–1100.
Walley, P. (1991). Statistical Reasoning with Imprecise Probabilities. London.
White III, C. C. and Eldeib, H. K. (1994). Markov decision processes with imprecise transition probabilities. In Operations Research, pages (42)739–749.
