Стохастическая игра

Стохастическая игра (англ. stochastic game) в теории игр — повторяющаяся игра со случайными переходами состояний, разыгрываемая одним и более игроками.

История[править | править код]

Стохастические игры были изобретены Л.Шепли в начале 1950-х годов ^[1]. Наиболее полным их описанием является сборник статей под редакцией А.Ноймана и С.Сорина ^[2]. Более элементарная книга Дж. Филар и К.Вриз содержит общее изложение теории марковских процессов принятия решений и стохастических игр двух лиц ^[3]. Ими был использован термин конкурентные марковские процессы принятия решений (англ. Competitive MDPs) для обозначения стохастических игр одного и двух лиц.

Этапы[править | править код]

Игра разыгрывается в течение ряда этапов. В начале каждого этапа игра находится в некотором состоянии. Игроки выбирают свои действия и получают выигрыши, зависящие от текущего состояния и действий. После этого система переходит случайным образом в другое состояние, распределение вероятности переходов зависит от предшествующего состояния и действий игроков. Эта процедура повторяется в течение конечного или бесконечного числа шагов. Общий выигрыш игроков часто определяется как дисконтированная сумма выигрышей на каждом этапе или нижний предел средних выигрышей за конечное число шагов.

При конечном числе игроков, конечных множествах действий и состояний игра с конечным числом повторений всегда имеет равновесие Нэша. Это справедливо также для игр с бесконечным числом повторений, если выигрыши участников представляют собой дисконтированную сумму.

Н. Вайель показал, что все стохастические игры двух лиц с конечными множествами состояний и действий имеют приближенные равновесия Нэша, если функции выигрыша представляют собой нижний предел средних значений выигрыша за конечное число шагов ^[4]. Вопрос о существовании таких равновесий в играх с большим количеством участников остается открытым.

Применение[править | править код]

Стохастические игры находят применение в экономике и эволюционной биологии. Они представляют собой обобщение повторяющихся игр, которые соответствуют ситуации, когда имеется только одно состояние.

См. также[править | править код]

Примечания[править | править код]

↑ Shapley, L.S. Stochastic games // Proc. Nat. Acad. Science. — 1953. — vol. 39. — P. 1095—1100.
↑ Stochastic Games and Applications / A. Neyman, S. Sorin, eds. — Kluwer Academic Press, 2003.
↑ Filar, J., Vrieze, K. Competitive Markov Decision Processes. — Springer-Verlag, 1997.
↑ Vieille, N. Stochastic games: Recent results / In: Handbook of Game Theory. — Elsevier Science, 2002 — P. 1833—1850.

Ссылки[править | править код]

[1] Shapley, L.S. Stochastic games // Proc. Nat. Acad. Science. — 1953. — vol. 39. — P. 1095—1100.

[2] Stochastic Games and Applications / A. Neyman, S. Sorin, eds. — Kluwer Academic Press, 2003.

[3] Filar, J., Vrieze, K. Competitive Markov Decision Processes. — Springer-Verlag, 1997.

[4] Vieille, N. Stochastic games: Recent results / In: Handbook of Game Theory. — Elsevier Science, 2002 — P. 1833—1850.

[1]

[2]

[3]

[4]

Теория игр
Основные понятия	Взаимное и общее знание Игрок Иерархия вер Иррациональное усиление Стратегия (доминирование) Обратная индукция
Виды игр	Одновременные, последовательные и повторяющиеся Некооперативные и кооперативные С полной, неполной, совершенной и несовершенной информацией В нормальной и развёрнутой форме Антагонистические Дифференциальные Стохастические Битва полов Охота на оленя
Концепции решения	Доминирование по риску Коррелированное равновесие Равновесие дрожащей руки Равновесие Нэша Равновесие, совершенное по подыграм Рационализируемость Секвенциальное равновесие Сильное равновесие Собственное равновесие Эволюционно стабильная стратегия Эпсилон-равновесие Эффективность по Парето Ядро
Примеры игр	Дилемма заключённого Задача бара «Эль Фароль» Модель Бертрана Модель Курно Модель Штакельберга Орлянка Трагедия общих ресурсов Ястребы и голуби
Эпистемическая теория игр Дизайн механизмов Справедливый делёж

Стохастическая игра

Содержание

История[править | править код]

Этапы[править | править код]

Применение[править | править код]

См. также[править | править код]

Примечания[править | править код]

Ссылки[править | править код]

Навигация

Стохастическая игра

История[править | править код]

Этапы[править | править код]

Применение[править | править код]

См. также[править | править код]

Примечания[править | править код]

Ссылки[править | править код]

Навигация

Поиск