Стохастические игры

Содержание

Слайд 2

Основные определения К теории игр примыкает так называемая теория статистических решений.

Основные определения

К теории игр примыкает так называемая теория статистических решений. Зачастую

принятие управленческих решений предполагает наличие ситуаций выбора наиболее выгодного варианта поведения из нескольких имеющихся вариантов в условиях неопределённости. В этом случае противником игрока (лица, принимающего решения – ЛПР) является некоторая объективная действительность, которую принято называть природой.
Игра с природой (статистическая игра) – это парная матричная игра, в которой сознательный игрок А (статистик) выступает против участника, совершенно безразличного к результату игры, называемого природой.
Слайд 3

Платежная матрица Объективно система (природа, окружающая среда) не заинтересована в проигрыше

Платежная матрица

Объективно система (природа, окружающая среда) не заинтересована в проигрыше игрока.

В процессе принятия решения о выборе варианта поведения игрок имеет информацию о том, что окружающая среда может принять одно из нескольких возможных состояний и сталкивается с неопределённостью относительно того конкретного состояния, которое примет окружающая среда в данный момент времени.

В общем виде платёжная матрица статистической игры имеет вид:
В данной игре строки матрицы (Ai ) - стратегии ЛПР, а столбцы матрицы (Sj) – состояния окружающей среды.

Слайд 4

Исследование платежной матрицы Начинать анализ платежной матрицы следует с определения «заведомо

Исследование платежной матрицы

Начинать анализ платежной матрицы следует с определения «заведомо невыгодных»

стратегий игрока А (доминируемых), которые исключаются из платежной матрицы. Удалять доминируемые стратегии – состояния окружающей среды нельзя, т.к. они принципиально не могут быть выгодными или невыгодными.
Нецелесообразно решать такую игру методами решения антагонистических игр, определяя смешанную стратегию игрока А. Здесь качественно другая ситуация. Поэтому решением является чистая стратегия игрока А, которая определяется с помощью критериев принятия решения.
Слайд 5

Понятие риска Риском rij игрока при выборе стратегии Аi в условиях

Понятие риска

Риском rij игрока при выборе стратегии Аi в условиях Sj

называется разность
rij = bj - ai,
где bj - максимальный элемент в j - м столбце.
Другими словами риск при выборе стратегии Аi это проигрыш по сравнению с тем случаем, когда игрок знал бы условие при котором он может получить выигрыш bj.
Слайд 6

Матрица риска Найдем матрицу риска R для следующей матрицы игры А.

Матрица риска

Найдем матрицу риска R для следующей матрицы игры А.

Слайд 7

Если известны вероятности состояний природы Предположим, что неопределенность состояний природы (доброкачественная

Если известны вероятности состояний природы

Предположим, что неопределенность состояний природы (доброкачественная ),

то есть вероятности состояний pj известны, вычислим математическое ожидание выигрыша первого игрока, то есть выбрать стратегию удовлетворяющую условию (критерий Байеса)
Следует отметить, что точно та же стратегия соответствует минимальному математическому ожиданию риска
Слайд 8

Пример Пусть распределение вероятности состояний природы в последней задаче равны: P(S1)=2/5;

Пример

Пусть распределение вероятности состояний природы в последней задаче равны:
P(S1)=2/5; P(S2)=1/5; P(S3)=1/5;

P(S4)=1/5;
Тогда
a1 = 13/5; a2 = 69/5; a3 = 13;
a = max (13/5, 69/5, 13) = 69/5 = 13,8.
Следовательно оптимальной по этому критерию является стратегия А2.
Далее рассмотрим критерий минимального математического ожидания риска
r1 = 78/5; r2 = 22/5; r3 = 26/5;
r = min (78/5, 22/5, 26/5) = 22/5 = 4,4.
Слайд 9

Критерии принятия решений Критерий недостаточного основания Лапласа – максимальное среднее значение

Критерии принятия решений

Критерий недостаточного основания Лапласа – максимальное среднее значение каждой

строки.
Критерий Вальда (максиминный) совпадает с крайне осторожной максиминной стратегией.
Слайд 10

Критерии принятия решения Критерий минимального риска Севиджа рекомендует выбирать стратегию, при

Критерии принятия решения

Критерий минимального риска Севиджа рекомендует выбирать стратегию, при которой

величина риска принимает наименьшее значение в самой неблагоприятной ситуации
Игрок, применяющий критерий Севиджа, также придерживается позиции пессимизма, ориентирующийся на минимально возможный риск
Критерий Гурвица соответствует всем промежуточным стратегиям между пессимизмом и крайним оптимизмом. Выигрыш рассчитывается по формуле:
где λ (0 ≤ λ ≤ 1) - коэффициент пессимизма; чем больше игрок хочет подстраховаться тем большее значение λ он выбирает. При λ = 1 критерий Гурвица соответствует критерию крайнего пессимизма, критерию Вальда.
Слайд 11

Задание Рассмотрим пример решения статистической игры в экономической задаче. Сельскохозяйственное предприятие

Задание

Рассмотрим пример решения статистической игры в экономической задаче.
Сельскохозяйственное предприятие может

реализовать некоторую продукцию:
А1 – сразу после уборки;
А2 – в зимние месяцы;
А3 – в весенние месяцы.
Прибыль зависит от цены реализации в данный период времени, затратами на хранение и возможных потерь. Размер прибыли, рассчитанный для разных состояний-соотношений дохода и издержек (S1, S2 и S3), в течение всего периода реализации, представлен в виде матрицы (млн. руб.)