Игры с природой: принятие решений в условиях риска. Лекция 6

Содержание

Слайд 2

План лекции 6.1. Критерии оптимальности в условиях риска 6.2. Критерий Ходжа-Лемана 6.3. Критерий Гермейера-Гурвица

План лекции

6.1. Критерии оптимальности в условиях риска

6.2. Критерий Ходжа-Лемана
6.3. Критерий

Гермейера-Гурвица
Слайд 3

3.3. Принятие решений в условиях риска Критерии оптимальности в условиях риска:

3.3. Принятие решений в условиях риска

Критерии оптимальности в условиях риска:
критерий Байеса;
критерий

Лапласа;
критерий максимальной вероятности;
критерий Гермейера.

6.1 Принятие решений в условиях риска

Слайд 4

1.1 Критерий Байеса относительно выигрышей Предположим, что игроку А известны не

1.1 Критерий Байеса относительно выигрышей
Предположим, что игроку А известны не

только состояния П1, П2,…Пn в которых случайным образом может находиться природа, но и вероятности (q1, q2,…qn) наступления этих состояний, при этом ∑qj = 1.

6.1 Принятие решений в условиях риска

Слайд 5

Матрицу выигрышей игрока А и вероятности состояний природы П можно представить

Матрицу выигрышей игрока А и вероятности состояний природы П можно представить

в виде общей матрицы:

6.1 Принятие решений в условиях риска

Слайд 6

Чистую стратегию Аi можно определить как случайную величину со следующим законом

Чистую стратегию Аi можно определить как случайную величину со следующим законом

распределения
Математическое ожидание данной случайной величины

Или средне взвешенное выигрышей i-ой строки матрицы А с весами (q1, q2,…qn).

6.1 Принятие решений в условиях риска

Слайд 7

Критерий Байеса относительно выигрышей позволяет выбрать максимальный из ожидаемых элементов матрицы

Критерий Байеса относительно выигрышей
позволяет выбрать максимальный из ожидаемых элементов матрицы

доходности при известной вероятности возможных состояний природы:

6.1 Принятие решений в условиях риска

Слайд 8

1.2 Критерий Байеса относительно рисков Матрицу рисков игрока А и вероятности

1.2 Критерий Байеса относительно рисков
Матрицу рисков игрока А и вероятности

состояний природы П можно представить матрицей:

6.1 Принятие решений в условиях риска

Слайд 9

Показателем эффективности стратегии Аi по критерию Байеса относительно рисков является математическое

Показателем эффективности стратегии Аi по критерию Байеса относительно рисков является математическое

ожидание рисков, расположенных в i-ой строке матрицы R.

6.1 Принятие решений в условиях риска

Слайд 10

Критерий Байеса относительно рисков позволяет выбрать минимальное значение из средних рисков

Критерий Байеса относительно рисков позволяет выбрать минимальное значение из средних рисков

при известной вероятности возможных состояний природы:

Критерии Байеса относительно выигрышей и относительно рисков эквивалентны, то есть по обоим критериям оптимальной будет одна и та же стратегия.

7.1 Принятие решений в условиях риска

Слайд 11

2.1 Критерий Лапласа относительно выигрышей Вероятность состояний природы оценивается субъективно как

2.1 Критерий Лапласа относительно выигрышей
Вероятность состояний природы оценивается субъективно как равнозначные.


qj = n-1
∑qj = ∑n-1 = 1
Этот принцип называется – принцип недостаточного основания Лапласа.

6.1 Принятие решений в условиях риска

Слайд 12

Имеется игра с природой, в которой игрок А обладает m чистыми

Имеется игра с природой, в которой игрок А обладает m чистыми

стратегиями Аi, природа П может случайным образом находиться в одном из n своих состояний Пj, а матрица выигрышей игрока А задается следующим образом:

6.1 Принятие решений в условиях риска

Слайд 13

Показателем эффективности чистой стратегии Аi по критерию Лапласа относительно выигрышей является

Показателем эффективности чистой стратегии Аi по критерию Лапласа относительно выигрышей является

среднеарифметическое выигрышей при этой стратегии.

6.1 Принятие решений в условиях риска

Слайд 14

Критерий Лапласа относительно выигрышей предполагает выбор варианта стратегии с максимальной ожидаемой

Критерий Лапласа относительно выигрышей
предполагает выбор варианта стратегии с максимальной

ожидаемой доходностью при равной вероятности наступления возможных стратегий природы.

6.1 Принятие решений в условиях риска

Слайд 15

2.2 Критерий Лапласа относительно рисков Матрицу рисков игрока А и вероятности

2.2 Критерий Лапласа относительно рисков

Матрицу рисков игрока А и вероятности состояний

природы П при критерии Лапласа относительно рисков можно представить матрицей:

6.1 Принятие решений в условиях риска

Слайд 16

Показателем неэффективности чистой стратегии Аi по критерию Лапласа относительно рисков является

Показателем неэффективности чистой стратегии Аi по критерию Лапласа относительно рисков является

среднеарифметическое рисков при этой стратегии.

6.1 Принятие решений в условиях риска

Слайд 17

Критерий Лапласа относительно рисков предполагает выбор варианта стратегии с минимальным риском

Критерий Лапласа относительно рисков
предполагает выбор варианта стратегии с минимальным риском

при равной вероятности наступления возможных состояний природы.

6.1 Принятие решений в условиях риска

Слайд 18

3. Критерий максимальной вероятности Рассмотрим игру с природой размера m x

3. Критерий максимальной вероятности

Рассмотрим игру с природой размера
m x

n, где m ≥ 2 и n ≥ 2.
Известны вероятности qj состояний природы Пj

6.1 Принятие решений в условиях риска

Максимальная вероятность обозначается следующим образом:

Слайд 19

Максимальную вероятность может иметь не одно состояние природы. А также максимальное

Максимальную вероятность может иметь не одно состояние природы. А также максимальное

значение может быть у всех состояний природы при равных вероятностях qj = n-1.

6.1 Принятие решений в условиях риска

Предположим, что состояния природы
Пjκ, κ = 1,2,…σ,
где σ – это номер состояний природы (столбцы), имеющих максимальную вероятность.

Слайд 20

Показателем эффективности чистой стратегии Аi по критерию максимальной вероятности относительно выигрышей,

Показателем эффективности чистой стратегии Аi по критерию максимальной вероятности относительно выигрышей,

является наибольший выигрыш из выигрышей при этой стратегии и при состояниях природы Пjκ κ = 1,2,…σ, имеющих максимальную вероятность qmax.

6.1 Принятие решений в условиях риска

Слайд 21

В связи с этим рассматривается матрица m x σ, которая получается

В связи с этим рассматривается матрица m x σ, которая получается

путем исключения тех столбцов, у которых вероятности ниже максимального значения.

6.1 Принятие решений в условиях риска

Слайд 22

6.1 Принятие решений в условиях риска Ценой игры (Qp) по критерию

6.1 Принятие решений в условиях риска

Ценой игры (Qp) по критерию максимальной

вероятности относительно выигрышей будет наибольший элемент из показателей эффективности
Слайд 23

Пример: Найти оптимальную стратегию по критерию максимальной вероятности относительно выигрышей при

Пример:

Найти оптимальную стратегию по критерию максимальной вероятности относительно выигрышей при вероятностях

состояний природы
q1 = 0,2; q2 = 0,3; q3 = 0,5.

6.1 Принятие решений в условиях риска

Слайд 24

Решение: Находим максимальную вероятность Максимальной вероятности соответствует состояние природы П3, следовательно

Решение:

Находим максимальную вероятность

Максимальной вероятности соответствует состояние природы П3, следовательно матрица примет

следующий вид

Ответ: оптимальной стратегией по критерию максимальной вероятности относительно выигрышей является стратегия А3

6.1 Принятие решений в условиях риска

Слайд 25

4. Критерий Гермейера относительно выигрышей Рассмотрим игру с природой размера (m

4. Критерий Гермейера относительно выигрышей

Рассмотрим игру с природой размера (m ≥

2) и (n ≥ 2) с матрицей выигрышей А

6.1 Принятие решений в условиях риска

Слайд 26

3.3. Принятие решений в условиях риска По критерию Гермейера (АG) эффективность

3.3. Принятие решений в условиях риска

По критерию Гермейера (АG) эффективность чистых

стратегий определяется следующим образом:
Выбрав чистую стратегию Ai, игрок А может получить выигрыш aij, если природа окажется в состоянии Пj. Но при этом природа может оказаться в этом состоянии с вероятностью qj = p(Пj). Поэтому игрок А может получить свой выигрыш (aij) только с вероятностью qj.
В связи с этим рассматривается так называемый элемент Гермейера для этого выигрыша – aij qj.

6.1 Принятие решений в условиях риска

Слайд 27

Матрица Гермейера состоит из элементов Гермейера и выглядит следующим образом: 6.1 Принятие решений в условиях риска

Матрица Гермейера состоит из элементов Гермейера и выглядит следующим образом:

6.1 Принятие

решений в условиях риска
Слайд 28

При выборе стратегии игрок А предполагает, что природа будет находиться в

При выборе стратегии игрок А предполагает, что природа будет находиться в

самом неблагоприятном для него состоянии, при котором элемент Гермейера будет являться самым минимальным среди всех элементов матрицы Гермейера соответствующие выбранной стратегии.
Этот элемент называется показателем эффективности чистой стратегии Аi по критерию Гермейера относительно выигрышей:

6.1 Принятие решений в условиях риска

Слайд 29

Ценой игры в чистых стратегиях по критерию Гермейера относительно выигрышей является

Ценой игры в чистых стратегиях по критерию Гермейера относительно выигрышей является

максимальное значение среди показателей эффективности чистой стратегии Аi по критерию Гермейера относительно выигрышей:

6.1 Принятие решений в условиях риска

Слайд 30

Так же ценой игры в чистых стратегиях по критерию Гермейера относительно

Так же ценой игры в чистых стратегиях по критерию Гермейера относительно

выигрышей можно назвать максимином матрицы Гермейера относительно выигрышей:

6.1 Принятие решений в условиях риска

Слайд 31

Пример: Найти оптимальную стратегию по критерию Гермейера относительно выигрышей при вероятностях

Пример:

Найти оптимальную стратегию по критерию Гермейера относительно выигрышей при вероятностях состояний

природы
q1 = 0,2; q2 = 0,3; q3 = 0,5.

6.1 Принятие решений в условиях риска

Слайд 32

Решение: Строим матрицу Гермейера с элементами aij qj G1 = min

Решение:

Строим матрицу Гермейера с элементами aij qj

G1 = min (4; 4,5;

5) = 4;
G2 = min (3,2; 3,6; 7) = 3,2;
G3 = min (2,6; 5,4; 7,5) = 2,6.

Ответ: оптимальной стратегией по критерию Гермейера относительно выигрышей является стратегия А3

Находим минимальный выигрыш игрока А по всем стратегиям по формуле

6.1 Принятие решений в условиях риска

Слайд 33

6.2. Критерий Ходжа-Лемана Критерий Ходжа-Лемана относительно выигрышей Критерий Ходжа-Лемана относительно выигрышей

6.2. Критерий Ходжа-Лемана

Критерий Ходжа-Лемана относительно выигрышей

Критерий Ходжа-Лемана относительно выигрышей опирается

одновременно на критерий Вальда и критерий Байеса.
Слайд 34

При определении оптимальной стратегии по этому критерию вводится параметр (λ) достоверности

При определении оптимальной стратегии по этому критерию вводится параметр (λ)

достоверности информации о распределении вероятностей состояний природы q = (q1, q2,…,qn), значение, которого находится в интервале [0, 1].

Если степень достоверности велика, то доминирует критерий Байеса, в противном случае критерий Вальда.

6.2. Критерий Ходжа-Лемана

Слайд 35

Показателем эффективности чистой стратегии Аi по критерию Ходжа-Лемана относительно выигрышей (HL)

Показателем эффективности чистой стратегии Аi по критерию Ходжа-Лемана относительно выигрышей (HL)

является:

HLi = λBi(q) + (1 – λ)Wi, i = 1,2,…,m

6.2. Критерий Ходжа-Лемана

Слайд 36

где Bi(q) – показатель эффективности стратегии Аi по критерию Байеса относительно

где
Bi(q) – показатель эффективности стратегии Аi по критерию Байеса относительно

выигрышей с вектором q = (q1, q2,…,qn) распределения вероятностей состояний природы, который определяется по формуле:

Wi – показатель эффективности стратегии Аi по критерию Вальда, который определяется по формуле:

6.2. Критерий Ходжа-Лемана

Слайд 37

При любом показателе доверия игрока А распределению вероятностей q = (q1,

При любом показателе доверия игрока А распределению вероятностей q = (q1,

q2,…,qn) состояний природы показатель эффективности стратегии Аi по критерию Ходжа-Лемана (HLi):

HLi ≥ Wi

HLi ≤ Bi

6.2. Критерий Ходжа-Лемана

Слайд 38

Ценой игры в чистых стратегиях по критерию Ходжа-Лемана относительно выигрышей является

Ценой игры в чистых стратегиях по критерию Ходжа-Лемана относительно выигрышей является

максимальное значение среди показателей эффективности чистой стратегии Аi по критерию Ходжа-Лемана относительно выигрышей:

6.2. Критерий Ходжа-Лемана

Слайд 39

Критерий Ходжа-Лемана применим в следующих случаях: имеется информация о вероятностях состояний

Критерий Ходжа-Лемана применим в следующих случаях:
имеется информация о вероятностях состояний окружающей

среды, однако эта информация получена на основе относительно небольшого числа наблюдений и может измениться;
принятое решение теоретически допускает бесконечно много реализаций;
при малом числе реализации допускается некоторый риск.

6.2. Критерий Ходжа-Лемана

Слайд 40

Пример: Найти оптимальную стратегию по критерию Ходжа-Лемана относительно выигрышей при λ

Пример:

Найти оптимальную стратегию по критерию Ходжа-Лемана относительно выигрышей при λ =

0,6 и при вероятностях состояний природы
q1 = 0,2; q2 = 0,3; q3 = 0,5.

6.2. Критерий Ходжа-Лемана

Слайд 41

Решение: Вычислим средние выигрыши по критерию Байеса По критерию Вальда (Wi)

Решение:
Вычислим средние выигрыши по критерию Байеса
По критерию Вальда (Wi)
W1 = 10;

W2 = 12; W3 = 13
Найдем оптимальную стратегию по критерию Ходжа-Лемана по формуле
HLi = λBi(q) + (1 – λ)Wi, i = 1,2,…,m
HL1= (0,6 ⋅ 13,5) + (1 - 0,6) ⋅ 10 = 8,1 + 4 = 12,1
HL2 = (0,6 ⋅ 13,8) + (1 – 0,6) ⋅ 12 = 8,28 + 4,8 = 13,08
HL3 = (0,6 ⋅ 15,5) + (1 – 0,6) ⋅ 13 = 9,3 + 5,2 = 14,5
HL =max( λBi(q) + (1 – λ)Wi) = max(12,1; 13,08; 14,5) = 14,5
Ответ: оптимальной стратегией по критерию Ходжа-Лемана относительно выигрышей является стратегия А3

6.2. Критерий Ходжа-Лемана

Слайд 42

Критерий Ходжа-Лемана относительно рисков Критерий Ходжа-Лемана относительно рисков опирается одновременно на

Критерий Ходжа-Лемана относительно рисков

Критерий Ходжа-Лемана относительно рисков опирается одновременно на критерий

Байеса и критерий Сэвиджа.

6.2. Критерий Ходжа-Лемана

Слайд 43

Показателем неэффективности чистой стратегии Аi по критерию Ходжа-Лемана относительно рисков (HLr) является: 6.2. Критерий Ходжа-Лемана

Показателем неэффективности чистой стратегии Аi по критерию Ходжа-Лемана относительно рисков (HLr)

является:

6.2. Критерий Ходжа-Лемана

Слайд 44

где Bi(q) – показатель неэффективности стратегии Аi по критерию Байеса относительно

где
Bi(q) – показатель неэффективности стратегии Аi по критерию Байеса относительно рисков

с вектором q = (q1, q2,…,qn) распределения вероятностей состояний природы, который определяется по формуле:

Si – показатель неэффективности стратегии Аi по критерию Сэвиджа с вектором q = (q1, q2,…,qn) распределения вероятностей состояний природы, который определяется по формуле:

6.2. Критерий Ходжа-Лемана

Слайд 45

Ценой игры в чистых стратегиях по критерию Ходжа-Лемана относительно рисков является

Ценой игры в чистых стратегиях по критерию Ходжа-Лемана относительно рисков является

минимальное значение среди показателей неэффективности чистой стратегии Аi по критерию Ходжа-Лемана относительно рисков:

6.2. Критерий Ходжа-Лемана

Слайд 46

Критерии оптимальности чистых стратегий по критерию Ходжа-Лемана относительно выигрышей и относительно

Критерии оптимальности чистых стратегий по критерию Ходжа-Лемана относительно выигрышей и относительно

рисков
не эквивалентны.

5.1. Критерий Ходжа-Лемана

Слайд 47

Пример: Найти оптимальную стратегию по критерию Ходжа-Лемана относительно рисков при λ

Пример:

Найти оптимальную стратегию по критерию Ходжа-Лемана относительно рисков при λ =

0,6 и при вероятностях состояний природы
q1 = 0,2; q2 = 0,3; q3 = 0,5.

6.2. Критерий Ходжа-Лемана

Слайд 48

Решение: Построим матрицу рисков. Найдем критерий Байеса относительно рисков S1 =

Решение:
Построим матрицу рисков.

Найдем критерий Байеса относительно рисков

S1 = 5; S2 =

6; S3 = 7

Найдем критерий Сэвиджа

Найдем оптимальную стратегию по критерию Ходжа-Лемана относительно рисков:

HLr = min (4,04; 4,26; 3,64) = 3,64

HLr 1 = (0,6 ⋅ 3,4) + (1 – 0,6) ⋅ 5 = 2,04 + 2 = 4,04
HLr 2 = (0,6 ⋅ 3,1) + (1 – 0,6) ⋅ 6 = 1,86 + 2,4 = 4,26
HLr 3 = (0,6 ⋅ 1,4) + (1 – 0,6) ⋅ 7 = 0,84 + 2,8 = 3,64

Ответ: оптимальной стратегией по критерию Ходжа-Лемана относительно рисков является стратегия А3

6.2. Критерий Ходжа-Лемана

Слайд 49

6.3. Критерий Гермейера-Гурвица Критерий Гермейера-Гурвица относительно выигрышей Данный критерий представляет собой

6.3. Критерий Гермейера-Гурвица

Критерий Гермейера-Гурвица относительно выигрышей

Данный критерий представляет собой критерий

Гурвица относительно матрицы Гермейера.

При этом если 0 ≤ λ ≤ 1, то λ это показатель оптимизма игрока А, тогда показателем пессимизма игрока будет 0 ≤ (1 – λ) ≤ 1.

Слайд 50

Показателем эффективности чистой стратегии Аi по критерию Гермейера-Гурвица относительно выигрышей (GH)

Показателем эффективности чистой стратегии Аi по критерию Гермейера-Гурвица относительно выигрышей (GH)

является:

GHi = (1 – λ)⋅Gi + λ⋅Mi, i = 1,2,…,m

6.3. Критерий Гермейера-Гурвица

Слайд 51

где Gi – показатель эффективности стратегии Аi по критерию Гермейера относительно

где
Gi – показатель эффективности стратегии Аi по критерию Гермейера относительно выигрышей

с вектором q = (q1, q2,…,qn) распределения вероятностей состояний природы, который определяется по формуле:

Mi – показатель эффективности стратегии Аi по критерию Гурвица, относительно матрицы Гермейера, который определяется по формуле:

6.3. Критерий Гермейера-Гурвица

Слайд 52

Ценой игры в чистых стратегиях по критерию Гермейера-Гурвица относительно выигрышей является

Ценой игры в чистых стратегиях по критерию Гермейера-Гурвица относительно выигрышей является

максимальное значение среди показателей эффективности чистой стратегии Аi по критерию Гермейера-Гурвица относительно выигрышей: 

GH = max ((1 – λ)⋅Gi + λ⋅Mi), i = 1,2,…,m

6.3. Критерий Гермейера-Гурвица

Слайд 53

Пример: Найти оптимальную стратегию по критерию Гермейера-Гурвица относительно выигрышей при λ

Пример:

Найти оптимальную стратегию по критерию Гермейера-Гурвица относительно выигрышей при λ =

0,6 и при вероятностях состояний природы
q1 = 0,2; q2 = 0,3; q3 = 0,5.

6.3. Критерий Гермейера-Гурвица

Слайд 54

Строим матрицу Гермейера с элементами aij qj Находим минимальный выигрыш игрока

Строим матрицу Гермейера с элементами aij qj

Находим минимальный выигрыш игрока А

по всем стратегиям по формуле

G1 = min (4; 4,5; 5) = 4;
G2 = min (3,2; 3,6; 7) = 3,2;
G3 = min (2,6; 5,4; 7,5) = 2,6.

Находим максимальный выигрыш игрока А по всем стратегиям по формуле

М1 = max (4; 4,5; 5) = 5
М2 = max (3,2; 3,6; 7) = 7
М3 = max (2,6; 5,4; 7,5) = 7,5

6.3. Критерий Гермейера-Гурвица

Решение:

Слайд 55

Найдем критерии Гермейера-Гурвица относительно выигрышей по каждой стратегии по формуле: GHi

Найдем критерии Гермейера-Гурвица относительно выигрышей по каждой стратегии по формуле:
GHi

= (1 – λ)⋅Gi + λ⋅Mi
GH1 = (1 – 0,6) ⋅ 4 + 0,6 ⋅ 5 = 1,6 + 3 = 4,6
GH2 = (1 – 0,6) ⋅ 3,2 + 0,6 ⋅ 7 = 1,28 + 4,2 = 5,48
GH3 = (1 – 0,6) ⋅ 2,6 + 0,6 ⋅ 7,5 = 5,54
Найдем критерий Гермейера-Гурвица для данной задачи
GH = max ((1 – λ)⋅Gi + λ⋅Mi)
GH = max (4,6; 5,48; 5,54) = 5,54

Ответ: оптимальной стратегией по критерию Гермейера-Гурвица относительно выигрышей является стратегия А3

6.3. Критерий Гермейера-Гурвица