Игры с «природой». Метод платежной матрицы. Критерии Вальда, Сэвиджа, Лапласа, Гурвица

Содержание

Слайд 2

План лекции Игры с «природой». Метод платежной матрицы. Критерии Вальда, Сэвиджа, Лапласа, Гурвица.

План лекции

Игры с «природой».
Метод платежной матрицы.
Критерии Вальда, Сэвиджа, Лапласа,

Гурвица.
Слайд 3

Теория игр — это теория математических моделей принятия оптимальных решений в

Теория игр — это теория математических моделей принятия оптимальных решений в

условиях неопределенности, противоположных интересов различных сторон конфликта.
Теория игр применяется в вопросах борьбы фирм за рынки, в явлениях олигополии, в планировании рекламных компаний, при формировании цен на конкурентных рынках, в обменных и торговых операциях, в биржевой игре, в анализе коалиционного поведения и т.д. С позиций теории игр можно рассматривать вопросы централизации и децентрализации управления производством, оптимальное планирование по нескольким показателям, планирование в условиях неопределенности, порождаемой, например, техническим прогрессом, преодоление ведомственных противоречий и другие вопросы.

Теория игр

Слайд 4

Всякая теоретико-игровая модель должна отражать, кто и как конфликтует, а также,

Всякая теоретико-игровая модель должна отражать, кто и как конфликтует, а также,

кто и в какой форме заинтересован в том или ином исходе конфликта. Действующие в конфликте стороны будем называть игроками, а решения, которые способны принимать игроки, — стратегиями. Содержание математической теории игр состоит, во-первых, в установлении принципов оптимального поведения игроков в играх, во-вторых, в доказательстве существования ситуаций, которые складываются в результате применения этих принципов, и, в- третьих, в разработке методов фактического нахождения таких ситуаций.
Слайд 5

Неопределенность – это когда противник не имеет противоположных интересов, но выигрыш

Неопределенность – это когда противник не имеет противоположных интересов, но выигрыш

действующего игрока во многом зависит от неизвестного заранее состояния противника.

Неопределенность зависит от недостатка информации о внешних условиях, в которых будет приниматься решение и не зависит от действий игрока

Неопределенность в теории игр

Слайд 6

Неопределенность может быть следствием многих причин: колебание спроса; нестабильность экономической ситуации;

Неопределенность может быть следствием многих причин:
колебание спроса;
нестабильность экономической ситуации;
изменение

курса валют;
колебание уровня инфляции;
неустойчивая биржевая ситуация;
погода как природное явление.
Слайд 7

Понятие игры с природой Игра, в которой осознанно действует только один

Понятие игры с природой

Игра, в которой осознанно действует только один из

игроков, называется игрой с природой.

«Природа» – это обобщенное понятие противника, не преследующего собственных целей в данном конфликте, хотя такую ситуацию конфликтом можно назвать лишь условно.

Природа может принимать одно из своих возможных состояний и не имеет целью получение выигрыша

Слайд 8

Понятие игры с природой Игра с природой представляется в виде платежной

Понятие игры с природой

Игра с природой представляется в виде платежной матрицы,

элементы которой – выигрыши игрока А, но не являются проигрышами природы П.
Слайд 9

Каждый элемент платежной матрицы aij – выигрыш игрока А при стратегии

Каждый элемент платежной матрицы aij – выигрыш игрока А при стратегии

Ai в состоянии природы Пj

Понятие игры с природой

Слайд 10

3.1. Понятие игры с природой Матрица еще называется матрицей доходности, которая

3.1. Понятие игры с природой

Матрица еще называется матрицей доходности, которая агрегирует

информацию о возможной доходности вариантов стратегии при различных сценариях развития экономической ситуации.

Понятие игры с природой

Слайд 11

Различают два вида задач в играх с природой: Задачи о принятии

Различают два вида задач
в играх с природой:
Задачи о принятии решений

в условиях неопределенности, когда нет возможности получить информацию о вероятностях появления состояний природы.
2.Задачи о принятии решений в условиях риска, когда известны вероятности, с которыми природа принимает каждое из возможных состояний.
Слайд 12

Принятие решений в условиях неопределенности Предположим, что лицо, принимающее решение, может

Принятие решений в условиях неопределенности

Предположим, что лицо, принимающее решение, может выбрать

одну из возможных альтернатив, обозначенных номерами i = 1, 2, …, m

Ситуация является полностью неопределенной,
т. е. известен лишь набор возможных вариантов состояний внешней (по отношению к лицу, принимающему решение) среды, обозначенных номерами j = 1, 2, …, n.

Слайд 13

3.2. Принятие решений в условиях неопределенности Если будет принято i-e решение,

3.2. Принятие решений в условиях неопределенности

Если будет принято i-e решение, а

состояние внешней среды соответствует j-й ситуации, то лицо, принимающее решение, получит доход aij

Принятие решений в условиях неопределенности

Слайд 14

Необходимо провести оценку риска в условиях, когда реальная ситуация неизвестна. Если

Необходимо провести оценку риска в условиях, когда реальная ситуация неизвестна. Если

игрок знает, что осуществляется j-е состояние природы, то выбрал бы наилучшее решение, то есть то, которое принесет наибольший выигрыш
bj = max(aij),
j = 1, 2, …, n

Принятие решений в условиях неопределенности

Слайд 15

Принятие решений в условиях неопределенности Принимая i-e решение, игрок А рискует

Принятие решений в условиях неопределенности

Принимая i-e решение, игрок А рискует получить

не bj, а только aij, то есть, если игрок примет i-е решение, а в природе реализуется j-е состояние, то произойдет недополучение дохода в размере:

(по сравнению с тем, как если бы игрок знал точно, что реализуется j-е состояние природы, и выбрал бы решение, приносящее наибольший доход bj = max(aij), j = 1, 2, …, n)
aij – значение показателя доходности варианта стратегии с максимальной доходностью из имеющихся i-ых вариантов при наступлении j-ого сценария развития событий
amaxj - значение показателя доходности i-ого варианта стратегии при наступлении j-ого сценария развития событий (элемент платежной матрицы).

Слайд 16

отражает риск реализации вариантов стратегии для каждой альтернативы развития событий (характеризует

отражает риск реализации вариантов стратегии для каждой альтернативы развития событий (характеризует

риск выбора определенного варианта стратегии).

Матрица рисков (сожалений)

R =

где

Слайд 17

При решении задачи о принятии решений в условиях неопределенности для отбора

При решении задачи о принятии решений в условиях неопределенности для отбора

вариантов стратегии применяют так называемые критерии оптимальности (альтернативные критерии оптимальности):
критерий Вальда,
критерий оптимизма,
критерий пессимизма,
критерий Сэвиджа,
критерий Гурвица

Решение игр с природой в условиях неопределенности

Слайд 18

3.2. Принятие решений в условиях неопределенности Для выбора наиболее эффективного варианта

3.2. Принятие решений в условиях неопределенности
Для выбора наиболее эффективного варианта стратегии

ко всем возможным вариантам развития применяются все критерии оптимальности одновременно: каждый из критериев позволяет отобрать только один вариант, оптимальным же будет являться тот из них, на который указало
большинство критериев.

Решение игр с природой в условиях неопределенности

Слайд 19

1) Критерий Вальда (критерий гарантированного результата, максиминный критерий) позволяет выбрать наибольший

1) Критерий Вальда (критерий гарантированного результата, максиминный критерий) позволяет выбрать наибольший

элемент матрицы доходности из её минимально возможных элементов:

– элемент матрицы доходности.

Решение игр с природой в условиях неопределенности

Слайд 20

Критерий Вальда предназначен для выбора из рассматриваемых вариантов стратегий варианта с

Критерий Вальда предназначен для выбора из рассматриваемых вариантов стратегий варианта с

наибольшим показателем эффективности из минимально возможных показателей для каждого из этих вариантов.
Данный критерий обеспечивает максимизацию минимального выигрыша, который может быть получен при реализации каждого из вариантов стратегий. Критерий ориентирует лицо, принимающее решение, на осторожную линию поведения, направленную на получение дохода и минимизацию возможных рисков одновременно.

Решение игр с природой в условиях неопределенности

Слайд 21

Применение критерия Вальда оправдано, если ситуация, в которой принимается решение, характеризуется

Применение критерия Вальда оправдано, если ситуация, в которой принимается решение, характеризуется

следующими обстоятельствами:
о вероятности наступления того или иного состояния природы ничего не известно;
не допускается никакой риск;
реализуется лишь малое количество решений.

Решение игр с природой в условиях неопределенности

Слайд 22

Пример: Найти оптимальную стратегию по критерию Вальда.

Пример:

Найти оптимальную стратегию по критерию Вальда.

Слайд 23

Решение: Полученный результат соответствует стратегии А3

Решение:

Полученный результат соответствует стратегии А3

Слайд 24

2) Критерий оптимизма (критерий максимакса) предназначен для выбора наибольшего элемента матрицы

2) Критерий оптимизма (критерий максимакса) предназначен для выбора наибольшего элемента матрицы

доходности из её максимально возможных элементов:

Решение игр с природой в условиях неопределенности

Слайд 25

Критерий оптимизма используется, когда игрок оказывается в безвыходном положении, когда любой

Критерий оптимизма используется, когда игрок оказывается в безвыходном положении, когда любой

его шаг равновероятно может оказаться как абсолютным выигрышем, так и полным провалом.
Данный критерий предполагает, что развитие ситуации будет благоприятным для лица, принимающего решение. Вследствие этого, оптимальным выбором будет вариант с наибольшим значением показателя эффективности в матрице доходности.

Решение игр с природой в условиях неопределенности

Слайд 26

Пример: Найти оптимальную стратегию по критерию Оптимизма.

Пример:

Найти оптимальную стратегию по критерию Оптимизма.

Слайд 27

Решение: Полученный результат соответствует стратегии А1

Решение:

Полученный результат соответствует стратегии А1

Слайд 28

3) Критерий пессимизма предназначен для выбора наименьшего элемента матрицы доходности из

3) Критерий пессимизма предназначен для выбора наименьшего элемента матрицы доходности из

её минимально возможных элементов:

Решение игр с природой в условиях неопределенности

Слайд 29

Критерий пессимизма предполагает, что развитие ситуации будет неблагоприятным для лица, принимающего

Критерий пессимизма предполагает, что развитие ситуации будет неблагоприятным для лица, принимающего

решение.
При использовании этого критерия лицо принимающее решение ориентируется на возможную потерю контроля над ситуацией и, поэтому, старается исключить все потенциальные риски и выбрать вариант с минимальной доходностью.

3.2. Принятие решений в условиях неопределенности

Решение игр с природой в условиях неопределенности

Слайд 30

Пример: Найти оптимальную стратегию по критерию Пессимизма.

Пример:

Найти оптимальную стратегию по критерию Пессимизма.

Слайд 31

3.2. Принятие решений в условиях неопределенности Решение: Полученный результат соответствует стратегии А1

3.2. Принятие решений в условиях неопределенности

Решение:

Полученный результат соответствует стратегии А1

Слайд 32

4) Критерий Сэвиджа (критерий минимаксного риска Сэвиджа) предназначен для выбора максимального

4) Критерий Сэвиджа (критерий минимаксного риска Сэвиджа) предназначен для выбора максимального

элемента матрицы рисков из её минимально возможных элементов:

Среди элементов матрицы рисков сначала выбирается максимальный риск при каждой стратегии, а затем из них выбирается минимальный. То есть в данном случае пессимистично настроенный игрок предполагает, что состояние природы будет таковым, что для любой его стратегии риск будет наибольшим, а стратегию выбирает такую, чтобы этот риск минимизировать.

Решение игр с природой в условиях неопределенности

Слайд 33

Критерий Сэвиджа позволяет выбрать вариант стратегии с меньшей величиной риска по

Критерий Сэвиджа позволяет выбрать вариант стратегии с меньшей величиной риска по

сравнению с более высоким, первоначально ожидаемым уровнем риска.
Данный критерий ориентирует лицо принимающее решение на более благоприятное развитие ситуации по сравнению с наихудшим состоянием, на которое то рассчитывало вначале.

Решение игр с природой в условиях неопределенности

Слайд 34

Пример: Найти оптимальную стратегию по критерию Сэвиджа.

Пример:

Найти оптимальную стратегию по критерию Сэвиджа.

Слайд 35

Решение: Применяем формулу rij = amaxj - aij, построим матрицу рисков.

Решение:

Применяем формулу rij = amaxj - aij, построим матрицу рисков.
Матрица

рисков

Полученный результат соответствует стратегии А1

Слайд 36

5) Критерий Гурвица (взвешивает пессимистический и оптимистический подходы к анализу неопределенной

5) Критерий Гурвица (взвешивает пессимистический и оптимистический подходы к анализу неопределенной

ситуации) предназначен для выбора некоторого среднего элемента матрицы доходности, отличающегося от крайних состояний – от минимального и максимального элементов:

где λ – коэффициент оптимизма,

Решение игр с природой в условиях неопределенности

Слайд 37

Если λ → 1, то правило Гурвица приближается к правилу Вальда

Если λ → 1,
то правило Гурвица приближается к правилу Вальда
2. Если

λ → 0,
то правило Гурвица приближается к правилу оптимизма

Коэффициент λ выражает количественно «меру оптимизма» игрока А при выборе стратегии и определяется им из субъективных соображений на основе статистических исследований результатов принятия решений или личного опыта лица принимающего решение в схожих ситуациях.

Если λ коэффициент оптимизма, то (λ – 1) коэффициент пессимизма

Критерий Гурвица

Слайд 38

Критерий Гурвица позволяет избежать пограничных состояний при принятии решения – неоправданного

Критерий Гурвица позволяет избежать пограничных состояний при принятии решения – неоправданного

оптимизма и крайнего пессимизма относительно ожидаемой доходности – и выбрать наиболее вероятный вариант стратегии, обеспечивающий наилучшую эффективность.

3.2. Принятие решений в условиях неопределенности

Решение игр с природой в условиях неопределенности

Слайд 39

Критерий Гурвица ориентирован на установление баланса между случаями крайнего пессимизма и

Критерий Гурвица ориентирован на установление баланса между случаями крайнего пессимизма и

крайнего оптимизма при выборе стратегии путем взвешивания обоих исходов с помощью коэффициента оптимизма

3.2. Принятие решений в условиях неопределенности

Решение игр с природой в условиях неопределенности

Слайд 40

Пример: Найти оптимальную стратегию по критерию Гурвица. λ = 0,5

Пример:

Найти оптимальную стратегию по критерию Гурвица.
λ = 0,5

Слайд 41

Решение: Полученный результат соответствует стратегии А3

Решение:

Полученный результат соответствует стратегии А3