Презентация Модели принятия решений в условиях неопределенности Теория игр

Содержание

Слайд 2

Основные вопросы 1. Основные понятия теории игр. 2. Нижняя и верхняя

Основные вопросы

1. Основные понятия теории игр.
2. Нижняя и верхняя цена игры.
3.

Игра с седловой точкой.
4. Решение игры в смешанных стратегиях.
5. Сведение решения игры к задаче линейного программирования.
6. Игры с природой.
Слайд 3

Основные понятия теории игр Игрой называется математическая модель конфликтной ситуации. Стороны,

Основные понятия теории игр

Игрой называется математическая модель конфликтной ситуации. Стороны, участвующие

в конфликте, называются участниками игры или игроками, а исход конфликта - выигрышем.
Игра ведется по определенным правилам, которые представляют собой систему условий, регламентирующих возможные действия игроков.
Слайд 4

Ходом называется выбор одного из предложенных правилами игры действий и его

Ходом называется выбор одного из предложенных правилами игры действий и его

осуществление.
Стратегией игрока называется совокупность правил, определяющих выбор его действий при каждом личном ходе в зависимости от сложившейся ситуации.
Слайд 5

Для того, чтобы найти решение игры, следует для каждого игрока выбрать

Для того, чтобы найти решение игры, следует для каждого игрока выбрать

стратегию, которая удовлетворяет условию оптимальности, т.е. один из игроков должен получить максимальный выигрыш, когда второй придерживается своей стратегии. В то же время второй игрок должен иметь минимальный проигрыш, если первый придерживается своей стратегии. Такие стратегии называются оптимальными. Любому из игроков невыгодно отказаться от своей стратегии в игре.
Слайд 6

Математическая модель задачи Пусть игрок А располагает m стратегиями, которые обозначим

Математическая модель задачи

Пусть игрок А располагает m стратегиями, которые обозначим А1,

А2, … , Аm. Пусть у игрока В имеется n стратегий, обозначим их В1, В2, …,Вn. В этом случае игра имеет размерность m х n. В результате выбора игроками любой пары стратегий Аi и Вj (i =1,2, … m; j = 1,2, …, n) однозначно определяется исход игры, т.е. выигрыш aij игрока А (положительный или отрицательный) и проигрыш (-aij ) игрока В.
Слайд 7

Предположим, что значения aij известны для любой пары стратегий (Аi,Вj). Матрица

Предположим, что значения aij известны для любой пары стратегий (Аi,Вj). Матрица

Р =(aij), i = 1,2, … , m; j = 1,2, …,n, элементами которой являются выигрыши, соответствующие стратегиям Аi, и Вj, называется платежной матрицей или матрицей игры:
Слайд 8

Нижняя цена игры Обозначим через αi наименьший выигрыш игрока А при

Нижняя цена игры

Обозначим через αi наименьший выигрыш игрока А при выборе

им стратегии Аi для всех возможных стратегий игрока В (наименьшее число в i-ой строке платежной матрицы). Среди всех чисел αi (i = 1,2, …, m) выберем наибольшее: α = mах {αi }.
Число α называется нижней ценой игры. Это гарантированный выигрыш игрока А при любой стратегии игрока В.
Слайд 9

Верхняя цена игры Игрок В заинтересован в том, чтобы уменьшить выигрыш

Верхняя цена игры

Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока

А, (а следовательно - свой проигрыш ). Выбирая стратегию Вj, он учитывает максимально возможный при этом выигрыш игрока А. Обозначим βj наибольший возможный выигрыш игрока при выборе игроком В его стратегии Вj (наибольшее число в j-ом столбце платежной матрицы). Среди всех чисел βj (j = 1,2, …, n) выберем наименьшее: β= min{βj }.
Число β называется верхней ценой игры. Это гарантированный проигрыш игрока В.
Слайд 10

Игра с седловой точкой Фактический выигрыш игрока А при разумных действиях

Игра с седловой точкой

Фактический выигрыш игрока А при разумных действиях партнеров

ограничен нижней и верхней ценой игры.
Если верхняя и нижняя цены игры совпадают, то общее значение верхней и нижней цены игры α=β=v называется ценой игры. В этом случае игра называется вполне определенной или игрой с седловой точкой.
Слайд 11

Седловой точкой называется элемент платежной матрицы, одновременно минимальный в своей строке

Седловой точкой называется элемент платежной матрицы, одновременно минимальный в своей строке

и максимальный в своем столбце.
Седловой точке соответствуют оптимальные стратегии игроков Аi и Вj, их совокупность - это решение игры, которое обладает следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то для другого отклонение от его оптимальной стратегии невыгодно. В этом случае говорят, что игра имеет решение в чистых стратегиях.
Слайд 12

Пример Найти решение игры, заданной платежной матрицей: (Игрок А имеет 3

Пример

Найти решение игры, заданной платежной матрицей:
(Игрок А имеет 3 стратегии: А1;А2;А3.

Игрок В имеет 4 стратегии: В1;В2;В3;В4.

A1
A2
A3

B1 B2 B3B4

Слайд 13

Решение: Определим наименьшие по строкам числа αi и наибольшие по столбцам

Решение:

Определим наименьшие по строкам числа αi и наибольшие по столбцам числа

βj:
Определим нижнюю цену игры:
α = mах {αi } = mах {0,2,-1} =2.
Верхняя цена игры:
β= min{βj } = min {3,2,4,5} = 2.

αi
0
2
-1

βj 3 2 4 5

Слайд 14

Поскольку α=β=v=2, то платежная матрица содержит седловую точку, а игра имеет

Поскольку α=β=v=2, то платежная матрица содержит седловую точку, а игра имеет

решение в чистых стратегиях.
Седловая точка находится во второй строке и втором столбце, следовательно оптимальными являются стратегии А2 и В2. При этом цена игры v=2.

αi
0
2
-1

βj 3 2 4 5

Слайд 15

Решение игры в смешанных стратегиях Если игра не имеет седловой точки,

Решение игры в смешанных стратегиях

Если игра не имеет седловой точки, то

применение чистых стратегий не дает оптимального решения игры. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.
Слайд 16

Смешанной стратегией SA игрока А называется применение чистых стратегий А1, А2,…

Смешанной стратегией SA игрока А называется применение чистых стратегий А1, А2,…

, Аi,…, Аm с вероятностями p1, p2,…, pi,…, pm, причем Σ pi = 1.
Смешанные стратегии игрока А записываются в виде матрицы:
или в виде строки SA= (p1, p2,…, pi,…, pm).
Слайд 17

Аналогично смешанные стратегии игрока В обозначаются: или SВ=( q1 q2 …

Аналогично смешанные стратегии игрока В обозначаются:
или SВ=( q1 q2 … qj

… qn), где Σ qj =1.
Чистая стратегия, которая входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, называется активной.
Слайд 18

Если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш

Если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш

остается неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий.
Цена игры удовлетворяет неравенству: α ≤ v ≤ β.
Слайд 19

Сведение решения игры к задаче линейного программирования Рассмотрим игру, заданную платежной

Сведение решения игры к задаче линейного программирования

Рассмотрим игру, заданную платежной матрицей:
Если

такая игра имеет седловую точку, то оптимальное решение игры - это пара чистых стратегий, соответствующих этой точке.
Слайд 20

Предположим, что игра не имеет седловой точки. Найдем ее решение в

Предположим, что игра не имеет седловой точки.
Найдем ее решение в смешанных

стратегиях: SA = (p1, p2,…, pi,…, pm) и SВ =(q1, q2,…,qj, … ,qn).
Применение игроком А оптимальной стратегии SA должно обеспечивать ему при любых действиях игрока В выигрыш не меньше цены игры v.
Слайд 21

Определим математическое ожидание выигрыша игрока А в случае, если его соперник

Определим математическое ожидание выигрыша игрока А в случае, если его соперник

выбрал свою первую стратегию В1.
Аналогично определим М2,М3,….Mn≥v

р1
p2

pm

X a11 a21 … am1
p p1 p2 … pm

Слайд 22

Поэтому выполняются следующие соотношения: причем Σ pi = 1. Аналогично, для

Поэтому выполняются следующие соотношения:
причем Σ pi = 1.
Аналогично, для игрока

В оптимальная стратегия SВ должна обеспечить при любых стратегиях игрока А проигрыш, не превышающий величину v, т.е. справедливо соотношение:
Для решения этих задач используют методы линейного программирования.
Слайд 23

Игры с природой В некоторых случаях успех экономической деятельности зависит не

Игры с природой

В некоторых случаях успех экономической деятельности зависит не от

сознательно противодействующего конкурента, а от объективной действительности, которую принято называть "природой".
Пусть игрок А располагает m стратегиями, которые обозначим А1, А2, … , Аm, а относительно "природы" известно, что она может принимать n различных состояний, обозначим их Р1, Р2, … Рn.
Слайд 24

Известен выигрыш aij игрока А при каждой паре стратегий игрока и "природы", т.е. известна платежная матрица:

Известен выигрыш aij игрока А при каждой паре стратегий игрока и

"природы", т.е. известна платежная матрица:
Слайд 25

Игрок А в играх с "природой" старается действовать осмотрительно, используя стратегию,

Игрок А в играх с "природой" старается действовать осмотрительно, используя стратегию,

позволяющую получить наибольший выигрыш (наименьший проигрыш).
"Природа" (игрок Р) действует случайно, возможные стратегии определяются как ее состояние (погода, спрос на определенную продукцию, сочетание производственных факторов).
Слайд 26

Различают игры с "природой" в условиях определенности и игры с "природой"

Различают игры с "природой" в условиях определенности и игры с "природой"

в условиях неопределенности.
В первом случае задано распределение вероятностей состояний природы, во втором - оно неизвестно. В этом случае приходится принимать решение в условиях риска.
Слайд 27

Риском игрока А при использовании стратегии Аi при состоянии "природы" Pj

Риском игрока А при использовании стратегии Аi при состоянии "природы" Pj

называется разность между выигрышем, который он получил бы, если бы знал Pj и выигрышем, который он получит в обычных условиях, применяя стратегию Аi:
rij = βj - αij, где βj = mах {αij }.
i
Рассмотрим критерии, используемые при решении игр с природой.
Слайд 28

Критерий Бейеса-Лапласа При известном распределении вероятностей различных состояний природы Р =(

Критерий Бейеса-Лапласа

При известном распределении вероятностей различных состояний природы Р =( p1,

p2, …, pn,), где p1+ p2+…+ pn=1, критерием принятия решений является максимум математического ожидания выигрыша, т.е.
VB-L = mах ∑ aij pj, где i = 1,2, …, m.
i j
Слайд 29

Критерий Лапласа Если ни одно из состояний "природы" нельзя предпочесть другим,

Критерий Лапласа

Если ни одно из состояний "природы" нельзя предпочесть другим, выдвигают

гипотезу о том, что все они равновероятны:
p1= p2=…=pn= 1/n.
Тогда VL = mах ∑ aij ·1/n . i j
Слайд 30

Максиминный критерий Вальда Он основан на выборе стратегии игрока А, позволяющей

Максиминный критерий Вальда

Он основан на выборе стратегии игрока А, позволяющей гарантировать

ему получение нижней цены игры:
VW= mах min aij.
i j
Слайд 31

Критерий минимального риска Сэвиджа Рекомендует выбирать стратегию, при которой величина риска

Критерий минимального риска Сэвиджа

Рекомендует выбирать стратегию, при которой величина риска принимает

наименьшее значение в самой неблагоприятной ситуации, т.е.
VS= min mах rij.
i j
Критерии Вальда и Сэвиджа основаны на пессимистической оценке обстановки. В отличие от них следующий критерий использует как пессимистический, так и оптимистический подход к ситуации.
Слайд 32

Критерий Гурвица По этому критерию выбирается максимум линейной комбинации максимальных или

Критерий Гурвица

По этому критерию выбирается максимум линейной комбинации максимальных или минимальных

выигрышей.
VH = mах {λ min aij +(1-λ) mах aij }.
i j j
Если λ=1, критерий Гурвица превращается в пессимистический критерий Вальда. При λ=0 - в критерий крайнего оптимизма, рассчитанный на наилучшее стечение обстоятельств. Обычно λ принимают в пределах от 0,5 до 0,7.
Слайд 33

Задача Возможно строительство четырех типов электростанций: тепловых (стратегия А1), приплотинных (А2),

Задача

Возможно строительство четырех типов электростанций: тепловых (стратегия А1), приплотинных (А2), бесшлюзовых

(А3), шлюзовых (А4). Эффективность каждого из типов зависит от различных факторов: режима рек, стоимости топлива и его перевозки и т.п.
Предположим, что выделено четыре различных состояния, каждое из которых означает определенное сочетание факторов, влияющих на эффективность энергетических объектов.
Слайд 34

Состояния природы обозначим через Р1, Р2, Р3 и Р4. Экономическая эффективность

Состояния природы обозначим через Р1, Р2, Р3 и Р4. Экономическая эффективность

строительства отдельных видов электростанций изменяется в зависимости от состояний природы и задана матрицей:
Проанализировать ситуацию и выбрать оптимальную стратегию:
Слайд 35

а) на основе критерия Бейеса - Лапласа при заданном распределении вероятности

а) на основе критерия Бейеса - Лапласа при заданном распределении вероятности

состояний природы Р = (1/7, 2/7, 3/7, 1/7);
б) на основе критерия Лапласа в предположении, что все состояния природы равновероятны;
в) используя максиминный критерий Вальда;
г) на базе критерия минимального риска Сэвиджа;
д) на основе критерия Гурвица при λ = 0,6.
Слайд 36

Решение: а) Определим математические ожидания выигрыша игрока А при выборе им

Решение:

а) Определим математические ожидания выигрыша игрока А при выборе им стратегии

Аi:
А1⇒М1= 5·1/7 + 2·2/7+8·3/7+4·1/7 = 37/7≈ 5,29;
А2⇒М2= 2·1/7 + 3·2/7+4·3/7+12·1/7 = 32/7≈ 4,57;
А3⇒М3= 8·1/7 + 5·2/7+3·3/7+10·1/7 = 37/7≈ 5,29;
А4⇒ М4= 1·1/7 + 4·2/7+2·3/7+8·1/7 = 23/7≈ 3,29.
VB-L = mах {5,29; 4,57; 5,29; 3,29} =5,29.
В соответствии с этим по критерию Бейеса-Лапласа наиболее предпочтительными являются стратегии А1 и А3.
Слайд 37

б) Если предположить, что все состояния природы равновероятны, то p1= p2=

б) Если предположить, что все состояния природы равновероятны, то p1= p2=

p3= =p4=1/4.
Определим математические ожидания выигрыша игрока А при выборе им стратегии Аi:
А1⇒∑ a1j /4 =(5+2+8+4)/4=19/4=4,75;
А2⇒∑ a2j /4=(2+3+4+12)/4=21/4=5,25;
А3⇒∑ a3j /4=(8+5+3+10)/4=26/4=6,5;
А4⇒∑ a4j /4=(1+4+2+8)/4=15/4=3,75.
Поскольку VL = mах {4,75; 5,25; 6,5; 3,75}= 6,5, то по критерию Лапласа оптимальной является стратегия А3.
Слайд 38

в) Согласно критерию Вальда VW= mах min aij. = mах {2,2,3,1}=3

в) Согласно критерию Вальда
VW= mах min aij. = mах {2,2,3,1}=3

i j
Следовательно максиминная стратегия игрока А - А3.
г) Построим матрицу рисков.
Слайд 39

Согласно критерию Сэвиджа определяем: VS=min mах r ij = min{8,6,5,7}= 5.

Согласно критерию Сэвиджа определяем:
VS=min mах r ij = min{8,6,5,7}= 5.
В

соответствии с этим критерием также наиболее предпочтительна стратегия А3.