Игровые методы принятия решений

Содержание

Слайд 2

Теория игр Неопределенными могут быть не только условия, в которых работает

Теория игр

Неопределенными могут быть не только условия, в которых работает предприятие

и принимаются решения, но и действия противников или других лиц, от которых зависит успех, или результат.
Слайд 3

Теория игр ЛПР приходится считаться не только со своими собственными целями,

Теория игр

ЛПР приходится считаться не только со своими собственными целями,
но

и с теми целями, которые ставят перед собой его партнеры.
И учитывать, кроме объективных, известных ему обстоятельств конфликта, еще и решения, которые принимают его противники, и которые ему, вообще говоря, неизвестны.
Слайд 4

Теория игр Теория принятия решений в условиях конфликта или математическая теория конфликтных ситуаций

Теория игр

Теория принятия решений в условиях конфликта
или математическая теория конфликтных ситуаций


Слайд 5

Физическая и социальная природа конфликта юридические лица, воюющие стороны, спортивные команды,

Физическая и социальная природа конфликта

юридические лица,
воюющие стороны,
спортивные команды,


конкурирующие фирмы,
биологические виды в борьбе за существование,
борьба технологий,
дележи рынков,…
Слайд 6

Задача теории игр выработка рекомендаций по рациональному образу действий участников конфликта

Задача теории игр

выработка рекомендаций по рациональному образу действий участников конфликта

Слайд 7

Конфликтная ситуация Чтобы сделать возможным математический анализ ситуации, надо построить упрощенную,

Конфликтная ситуация

Чтобы сделать возможным математический анализ ситуации, надо построить упрощенную,

схематизированную модель ситуации.
Такую модель принято называть игрой.
Слайд 8

Игра – это модель конфликта Принятие решений во взаимосвязанных ситуациях: большинство

Игра – это модель конфликта

Принятие решений во взаимосвязанных ситуациях:
большинство

проблем в экономических и социальных науках (стратегическое поведение, конкуренция, кооперация, риск и неопределенность)
приложения в области разработки новых технологий, ведения военных действий и т.д.
Слайд 9

Конфликт Любое явление, применительно к которому имеет смысл говорить о том,

Конфликт

Любое явление, применительно к которому имеет смысл говорить о том,


кто и как в этом конфликте участвует,
каковы его возможные исходы,
кто и как в этих исходах заинтересован,
в чем состоит эта заинтересованность.
Слайд 10

Элементы игры I - множество игроков Kd ⊂ I – коалиции

Элементы игры

I - множество игроков
Kd ⊂ I – коалиции действий,

xi ∈ Ωi
S=(x1,x2,…,xn) - исход конфликта, или ситуация
S⊂ Π Ωi
i
Слайд 11

Элементы игры Коалиции интересов - КI ⊂ I Заинтересованность fK(А) –

Элементы игры

Коалиции интересов - КI ⊂ I
Заинтересованность fK(А) –
каждая

из коалиций предпочитает одни исходы другим -

если fК(A)>fК(B)

Слайд 12

Классификация игр 1) KI≥2 – не менее 2-х заинтересованных сторон 2)

Классификация игр

1) KI≥2 –
не менее 2-х заинтересованных сторон
2) Kd=1 –

игра нестратегическая (неопределенности природы),
3) Kd ≥ 2 – игра стратегическая
Слайд 13

Классификация игр по количеству игроков - игры 2 и n игроков

Классификация игр

по количеству игроков - игры 2 и n игроков
по

количеству стратегий –
конечные и бесконечные;
по характеру взаимодействия игроков коалиционные и бескоалиционные;
по характеру выигрышей - игры с нулевой суммой и игры с ненулевой суммой;
по виду функций выигрыша –
матричные, биматричные, непрерывные, выпуклые, типа дуэлей и др.
Слайд 14

Классификация игр Антагонистическая игра – игра двух лиц с нулевой суммой.

Классификация игр

Антагонистическая игра – игра двух лиц с нулевой суммой.
Матричная игра

– конечная игра двух лиц с нулевой суммой, или
конечная антагонистическая игра.
Биматричная игра – конечная игра двух игроков с ненулевой суммой.
Слайд 15

Матричные игры I={I,II} I: X={xi}m II: Y={yj}n f1(x,y) – функция выигрыша

Матричные игры

I={I,II} I: X={xi}m
II: Y={yj}n
f1(x,y) – функция выигрыша


первого игрока
f2(x,y) – функция выигрыша
второго игрока
f1(x,y)=-f2(x,y)
Слайд 16

Матричные игры Матрица игры:

Матричные игры

Матрица игры:

Слайд 17

Функция выигрыша f1(xi,yj) – результат 1-го игрока, когда он сделал ход

Функция выигрыша

f1(xi,yj) – результат 1-го игрока,
когда он сделал ход

xi, а 2-ой игрок – ход yj,
т.е. в ситуации (xi,yj )
Слайд 18

В антагонистической игре цели игроков противоположны: Цель первого игрока – выиграть

В антагонистической игре цели игроков противоположны:

Цель первого игрока –

выиграть как можно больше,
цель второго -
проиграть как можно меньше
Слайд 19

Решить игру Найти оптимальные стратегии каждого игрока и оценить результат, т.е. выигрыш первого игрока

Решить игру

Найти оптимальные стратегии каждого игрока и
оценить результат,


т.е. выигрыш первого игрока
Слайд 20

Пример (х1,y2)→(x2,y2) (x2,y2) – ситуация равновесия Х1 Х2 Х3 y1 y2 y3

Пример

(х1,y2)→(x2,y2)
(x2,y2) – ситуация равновесия

Х1
Х2
Х3

y1 y2 y3

Слайд 21

Ситуация равновесия Если один игрок придерживается стратегии, соответствующей ситуации равновесия, то

Ситуация равновесия

Если один игрок придерживается стратегии, соответствующей ситуации равновесия,

то второму игроку невыгодно отступать от своей стратегии, соответствующей ситуации равновесия
Слайд 22

Ситуация равновесия Пусть (x*,y*) – ситуация равновесия f1(x,y) - выигрыш 1-го

Ситуация равновесия

Пусть (x*,y*) – ситуация равновесия
f1(x,y) - выигрыш 1-го игрока
f2(x,y) -

выигрыш 2-го игрока
тогда
f1(x,y*) ≤ f1(x*,y*)
f2(x*,y) ≤ f2(x*,y*)
Слайд 23

Ситуация равновесия f1(x,y*) ≤ f1(x*,y*) f2(x*,y) ≤ f2(x*,y*) , *(-1): -f2(x*,y)

Ситуация равновесия

f1(x,y*) ≤ f1(x*,y*)
f2(x*,y) ≤ f2(x*,y*) , *(-1):
-f2(x*,y) ≥ -f2(x*,y*), но
f1(x,y)

= -f2(x,y),
f1(x*,y) ≥ f1(x*,y*)
f1(x,y*) ≤ f1 (x*,y*) ≤ f1(x*,y)
Слайд 24

Ситуация равновесия Точка, выигрыш в которой первого игрока минимален по y и максимален по x:

Ситуация равновесия

Точка, выигрыш в которой первого
игрока минимален по

y и максимален по x:
Слайд 25

Гарантированный результат ν1= maxx miny fij – гарантированный результат 1-го игрока

Гарантированный результат

ν1= maxx miny fij –
гарантированный результат
1-го

игрока
Слайд 26

Гарантированный результат ν2= min max fij - y x гарантированный результат 2-го игрока 5 2 4

Гарантированный результат

ν2= min max fij -
y x
гарантированный результат
2-го игрока

5 2 4
Слайд 27

Гарантированные результаты ν1=ν – нижняя цена игры, ν2= – верхняя цена игры

Гарантированные результаты

ν1=ν –
нижняя цена игры,
ν2= –


верхняя цена игры
Слайд 28

Th. Неравенство минимаксов ν ≤ , или ≤

Th. Неравенство минимаксов

ν ≤ , или


Слайд 29

Доказательство ≤ - по свойству с.р. Но если f(x) то min f(x)

Доказательство


- по свойству с.р.
Но если f(x)то min

f(x)
Слайд 30

Неравенство минимаксов Если функция ограничена сверху константой, то и максимум этой функции ограничен ею же ч.т.д.

Неравенство минимаксов

Если функция ограничена сверху константой, то и максимум этой

функции ограничен ею же
ч.т.д.
Слайд 31

Ситуация равновесия ν1= maxx miny fij ν2= miny maxx fij Если ν1= ν2 - седловая точка

Ситуация равновесия

ν1= maxx miny fij
ν2= miny maxx fij
Если ν1=

ν2 -
седловая точка
Слайд 32

Седловая точка

Седловая точка

Слайд 33

Пример ν1=2 ν2=2

Пример


ν1=2

ν2=2

Слайд 34

Седловая точка Седловых точек в игре может быть несколько, причем цена игры в каждой одинакова

Седловая точка


Седловых точек в игре может быть несколько, причем

цена игры в каждой одинакова
Слайд 35

Принцип достижимости целей Стремление игроков к ситуации равновесия, описываемой седловой точкой,

Принцип достижимости целей

Стремление игроков к ситуации равновесия, описываемой седловой точкой,


т.к. только ситуации равновесия могут быть предметом договоров, которые будут соблюдаться (игрокам невыгодно отступать от такой ситуации).
Слайд 36

Существуют ли оптимальные решения в играх без седловых точек? Теорема Неймана

Существуют ли оптимальные решения в играх без седловых точек?

Теорема Неймана

гарантирует,
что каждая антагонистическая игра имеет
оптимальные стратегии
Слайд 37

Пример 6 8 __________________ 2 4 = 4; =6. ν∈ [4;6] ν – цена игры

Пример

6 8

__________________

2
4

= 4; =6.
ν∈ [4;6]
ν – цена

игры
Слайд 38

Игры с закрытой информацией В играх без седловой точки свои ходы

Игры с закрытой информацией

В играх без седловой точки свои

ходы надо тщательно скрывать.
Однако интервал [4,6] каждый из игроков хочет перераспределить в свою пользу,
и это выгодно им обоим.
Значит, надо придумать такую процедуру поведения, чтобы
ν∈[4,6].
Слайд 39

Идея использования смешанных стратегий Правильное поведение состоит в том, чтобы стратегию

Идея использования смешанных стратегий

Правильное поведение состоит в том, чтобы стратегию

выбирать случайно –
не на основании каких-то разумных
соображений, -
но сама схема рандомизации
должна выбираться
разумно
Слайд 40

Смешанная стратегия Случайная величина, значениями которой являются чистые стратегии игрока. Это

Смешанная стратегия

Случайная величина, значениями которой являются чистые стратегии игрока.


Это сложная стратегия, состоящая в случайном чередовании двух или более чистых стратегий с определенными частотами.
В теории игр доказано, что
устойчивое решение в играх без седловой точки лежит в области смешанных стратегий.
Слайд 41

Смешанная стратегия Р= - смешанная стратегия первого игрока, или вероятностное распределение

Смешанная стратегия
Р= - смешанная
стратегия первого игрока,

или вероятностное

распределение
на множестве чистых стратегий
Р = (р1, р2, …, рm),
причем ∑ pi=1.
Слайд 42

Смешанная стратегия Q= - cмешанная стратегия второго игрока, Q = (q1, q2, …, qn), ∑ qj=1.

Смешанная стратегия
Q=

- cмешанная
стратегия
второго игрока,

Q = (q1, q2, …,

qn),
∑ qj=1.
Слайд 43

Смешанная стратегия Применение смешанной стратегии - это гибкая тактика, при которой

Смешанная стратегия

Применение смешанной стратегии - это гибкая тактика,
при

которой противник не знает и не может знать заранее, с чем ему придется встретиться
Слайд 44

Смешанная стратегия Любая чистая стратегия является частным случаем смешанной: например, х1=Р(1,0,…,0).

Смешанная стратегия

Любая чистая стратегия является частным случаем смешанной:
например,

х1=Р(1,0,…,0).
Таким образом, для любой игры существует пара (P,Q) смешанных стратегий.
Платеж, соответствующий паре (P,Q), называется ценой игры ν.
Стратегии, которые входят в оптимальную смешанную стратегию (им соответствуют ненулевые вероятности), называются
активными стратегиями.
Слайд 45

Алгоритм решения игры Упростить игру. Найти гарантированные результаты для каждого игрока.

Алгоритм решения игры

Упростить игру.
Найти гарантированные результаты для каждого игрока.
Если существует седловая

точка, то найти решение игры в чистых стратегиях.
Если седловой точки нет, то найти решение игры в смешанных стратегиях.
Слайд 46

Решение игр 2х2 А= - платежная матрица Решение игры будем искать

Решение игр 2х2
А=

- платежная матрица

Решение игры будем искать
в смешанных

стратегиях:
P=(p1,p2) - для первого игрока и
Q=(q1,q2) – для второго.
Слайд 47

Решение игр 2х2 Это значит, что первый игрок будет применять свою

Решение игр 2х2

Это значит, что первый игрок будет применять свою первую

стратегию
х1 с вероятностью р1,
а свою вторую стратегию
х2 – с вероятностью р2,
причем р1+р2=1.
Слайд 48

Пример P1 p2 q1 q2 Мν=6p1q1+2p1q2+4p2q1+8p2q2 p2=1-p1, q2=1-q1 Мν= 6p1q1+2p1(1-q1)+4(1-p1)q1+8(1-p1)(1-q1)= ν∈ [4;6]

Пример

P1
p2

q1 q2

Мν=6p1q1+2p1q2+4p2q1+8p2q2
p2=1-p1, q2=1-q1

Мν= 6p1q1+2p1(1-q1)+4(1-p1)q1+8(1-p1)(1-q1)=

ν∈ [4;6]

Слайд 49

=-6p1-4q1+8+8p1q1= =8(p1-1/2)(q1-3/4)+5 Ответ: P={1/2; 1/2}; Q={3/4; 1/4}; ν=5

=-6p1-4q1+8+8p1q1=
=8(p1-1/2)(q1-3/4)+5
Ответ:
P={1/2; 1/2}; Q={3/4; 1/4}; ν=5

Слайд 50

Решение игр 2х2 Решим игру в общем виде с точки зрения

Решение игр 2х2

Решим игру в общем виде с точки зрения второго

игрока
Перепишем матрицу игры
в следующем виде:
Найдем средний проигрыш второго игрока:
а11⋅q1+a12⋅q2=ν - при первой стратегии первого игрока,
а21⋅q1+a22⋅q2=ν - при второй стратегии первого игрока,
Слайд 51

Решение игр 2х2 (а11-а21)⋅q1+(a12-а22)⋅q2=0, затем, учитывая, что q2=1-q1, получим (а11-а21-а12+а22)⋅q1+(a12-а22)=0. Отсюда

Решение игр 2х2

(а11-а21)⋅q1+(a12-а22)⋅q2=0,
затем, учитывая, что q2=1-q1,
получим
(а11-а21-а12+а22)⋅q1+(a12-а22)=0.
Отсюда


q1=-(a12-а22)/(а11-а21-а12+а22).
Подставляя это значение q1 в любое
из уравнений, получим значение цены игры ν
Слайд 52

С точки зрения первого игрока а11⋅p1+a21⋅p2=ν - при первой стратегии второго

С точки зрения первого игрока

а11⋅p1+a21⋅p2=ν - при первой стратегии

второго
игрока,
а12⋅p1+a22⋅p2=ν - при второй стратегии второго
игрока.
p1(a11-a12) +(a21-a22)(1-p1)=0
p1= (a22-a21)
(a11-a12+a22-a21)
Слайд 53

Пример Матрица игры А= Составим систему уравнений для второго игрока: 6q1+2q2=ν

Пример

Матрица игры А=
Составим систему уравнений для второго игрока:
6q1+2q2=ν
4q1+8q2=ν

решая совместно, получим 2q1-6(1-q1)=0, или 8q1=6, или q1=3/4.
Отсюда Q=(3/4;1/4).
Цена игры ν = 6⋅3/4+2⋅1/4 = 5 ∈[4,6].


Слайд 54

Пример Найдем оптимальную стратегию первого игрока. Поскольку цена игры уже известна,

Пример

Найдем оптимальную стратегию первого игрока.
Поскольку цена игры уже

известна, то достаточно написать только одно уравнение для среднего выигрыша первого игрока:
6p1+4p2=5,
p2=1-p1,
после подстановки получим
2p1+4=5,
откуда р1=1/2.
Следовательно,
Р=(1/2;1/2).
Слайд 55

Ответ: P=(1/2;1/2), Q=(3/4;1/4), ν =5.

Ответ:
P=(1/2;1/2), Q=(3/4;1/4),
ν =5.

Слайд 56

Решение примера методом Крамера А= , ее определитель ⏐А⏐=6⋅8-4⋅2=40. Тогда q1=

Решение примера методом Крамера

А= ,
ее определитель ⏐А⏐=6⋅8-4⋅2=40.
Тогда

q1= , q2=
Поскольку q1+q2=1, то из 8ν/40=1 следует
ν=5, значит, Q={3/4;1/4}
Слайд 57

Решение примера методом Крамера Вероятности P можно найти аналогично, но из

Решение примера методом Крамера

Вероятности P можно найти аналогично,
но

из транспонированной матрицы
А*= , 6p1 +4p2=ν
2p1 +8p2 =ν
тогда p1= =4ν/40.
ν=5 P={1/2;1/2}.
Слайд 58

Решение игр 2×n и m×2 Если один из игроков имеет 2

Решение игр 2×n и m×2


Если один из игроков

имеет 2 стратегии,
а другой игрок -
больше двух стратегий,
то игра решается
графическим способом
Слайд 59

Решение игр 2×n У первого игрока - 2 стратегии, у второго

Решение игр 2×n

У первого игрока - 2 стратегии,
у второго

игрока - n стратегий.
Если в игре нет седловой точки,
то будем искать решение игры
в смешанных стратегиях.
Решаем игру с точки зрения
того игрока,
у которого две стратегии.
Слайд 60

Решение игр 2×n Матрица игры: p2=1-p1 ν1=a11 p1+a21 p2= a21+(a11-a21)p1 ν2=a12

Решение игр 2×n

Матрица игры:
p2=1-p1
ν1=a11 p1+a21 p2= a21+(a11-a21)p1
ν2=a12 p1+a22 p2= a22+(a12-a22)p1


….
νn=a1n p1+a2n p2= a2n+(a1n-a2n)p1

p1
p2

Слайд 61

Графо-аналитический метод Линейные функции ν1, ν2,…,νn отражают зависимость среднего выигрыша 1-го

Графо-аналитический метод

Линейные функции ν1, ν2,…,νn отражают зависимость
среднего выигрыша

1-го игрока
от вероятности р1
при различных стратегиях 2-го игрока.
Для анализа ситуации необходимо изобразить их графически в осях ν1–p1, имея в виду, что областью определения функций ν1, ν2,…,νn является интервал [0,1]
Слайд 62

Гарантированный результат первого игрока ν= max min{a2j+(a1j – a2j)p1} i j

Гарантированный результат первого игрока
ν= max min{a2j+(a1j – a2j)p1}
i j

Слайд 63

Чтобы обеспечить себе гарантированный результат, первый игрок должен выделить нижнюю границу

Чтобы обеспечить себе гарантированный результат,

первый игрок должен выделить
нижнюю

границу среднего выигрыша
при любой стратегии второго игрока,
а затем найти максимальное значение среднего результата на этой границе
Слайд 64

Решение игры Соответствующая абсцисса равна вероятности применения первым игроком его первой

Решение игры

Соответствующая абсцисса равна вероятности применения первым игроком
его первой стратегии,


а ордината равна цене игры
Слайд 65

Пример Решить игру А= =1, =3 Решаем ее с точки зрения

Пример

Решить игру А=

=1,

=3

Решаем ее с точки зрения

I игрока

ν1=2р1+4р2=2р1+4(1-р1)=4-2р1 ν2=3р1+р2=1+2р1
ν3= р1+6р2=6-5р1
ν4=5р1+0р2=5р1

p1
p2

Слайд 66

6 5 4 3 2 1 0 ν 4 ν2 ν3

6
5
4
3
2
1
0

ν 4

ν2

ν3

ν1

0 Р1* 1 р1

ν

Решение игры

Слайд 67

Верхняя точка границы образована пересечением прямых ν3 и ν2 (р1*, ν)∈

Верхняя точка границы

образована пересечением прямых ν3 и ν2
(р1*,

ν)∈ ν3∩ν2.
Координаты точки пересечения найдем из равенства 1+2р1=6-5р1,
Отсюда 7р1=5 и
р1*= , р2= ⇒
ν=1+ 2*5/7=17/7
Слайд 68

Для 2-го игрока стратегии y1 и y4 – неактивные, т.к. не

Для 2-го игрока

стратегии y1 и y4 – неактивные, т.к. не

используются в смешанной стратегии.
Тогда смешанную стратегию второго игрока найдем из
q1= = = ⇒
Q= (0; ; ;0).
Ответ: P=(5/7; 2/7), ν=17/7; Q=(0; 5/7; 2/7; 0).
Слайд 69

Решение игр m×2 У 1-го игрока m стратегий, у 2-го игрока – 2 стратегии Матрица игры

Решение игр m×2

У 1-го игрока m стратегий,
у 2-го

игрока – 2 стратегии
Матрица игры
Слайд 70

Решаем с точки зрения того игрока, который имеет 2 стратегии, т.е.

Решаем с точки зрения того игрока, который имеет 2 стратегии, т.е.

второго.
Р= (р1,…, рm) – смешанная стратегия 1-го игрока
Q= (q1, q2) – смешанная стратегия
2-го игрока
Слайд 71

Средний проигрыш 2-го игрока ν1=a11 q1+a12 q2=a11+(a11 - a12)q1 … νm=am1q1+am2q2=am1+(am1 - am2)q1 q1 q2

Средний проигрыш 2-го игрока

ν1=a11 q1+a12 q2=a11+(a11 - a12)q1

νm=am1q1+am2q2=am1+(am1 - am2)q1


q1 q2

Слайд 72

Гарантированный результат второго игрока

Гарантированный результат второго игрока

Слайд 73

Средний проигрыш 2-го игрока В семействе прямых, описывающих средний проигрыш 2-го

Средний проигрыш 2-го игрока

В семействе прямых, описывающих средний проигрыш 2-го

игрока,
отмечаем верхнюю границу и выбираем на ней самую нижнюю точку.
Ее координаты определяют искомую вероятность q1 и цену игры ν.
Слайд 74

Смешанная стратегия 1-го игрока Активными стратегиями первого игрока будут те, которые

Смешанная стратегия 1-го игрока

Активными стратегиями первого игрока будут те, которые

соответствуют прямым, образующим точку пересечения (q1,ν).
Оптимальные стратегии первого игрока определим из матрицы 2х2
Слайд 75

Пример Матрица игры Средний проигрыш 2-го игрока ν1=4q1+2q2 = 4q1 +2(1-q1)= 2+2q1, ν2=2 q1+5q2= 5-3q1, ν3=3q1+4q2=4-q1

Пример

Матрица игры

Средний проигрыш 2-го игрока
ν1=4q1+2q2 = 4q1 +2(1-q1)= 2+2q1,
ν2=2 q1+5q2=

5-3q1,
ν3=3q1+4q2=4-q1
Слайд 76

Смешанная стратегия 2-го игрока (q1*, ν) ∈ ν1∩ν3 ⇒ 2+2q1=4-q1, 0

Смешанная стратегия 2-го игрока

(q1*, ν) ∈ ν1∩ν3 ⇒
2+2q1=4-q1,

0

1 q1

5
4
3
2
1

q1*=

ν= 2+2*2/3=10/3

Слайд 77

Смешанная стратегия 1-го игрока Из матрицы А* p1= = = Ответ:

Смешанная стратегия 1-го игрока

Из матрицы А*

p1=

=

=

Ответ: Q=(2/3; 1/3), ν=10/3, P=(1/3;

0; 2/3).

А=

Слайд 78

Решение игр mxn X={xi}m – стратегии 1-го игрока Y={yj}n – стратегии

Решение игр mxn

X={xi}m – стратегии 1-го игрока
Y={yj}n – стратегии 2-го

игрока
Р=(р1, р2, …, рm) и Q=(q1, q2, …, qn) –
их смешанные стратегии,
причем Σpi=1, Σqj=1.
Слайд 79

Первый игрок Найдем сначала оптимальную стратегию Р. Она должна обеспечить выигрыш

Первый игрок

Найдем сначала оптимальную стратегию Р.
Она должна обеспечить

выигрыш
≥ν при любой стратегии противника
и =ν при его оптимальном поведении Q.
Слайд 80

Пусть ν>0 Чтобы это выполнялось, достаточно, чтобы все элементы матрицы aij

Пусть ν>0

Чтобы это выполнялось, достаточно, чтобы все элементы матрицы

aij >0.
В противном случае можно прибавить ко всем элементам матрицы А достаточно большое число М,
тогда цена игры увеличится на М,
а вероятности останутся теми же
Слайд 81

для любого j Введем обозначения: xi=pi/ν, тогда Выбор должен быть максимально

для любого j

Введем обозначения: xi=pi/ν, тогда

Выбор должен быть максимально возможным, следовательно,

1/ν принимает минимальное значение.
Слайд 82

Второй игрок Все аналогично решению игры для первого игрока, только второй

Второй игрок

Все аналогично решению игры для первого игрока, только второй

игрок стремится не максимизировать, а минимизировать свой проигрыш ν, а значит, максимизировать величину 1/ν.
Слайд 83

для любого i. для любого i. Заменим yj=qj/ν, тогда Σyj=1/ν Требуется

для любого i.

для любого i.

Заменим yj=qj/ν, тогда

Σyj=1/ν

Требуется

так выбрать переменные yj, чтобы максимизировать функцию
или, что то же самое,
минимизировать функцию L’=-L:
Слайд 84

Симметричные игры Опр. Квадратная матрица А={aij} называется кососимметричной, если aij= - aji для любого i.

Симметричные игры

Опр. Квадратная матрица А={aij} называется кососимметричной, если aij= -

aji
для любого i.
Слайд 85

Tеорема Значение симметричной игры равно нулю. Кроме того, если х –

Tеорема

Значение симметричной игры равно нулю.
Кроме того, если х

– оптимальная стратегия первого игрока,
то х также оптимальная стратегия для второго.
т.е. P=Q; ν=0.
Слайд 86

Пример По теореме ν=0; т.к. P=Q, то найдем P. Р1 Р2 Р3

Пример

По теореме ν=0;
т.к. P=Q,
то
найдем

P.

Р1
Р2
Р3

Слайд 87

Средний выигрыш 1-го игрока -р2+2р3=0 → р2=2р3 р1 -3р3=0 → р1

Средний выигрыш 1-го игрока

-р2+2р3=0 → р2=2р3
р1 -3р3=0 →

р1 =3р3
-2р1+3р2 =0
р1+ р2+ р3=1

2р3 +3р3 +р3=1
6р3=1; р3=1/6; р2=1/3; р1=1/2
P=Q=(1/2; 1/3; 1/6)

Слайд 88

Метод итераций Брауна-Джонсона Разыгрывается мысленный эксперимент, в котором 1-ый и 2-ой

Метод итераций Брауна-Джонсона

Разыгрывается мысленный эксперимент, в котором 1-ый и 2-ой применяют

друг против друга свои стратегии:
1-ый – xi, 2-ой - yj , который минимизирует aij

Слайд 89

Смешанная стратегия игрока в разных случаях имеет разный смысл. Иногда конфликт

Смешанная стратегия

игрока в разных случаях имеет разный смысл.
Иногда конфликт

должен быть разрешен всего за один ход противников.
Слайд 90

Например, размещение заказа на разных предприятиях установление цены на продукцию оснащение

Например,
размещение заказа на разных предприятиях
установление цены на продукцию
оснащение производства современным

оборудованием
ведение боевых действий с применением разных стратегий и т.д.
Слайд 91

Тактические задачи - В задачах поиска наилучших способов использования потенциала системы

Тактические задачи

- В задачах поиска наилучших способов использования потенциала системы

(«тактических»)
оптимальные смешанные стратегии реализуются путем неожиданных переходов от одного способа действий к другому в соответствии с pi и qj.
Слайд 92

Физическая смесь стратегий В задачах выбора рациональных параметров («технических») случайный подбор

Физическая смесь стратегий

В задачах выбора рациональных параметров («технических»)
случайный подбор

технических показателей недопустим.
Физическая смесь стратегий предполагает реализацию сразу нескольких технических решений
в определенных пропорциях.
Слайд 93

- создание уникальных систем; строительство капитальных сооружений; крупносерийное производство и другие долгосрочные мероприятия, требующие значительных затрат

- создание уникальных систем;
строительство капитальных сооружений;
крупносерийное производство и
другие долгосрочные

мероприятия, требующие значительных затрат
Слайд 94

Модель комплектации вычислительного центра Предполагается организовать ВЦ коллективного пользования, который может

Модель комплектации вычислительного центра

Предполагается организовать ВЦ коллективного пользования, который может

быть оснащен ЭВМ 4-х типов.
На обработку принимаются данные, относящиеся к одному из пяти видов задач:
- календарное планирование;
- распределение материальных
ресурсов;
- статистическая отчетность и т.д.
Слайд 95

Обработка требует определенного времени, зависящего от характеристик используемой ЭВМ, сложности и

Обработка требует определенного времени, зависящего от характеристик используемой ЭВМ, сложности

и объема вычислений и т.д.
Расходы оплачивают заказчики:
Слайд 96

Цели 1 –ый игрок (организаторы ВЦ) стремится увеличить приток средств от

Цели

1 –ый игрок (организаторы ВЦ)
стремится увеличить приток средств от

заказчика за счет ускорения обработки заказов и применения дорогостоящих ЭВМ
2 –ой игрок (заказчики-пользователи)
старается разумно расходовать свои средства (требования к срокам, корректная постановка, ранжирование задач)
Слайд 97

400р3+700р4=ν1= 700-300р3 500р3+200р4=ν4= 200+300р3 800р3+100р4=ν5= 100+700р3

400р3+700р4=ν1= 700-300р3
500р3+200р4=ν4= 200+300р3
800р3+100р4=ν5= 100+700р3

Слайд 98

Решение Р=(0; 0; 5/6; 1/6) ν=450 Количество ЭВМ оценивается с помощью методов ТМО

Решение

Р=(0; 0; 5/6; 1/6)
ν=450
Количество ЭВМ оценивается с помощью методов ТМО

Слайд 99

Замечание Антагонистические игры описывают конфликты весьма частного вида

Замечание

Антагонистические игры описывают конфликты
весьма частного вида

Слайд 100

После того, как с помощью матричной игры оценили личные стратегические возможности

После того, как с помощью матричной игры оценили личные стратегические

возможности ЛПР (1-ый игрок)
при полном антагонизме сторон,
целесообразно продолжить исследование ситуации на основе дополнительной информации о предпочтениях субъектов
Слайд 101

Обоснование решений с использованием биматричных игр Антагонистические игры не описывают конфликты

Обоснование решений с использованием биматричных игр

Антагонистические игры не описывают конфликты с

числом сторон >2.
Интересы сторон даже с двумя участниками не обязательно противоположны f1 ≠ -f2.
Различие в оценках ситуации оставляет место для соглашений, договоров и кооперации
Для ЛПР цена игры имеет незначительную ценность.
Слайд 102

Игры двух лиц с произвольной суммой (бескоалиционные) 1-ый игрок: {хi}m=Х 2-ой

Игры двух лиц с произвольной суммой (бескоалиционные)

1-ый игрок: {хi}m=Х
2-ой игрок: {yj}n=Y
A={aij}

– выигрыш 1-го
B={bij} – выигрыш 2-го
P=(p1, p2, …, pm)
Q=(q1, q2,…, qn)
Слайд 103

Решение игры С точки зрения первого игрока его средний выигрыш (матрица

Решение игры

С точки зрения первого игрока его средний выигрыш

(матрица А) должен быть больше или равен среднему выигрышу второго игрока при любой стратегии 2-го.
Слайд 104

Решение игры A= Средний выигрыш первого игрока: Мν1=

Решение игры

A=

Средний выигрыш первого игрока:

Мν1=

Слайд 105

∑aij qj ≤ ∑∑aijpiqj , j i j n ∑qj=1, для любых i, j j=1 ,

∑aij qj ≤ ∑∑aijpiqj ,
j i j
n
∑qj=1, для

любых i, j
j=1

,

Слайд 106

Средний выигрыш второго игрока: Мν2= M m n m ∑bij pi

Средний выигрыш второго игрока:

Мν2=

M m n m
∑bij pi ≤ ∑∑bijpiqj

, ∑pi=1 для любых j
i=1 i j i=1

B=

Слайд 107

Существование с.р. в бескоалиционных играх не определяет их решений Однозначные рекомендации для сторон пока отсутствуют

Существование с.р. в бескоалиционных играх не определяет их решений
Однозначные рекомендации для

сторон пока отсутствуют
Слайд 108

Пример А= В= р1= = р2= = ν1= - 4/7 Р=(1/7; 6/7).

Пример

А= В=
р1= =
р2= = ν1= - 4/7
Р=(1/7; 6/7).


Слайд 109

Для 2-го игрока Матрица В содержит выигрыши 2-го игрока, цель которого

Для 2-го игрока

Матрица В содержит выигрыши 2-го игрока, цель которого

– тоже выиграть как можно больше!
Это равносильно тому, что он играет как первый игрок, т.е.
по транспонированной матрице В
q1= = ; q2= = ⇒ ⇒
ν= 1/3 ; Q=(2/9; 7/9).
Слайд 110

A={aij}, B={bij} (A,B)={(aij,bij)} ОБОЗНАЧЕНИЯ

A={aij}, B={bij}
(A,B)={(aij,bij)}

ОБОЗНАЧЕНИЯ

Слайд 111

Редко удается предсказать исходы Б. игр Отсутствие связи между платежами сторон

Редко удается предсказать исходы Б. игр

Отсутствие связи между платежами сторон (нет

влияния сторон друг на друга)
Возможность действовать самостоятельно, независимо
Слайд 112

В неантагонистической игре отклонение игрока от с.р. может по-разному повлиять на выигрыш другого

В неантагонистической игре отклонение игрока от с.р. может по-разному повлиять на

выигрыш другого
Слайд 113

Теорема Нэша Каждая биматричная игра имеет по крайней мере одну ситуацию

Теорема Нэша

Каждая биматричная игра имеет по крайней мере одну ситуацию

равновесия.
Равновесный по Нэшу результат не меньше, чем максиминный для каждого игрока
Слайд 114

Только равновесные ситуации могут быть предметом результативных переговоров Необходим анализ игры с целью установления таких ситуаций

Только равновесные ситуации могут быть предметом результативных переговоров

Необходим анализ игры


с целью
установления
таких ситуаций
Слайд 115

Пример 1. Переговоры по сокращению объема продукции y1 y2 x1 x2

Пример 1. Переговоры по сокращению объема продукции

y1 y2

x1
x2

1 – настаивать

на принятии своих предложений
2 – принять предложения конкурента
Если стороны не придут к соглашению, то полезность переговоров = 0

Стрелка направляется на более предпочтительную альтернативу при фиксированной стратегии конкурента

Слайд 116

Пример 2. Переговоры о масштабах сокращения объема продукции Альтернативы 1 –

Пример 2. Переговоры о масштабах сокращения объема продукции

Альтернативы
1 – выпуск на

прежнем уровне;
2 – существенное сокращение выпуска
А. Действенных мер контроля нет
(3;3) (10;0)
(0;10) (9;9)
Слайд 117

В отсутствие контроля ни одна из сторон не пойдет на сокращение выпуска продукции

В отсутствие контроля
ни одна из сторон не пойдет

на сокращение выпуска продукции
Слайд 118

Б. Действенные меры контроля (разработана система штрафов за нарушение договоренностей) (3;3)

Б. Действенные меры контроля
(разработана система штрафов за нарушение договоренностей)

(3;3)

(7;0)
(0;7) (8;8)

х1
х2

y1 y2

Игра с предпочтениями:
смешанные стратегии не применяются

Слайд 119

Ситуация Равновесия по Нэшу - схема анализа, когда никакое кооперирование не

Ситуация Равновесия по Нэшу -

схема анализа, когда никакое кооперирование не

допускается.
Если равновесный по Нэшу выигрыш участников не устраивает, то следует начать обмениваться информацией и договариваться о совместном поведении в игре
Слайд 120

Во многих случаях полезны и даже необходимы контакты и соглашения между

Во многих случаях полезны и даже необходимы контакты и соглашения между

участниками, поэтому модели, допускающие возможность кооперирования, более предпочтительны
Слайд 121

Кооперативная игра Разрешено заключать совместные соглашения Допускается совместный выбор стратегий Допускается

Кооперативная игра

Разрешено заключать совместные соглашения
Допускается совместный выбор стратегий
Допускается передавать полезность от

одного игрока к другому

Принцип групповой рациональности

Слайд 122

«Справедливый дележ» по Нэшу «начало отсчета» - (ν1*, ν2*) - минимальный

«Справедливый дележ» по Нэшу

«начало отсчета» - (ν1*, ν2*) - минимальный результат,

ниже которого игрок не согласится получить ни при каких обстоятельствах
(наибольший гарантированный результат в антагонистической игре)
(ν1, ν2) – согласованный дележ.
Δν1= ν1-ν1*, Δν2=ν2- ν2*
φ(ν1, ν2)= Δν1 Δν2→max
(ν1°, ν2°): max φ(ν1, ν2)
{ν1, ν2}
Слайд 123

Мультипликативная целевая функция φ(ν1, ν2) моделирует допустимую компенсацию уменьшения одних значений

Мультипликативная целевая функция φ(ν1, ν2) моделирует допустимую компенсацию уменьшения одних

значений частных компонентов за счет увеличения других
Слайд 124

Если кто-то из игроков не удовлетворен компромиссным решением, он может исследовать

Если кто-то из игроков не удовлетворен компромиссным решением, он может

исследовать свои стратегические возможности
по применению
стратегии угроз
Слайд 125

Применение стратегии угроз (реальная или провозглашенная в качестве возможной альтернатива поведения:

Применение стратегии угроз
(реальная или провозглашенная в качестве возможной альтернатива

поведения:
склонить противника к мысли, что ему выгоднее пойти на уступки при дележе;
изменить мнение относительно ситуаций конфликта, суждение о пропорциях дележа)
Слайд 126

Эффективность стратегии угрозы определяется результатом истинного воздействия на физический объект (изменение

Эффективность стратегии угрозы

определяется
результатом истинного воздействия на физический объект (изменение состояния

объекта)
психологическим воздействием на субъекта, которому угрожают (изменяется мнение о ситуации, о пропорциях дележа и т.д.)
правдоподобностью и обдуманностью (нет сомнений, что угрозу приведут в исполнение)
Слайд 127

Пример (1;4) (-2;-4) (-3;-1) (4;1) 4 -3 -4 1 4 Пусть

Пример

(1;4) (-2;-4)
(-3;-1) (4;1)

4

-3

-4

1

4

Пусть стратегия угроз 1-го – х2
Тогда 2-ой

будет угрожать y1
(ν1’, ν2’) – результаты угроз
Ситуация угрозы (-3;-1)

N-E

ν1

ν2

(ν1’, ν2’)

φ(ν1,ν2)=[ν1-(-3)][(5- ν1)-(-1)]=- (ν1)↑2+3 ν1+18

ν1+ν2=5

Слайд 128

Решение φ(ν1,ν2)=- (ν1)↑2+3ν1+18 φ’(ν1)=-2ν1+3=0 ν’1=1,5; ν’2=3,5

Решение

φ(ν1,ν2)=- (ν1)↑2+3ν1+18
φ’(ν1)=-2ν1+3=0
ν’1=1,5; ν’2=3,5

Слайд 129

Теория кооперативных игр продолжает развиваться, привлекая к себе внимание исследователей прикладных проблем, в частности, проблем АСОиУ

Теория кооперативных игр продолжает развиваться, привлекая к себе внимание исследователей прикладных

проблем, в частности, проблем АСОиУ