Выбор решений с помощью дерева решений (позиционные игры)

Содержание

Слайд 2

Другое определение: деревья решений - это способ представления правил в иерархической,

Другое определение: деревья решений - это способ представления правил в иерархической,

последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение. Деревья решений разбивают данные на группы на основе значений переменных, в результате чего возникает иерархия операторов "ЕСЛИ - ТО", которые классифицируют данные.
Под правилом понимается логическая конструкция вида «если - то».
Объект – некоторый пример, действие, шаблон, наблюдение. Атрибут – признак, свойство.
Узел – внутренний узел дерева, узел проверки.
Лист – конечный узел дерева, узел решения.
Слайд 3

Слайд 4

Слайд 5

Построение деревьев Способ 1. Рисуют деревья слева направо. Необходимо начинать с

Построение деревьев
Способ 1. Рисуют деревья слева направо. Необходимо начинать с

отображения структуры проблемы в «стволе» будущего дерева решений (слева).
Дерево решений не содержит циклических элементов (новый лист или ветвь могут только расщепляться).
Места, где принимаются решения, обозначают квадратами, места появления исходов – кругами.
Ветви – это альтернативные решения, которые теоретически могут быть приняты в данной ситуации, а также возможные следствия принятия этих альтернативных решений. Ветви берут свое начало из одной точки (исходных данных), а «разрастаются» до получения конечного результата. Количество ветвей вовсе не свидетельствует о качестве дерева. В некоторых случаях (если дерево получается чересчур «ветвистым») рекомендуется даже воспользоваться отсечением второстепенных ветвей.
Ветви бывают двух видов:
пунктирные линии, которые соединяют квадраты - возможные решения;
сплошные линии, соединяющие кружки возможных конечных результатов.
.
Слайд 6

Помимо этого, на дереве решений необходимо отобразить всю информацию о времени

Помимо этого, на дереве решений необходимо отобразить всю информацию о времени

работ, их стоимости, а также вероятности принятия каждого решения;
после того, как все решения и предполагаемые результаты будут указаны на дереве, проводится анализ и выбор наиболее выгодного пути.
Одной из наиболее распространенной моделей дерева является трехслойная модель, когда за исходным вопросом идет первый слой возможных решений.
В методе деревьев решений после выбора одного из них вводится второй слой – события, которые могут последовать за принятием решения.
Третий слой – последствия для каждого случая.
.
Слайд 7

Составляя дерево решений, необходимо осознавать, что число вариантов развития ситуации должно

Составляя дерево решений, необходимо осознавать, что число вариантов развития ситуации должно

быть обозримым и иметь какое-то ограничение по времени. Кроме того, эффективность метода зависит от качества информации, положенной в схему.
Важным плюсом является то, что дерево решений можно совмещать с экспертными методами на этапах, требующих оценки результата специалистами. Это увеличивает качество анализа дерева решений и способствует правильному выбору стратегии. При анализе деревьев решений для каждой альтернативы рассчитывается ожидаемая стоимостная оценка (EMV) – максимальная из сумм оценок выигрышей, умноженных на вероятность реализации выигрышей, для всех возможных вариантов (см. пример 1).
Слайд 8

Процесс принятия решений с помощью дерева решений в общем случае предполагает

Процесс принятия решений с помощью дерева решений в общем случае предполагает

выполнение следующих пяти этапов.
Этап 1 . Формулирование задачи. Прежде всего необходимо отбросить не относящиеся к проблеме факторы, а среди множества оставшихся выделить существенные и несущественные. Это позволит привести описание задачи принятия решения к поддающейся анализу форме. Должны быть выполнены следующие основные процедуры: определение возможностей сбора информации для экспериментирования и реальных действий; составление перечня событий, которые с определенной вероятностью могут произойти; установление временного порядка расположения событий, в исходах которых содержится полезная и доступная информация, и тех последовательных действий, которые можно предпринять.
Слайд 9

Этап 2. Построение дерева решений. Этап 3 . Оценка вероятностей состояний

Этап 2. Построение дерева решений.
Этап 3 . Оценка вероятностей состояний среды,

т.е. сопоставление шансов возникновения каждого конкретного события. Следует отметить, что указанные вероятности определяются либо на основании имеющейся статистики, либо экспертным путем.
Этап 4 . Установление выигрышей (или проигрышей как выигрышей со знаком минус) для каждой возможной комбинации альтернатив (действий) и состояний среды.
Этап 5 . Решение задачи.
Слайд 10

Слайд 11

Вероятность сложных событий, которые представляют собой серию опытов и комбинацию всех

Вероятность сложных событий, которые представляют собой серию опытов и комбинацию всех

возможных исходов, определяется согласно двум правилам – сложения и умножения вероятностей (рис.2.1). В процессе принятия решений могут возникать независимые и несовместимые исходы (события).
Независимыми событиями А и В называются такие, если появление одного из них не изменяет вероятности появления другого.
Несовместимыми событиями А и В называются такие, если может произойти только одно из них.
Рассмотрим пример использования правила вычисления вероятностей для более чем двух событий.
Слайд 12

Рис. 2.1. Правила определения вероятности сложных событий

Рис. 2.1. Правила определения вероятности сложных событий

Слайд 13

Пример 1. ИС работает при условии одновременного функционирования узлов А, В

Пример 1. ИС работает при условии одновременного функционирования узлов А, В

и С, которые работают независимо друг от друга. Вероятность поломки этих узлов равна 0,2; 0,3; 0,1 соответственно. Какова вероятность, что ИС выйдет из строя?
Решение.
ИС функционирует только в случае бесперебойной работы каждого узла, в противном случае происходит остановка оборудования.
Слайд 14

Для каждого узла вероятности таковы: Р (поломка узла А) = 0,2,

Для каждого узла вероятности таковы:
Р (поломка узла А) = 0,2, следовательно,

Р (узел А работает) = 0,8;
Р (поломка узла В) = 0,3, следовательно, Р (узел В работает) = 0,7;
Р (поломка узла С) = 0,1, следовательно, Р (узел С работает) = 0,9.

По дереву вероятностей, представленному на рис.2.2 Определим вероятность бесперебойной работы узлов в течение года:
Р (работает А и работает В и работает С)=0,8*0,7*0,9=0,504
Однако необходимо вычислить вероятность поломки оборудования в течение года.

Эта вероятность равна сумме семи остальных «ветвей» или, так как вероятность полной группы событий (т.е. бесперебойная работа и поломка), равна 1, то:
Р(поломка) = 1 – Р(бесперебойная работа) = 1 – 0,504 = 0,496
С целью модификации вероятности в случае, когда появилась новая дополнительная информация, используется формула Байеса:
Р(АВ) = Р(А) * З(В/А) или Р(АВ) = Р(В) * Р(А/В),

Вероятность Р(А) подсчитывается до проведения опыта, поэтому носит теоретический, предварительный характер. Вероятность Р(А/В) основывается на данных уже проведенного эксперимента, поэтому более точна с практической точки зрения.

Слайд 15

Прежде чем продемонстрировать процедуру применения дерева решений, введем ряд определений. В

Прежде чем продемонстрировать процедуру применения дерева решений, введем ряд определений.

В зависимости от отношения к риску решение задачи может выполняться с позиций так называемых «объективистов» и «субъективистов». Поясним эти понятия на следующем примере. Пусть предлагается лотерея: за 10 д.е. (стоимость лотерейного билета) игрок с равной вероятностью р = 0,5 может ничего не выиграть или выиграть 100 д.е. Один индивид пожалеет и 10 д.е за право участия в такой лотерее, т.е. просто не купит лотерейный билет, другой готов заплатить за лотерейный билет 50 д.е., а третий заплатит даже 60 д.е. за возможность получить 100 д.е. (например, когда ситуация складывается так, что, только имея 100 д.е., игрок может достичь своей цели, поэтому возможная потеря последних денежных средств, а у него их ровно 60 д.е., не меняет для него ситуации).
Слайд 16

 

Слайд 17

Пример : Нужно принять решение о целесообразности приобретения оборудования для выполнения

Пример : Нужно принять решение о целесообразности приобретения оборудования для выполнения

сервисных работ двух типов M1 либо М2 . Оборудование М2 более экономично , что обеспечивает больший доход на единицу обслуживаемой техники, вместе с тем он более дорогой и требует относительно больших накладных расходов :

Процесс принятия решения может быть выполнен в несколько этапов :

Этап 1, Определение цели .
В качестве критерия выбиралась максимизация математического ожидания прибыли .
Этап 2 . Определение набора возможных действий для рассмотрения и анализа ((контролируются лицом , принимающим решение)
Может выбрать один из двух вариантов :
а1 - {покупка Ml}
а2 = {покупка М2}

Слайд 18

Этап 3 . Оценка возможных исходов и их вероятностей (носят случайный

Этап 3 . Оценка возможных исходов и их вероятностей (носят случайный

характер).
ЛПР оценивает возможные варианты годового спроса (кол-во заявок на обслуживание) и соответствующие им вероятности следующим образом :
х! = 1200 единиц с вероятностью 0.4
х2 = 2000 единиц с вероятностью 0.6
Этап 4. Оценка математического ожидания возможного дохода (EMV или ОДО) :
Слайд 19

Е MV(M1) = 9000 *0.4 + 25000 *0.6 =8600 ЕMV (M2)

Е MV(M1) = 9000 *0.4 + 25000 *0.6 =8600
ЕMV (M2)

= 7800 *0.4 + 27000 * 0.6= 19320
Таким образом, вариант с приобретением станка М2 экономически более целесообразен.
Слайд 20

В дальнейшем будем предполагать, что решения принимаются с позиции объективиста. Пример

В дальнейшем будем предполагать, что решения принимаются с позиции объективиста.
Пример 1.

Компания рассматривает вопрос о строительстве завода. Возможны три варианта действий:
а). Построить большой завод стоимостью Ст1 = 500 тысяч д.е.
При этом варианте возможны:
большой спрос- годовой доход в размере Д1 = 200 тысяч д.е. в течение следующих 5 лет с вероятностью p1 = 0,8;
низкий спрос- ежегодные убытки Д2 = 90 тысяч д.е. с вероятностью р2 = 0,2. б). Построить маленький завод стоимостью Ст2 = 300 тысяч д.е.
При этом варианте возможны:
большой спрос - годовой доход в размере Д3 = 100 тысяч д.е. в течение следующих 5 лет с вероятностью p3 = 0,8 ;
низкий спрос - ежегодные убытки Д4 = 40 тысяч д.е. с вероятностью р4 = 0,2; в). Отложить строительство завода на один год для сбора дополнительной информации, которая может быть позитивной или негативной с вероятностью p5 = 0,7и p6 = 0,3 соответственно. Доходы на последующие четыре года остаются прежними. В случае негативной информации компания заводы строить не будет.
Слайд 21

Нарисовав дерево решений, определим наиболее эффективную последовательность действий, основываясь на ожидаемых

Нарисовав дерево решений, определим наиболее эффективную последовательность действий, основываясь на ожидаемых

доходах.
Решение. Строим дерево решений. Строим узел 1, из которого исходят три заявленные в условии варианты. Обозначаем эти ветви пунктиром, поскольку это – возможные решения. На концах ветвей ставим узлы-исходы, заключаем их в круг и обозначаем буквами А, В и т.д.
Слайд 22

Рисуем из этих узлов-исходов ветви с возможными исходами при выборе того

Рисуем из этих узлов-исходов ветви с возможными исходами при выборе того

или иного варианта из условия. Под каждой ветвью подписываем вероятности соответствующих исходов. На концах каждой ветви, не закрытой новым узлом, выставляем доходы и убытки, умноженные (исходя из условия) на время (годы из условия). На ветвях (возможные решения) ставим стоимость строительства со знаком «-», так как это расходы компании. Убытки на концах «открытых» ветвей также пишем со знаком «-».
Слайд 23

Слайд 24

Далее считаем ожидаемые стоимостные оценки узлов. Ожидаемая стоимостная оценка узла А

Далее считаем ожидаемые стоимостные оценки узлов.
Ожидаемая стоимостная оценка узла А

равна:
ЕМV(А) = 0,8 х 1000 + 0,2 х (-450) -500 = 210.
EMV( B) = 0,8 х 500 + 0,2 х (-200) - 300 = 60.
EMV( D) = 0,9 x 800 + 0,1 x (-360) - 500 = 184.
EMV(E) = 0,9 x 400 + 0,1 х (-160) - 300 = 44.
Для узлов принятия решения 2 (второй уровень, условно) выбираем максимальную оценку:
EMV(2) = max {EMV( D), EMV( E)} = max {184, 44} = 184 = EMV(D).
Поэтому в узле 2 отбрасываем возможное решение «маленький завод».
EMV(C) = 0,7 x 184 + 0,3 x 0 = 128,8.
Для узла принятия решения 1 – узла принятия окончательного решения, аналогично выбираем максимальную оценку на других узлах.
EMV(1) = max {ЕМV(A), EMV(B), EMV(C)} = max {210; 60; 128,8} = 210 = EMV(А). Поэтому в узле 1 выбираем решение «большой завод». Исследование проводить не нужно. Строим большой завод. Ожидаемая стоимостная оценка этого наилучшего решения равна 210 тысяч д.е.
Ответ: наиболее подходящее решение – решение строить большой завод.
Слайд 25

Области применения деревьев Деревья решений и деревья классификации широко используются в

Области применения деревьев Деревья решений и деревья классификации широко используются в

таких прикладных областях, как медицина (диагностика), программирование (анализ структуры данных), ботаника (классификация) и психология (теория принятия решений). В основном, методы деревьев решений используют в экономической и банковской сферах. Например, для оценки кредитоспособности лиц или для выбора наиболее выгодной стратегии развития предприятия или сделки. В сфере промышленности деревья решений применяются для определения качества продукции и для его контроля, выявления дефектов.
Слайд 26

Пример 2. Для финансирования проекта бизнесмену нужно занять сроком на один

Пример 2. Для финансирования проекта бизнесмену нужно занять сроком на один

год 15000 д. е. Банк может одолжить ему эти деньги под 15% годовых или вложить в дело со 100%-ным возвратом суммы, но под 9% годовых. Из прошлого опыта банкиру известно, что 4% таких клиентов ссуду не возвращают. Что делать? Давать ему заем или нет? Перед вами пример задачи с одним решением, поэтому можно воспользоваться как таблицей доходов, так и "деревом". Рассмотрим оба варианта.

Решение 1 (по таблице доходов).
Максимизируем ожидаемый в конце года чистый доход, который представляет собой разность суммы, полученной в конце года, и инвестированной в его начале. Таким образом, если заем был выдан и возвращен, то чистый доход составит:.
Чистый доход = ((15000 + 15% от 15000) - 15000) = 2250 д. е.
Таблица 1. Чистый доход в конце года, д. е.

Слайд 27

Если банк решает выдать заем, то максимальный ожидаемый чистый доход равен

Если банк решает выдать заем, то максимальный ожидаемый чистый доход равен

1560 ф. ст.
Решение 2 (по "дереву" решений).
В данном случае также используем критерий максимизации ожидаемого чистого дохода на конец года.
Слайд 28

Далее расчет ведется аналогично расчетам по таблице доходов. Ожидаемый чистый доход

Далее расчет ведется аналогично расчетам по таблице доходов. Ожидаемый чистый доход

в кружках А и В вычисляется следующим образом:
В кружке А:
Е (давать заем) = {17250 х 0,96 + 0 х 0,04} - 15000 =
= 16500 - 15000 = 1560 д. е.
В кружке Б:
Е (не давать заем) = {16350 х 1,0 - 15000} = 1350 д. е.
Поскольку ожидаемый чистый доход больше в кружке А, то принимаем решение выдать заем.
2. Расчет двухуровневого "дерева" решений
Пример 2. Рассмотрим ситуацию более сложную, чем в предыдущем а именно: банк решает вопрос, проверять ли конкурентоспособность клиента, перед тем, как выдавать заем. Аудиторская фирма берет с банка 80 д.е. за проверку. В результате этого перед банком встают две проблемы: первая проводить или нет проверку, вторая — выдавать после этого заем или нет.
Решая первую проблему, банк проверяет правильность выдаваемых аудиторской фирмой сведений. Для этого выбираются 1000 человек, которые были проверены и которым впоследствии выдавались ссуды
Слайд 29

Слайд 30

Этап 2. Используя данные табл. 2, вычислим вероятность каждого исхода: Р

Этап 2. Используя данные табл. 2, вычислим вероятность каждого исхода:
Р (клиент

ссуду вернет; фирма рекомендовала) = 735/750 = 0,98;
Р (клиент ссуду не вернет; фирма рекомендовала) = 15/750 = 0,02;
Р (клиент ссуду вернет; фирма не рекомендовала) = 225/ 250 = 0,9;
Р (клиент ссуду не вернет; фирма не рекомендовала)= 25/250= 0,1.

Этап 3. На этом этапе слева направо проставим денежные исходы каждого из "узлов", используя конечные результаты, вычисленные ранее. Любые встречающиеся расходы вычитаем из ожидаемых доходов. Таким образом подсчитываем все "дерево", опираясь на ранее полученные результаты. После того, как пройдены квадраты "решений", выбирается "ветвь", ведущая к наибольшему из возможных при данном решении ожидаемому доходу. Другая "ветвь" зачеркивается, а ожидаемый доход проставляется над квадратом решения.
Сначала посмотрим на кружки исходов В и С, являющиеся следствием квадрата 2 (выдавать ли заем клиенту?)

Слайд 31

Слайд 32

Доход, ожидаемый от исхода В: Е (В) = 17250 д.е. х

Доход, ожидаемый от исхода В:
Е (В) = 17250 д.е. х 0,98

+ 0 х 0,02 = 16905 д. е., чистый ожидаемый доход:
NЕ (В) = 16905 - 15000 = 1905 д. е.
Доход, ожидаемый от исхода С:
Е (С) = 16350 д. е. х 1,0 = 16350 д. е., чистый ожидаемый доход:
NЕ (С) = 16350 - 15000 = 1350 д. е. Предположим, что мы сейчас в квадрате 2. Максимальный ожидаемый доход 1905 д. е. в кружке В, поэтому принимаем решение выдать заем.
Приняв решение, корректируем "дерево", проставив чистый ожидаемый доход 1905 д.е. над квадратом 2. "Ветвь" - не давать заем - зачеркивается, показано на рис. 3.
То же самое с кружками исходов D и Е - результатами решения 3.
Доход, ожидаемый от исхода D:
Е(D) = (17250 д. е. хО,9) + (0 х 0,1)= 15525 д. е., чистый ожидаемый доход:
NЕ (D) = 15525 - 15000 = 525 д. е.
Аналогично для исхода Е:
Е (Е) = 16350 д. е. х 1,0 = 16350 д. е., чистый ожидаемый доход:
NЕ (Е) = 16350 - 15000 - 1350 д. е.
Если бы мы были в квадрате 3, то максимальный ожидаемый доход был бы равен 1350 д. е. и можно было бы принять решение не выдавать заем. Теперь скорректируем эту часть схемы: над квадратом 3 пишем чистый ожидаемый доход и принимаем решение выдать заем.
Слайд 33

Наконец приступаем к расчету кружков исходов F и G, которые являются

Наконец приступаем к расчету кружков исходов F и G, которые являются

результатами решения 4.
Е (F) = 17250 д. е. х 0,96 + 0 х 0,04 = 16560 д. е.;
NЕ (F) - 16560 - 15000 = 1560 д. е.;
Е (G) = 16350 х 1,0 = 16350 д. е.;
NЕ (G) = 16350 - 15000 = 1350 д. е.
В квадрате 4 максимальный ожидаемый чистый доход составляет 1560 д. е., и поэтому принимаем решение выдать клиенту ссуду. Сумма 1560 д. е. надписывается над квадратом 4, а альтернативная "ветвь" перечеркивается.
Теперь вернемся к "узлам" А и 1. Используя ожидаемые чистые доходы над квадратами 2 и 3, рассчитаем математическое ожидание для кружка А:
Е (А) = (1905 д. е. х 0,75) + (1350 д. е. х 0,25) = 1766 д. е.
Так как аудиторская проверка стоит 80 ф. ст., ожидаемый чистый доход;
NЕ (А) = 1766 - 80 = 1686 д. е. Теперь можно проставить значения первого решения квадрата 1. Должен ли банк воспользоваться аудиторской проверкой? В этом "узле" максимальное математическое ожидание - 1686 д. е., поэтому перечеркиваем альтернативную "ветвь". "Дерево" окончательных решений для примера 2. приведено на рис. 3.
На рис. 3 стрелками показана последовательность решений, ведущая к максимальному чистому доходу: в квадрате 1 воспользуемся аудиторской проверкой. Если выдача займа рекомендуется фирмой, тогда в квадрате 2 - выдать ссуду, если не рекомендуется, то в квадрате 3 - не выдавать ссуду, а инвестировать эти деньги под стабильные 9% годовых.
Слайд 34

Слайд 35

Слайд 36

Рассмотрим процедуру принятия решения на примере следую- щей задачи, предполагая, что

Рассмотрим процедуру принятия решения на примере следую- щей задачи, предполагая, что решения

принимаются с позиции объективиста.
Задача 3. Руководство некоторой компании решает, создавать ли для выпуска новой
продукции крупное производство, малое предприятие или продать патент другой фирме.
Размер выигрыша, который компания может получить, зависит от благоприятного или неблагоприятного состояния рынка (табл. 1). Вероятность благоприятного и
неблагоприятного состояний экономической среды 0.5
Слайд 37

Дерево решений без дополнительного обследования конъюнктуры рынка: и □-решение (решение принимает

Дерево решений без дополнительного обследования конъюнктуры рынка: и □-решение (решение принимает

игрок); * - случай (решение «принимает» случай); // - отвергнутое решение
Слайд 38

Процедура принятия решения заключается в вычислении для каждой вершины дерева (при

Процедура принятия решения заключается в вычислении для каждой вершины дерева (при движении

справа налево) ожидаемых денежных оценок, отбрасывании неперспективных ветвей и выборе ветвей, которым соответствует максимальное значение ОДО.
Определим средний ожидаемый выигрыш:
для вершины 1 ОДО, = 0,5 • 200 ООО + 0,5(-180 ООО) = 10 ООО дол.;
для вершины 2 ОД02 = 0,5 • 100 000 + 0,5(-20 000) = 40 000 дол.;
для вершины 3 ОД03 = 10 000 дол.
Вывод. Наиболее целесообразно выбрать стратегию а2, т.е. строить малое предприятие, а ветви (стратегии) а1 и а3 дерева реше- ний можно отбросить. ОДО наилучшего решения равна 40 000 дол. Следует отметить, что наличие состояния с вероятностями 50% неудачи и 50% удачи на практике часто означает, что истинные вероятности игроку, скорее всего, неизвестны и он всего лишь принимает такую гипотезу (так называемое предположение «fifty - fifty. - пятьдесят на пятьдесят).
Слайд 39

Усложним рассмотренную выше задачу. Пусть перед тем как принимать решение о

Усложним рассмотренную выше задачу.
Пусть перед тем как принимать решение о строительстве,

руко- водство компании должно определить, заказывать ли дополнитель- ное исследование состояния рынка или нет, причем предоставляе- мая услуга обойдется компании в 10 ООО дол. Руководство понимает, что дополнительное исследование по-прежнему не способно дать точной информации, но оно поможет уточнить ожидаемые оценки конъюнктуры рынка, изменив тем самым значения вероятностей.
Относительно фирмы, которой можно заказать прогноз, извест- но, что она способна уточнить значения вероятностей благоприятно- го или неблагоприятного исхода. Возможности фирмы в виде ус- ловных вероятностей благоприятности и неблагоприятности рынка сбыта представлены в табл. 3.2. Например, когда фирма утверждает, что рынок благоприятный, то с вероятностью 0,78 этот прогноз оправдывается (с вероятностью 0,22 могут возникнуть неблагопри- ятные условия), прогноз о неблагоприятности рынка оправдывается с вероятностью 0,73.
Слайд 40

Предположим, что фирма, которой заказали прогноз состояния рынка, утверждает: ситуация будет

Предположим, что фирма, которой заказали прогноз состояния рынка,
утверждает:
ситуация будет благоприятной

с вероятностью 0,45;
ситуация будет неблагоприятной с вероятностью 0,55.
На основании дополнительных сведений можно построить новое дерево
решений (рис. 2), где развитие событий происходит от корня дерева к
исходам, а расчет прибыли выполняется от конечных состояний к начальным.
Слайд 41

Слайд 42

В ы в о д ы . Из анализа дерева решений

В ы в о д ы . Из анализа дерева решений

следует:
необходимо проводить дополнительное исследование конъ- юнктуры рынка, поскольку это позволяет существенно уточнить принимаемое решение;
если фирма прогнозирует благоприятную ситуацию на рынке, то целесообразно строить большое предприятие (ожидаемая макси- мальная прибыль 116 400 дол.), если прогноз неблагоприятный - малое (ожидаемая максимальная прибыль 12 400 дол.).
3. Ожидаемая ценность точной информации
Предположим, что консультационная фирма за определенную плату готова предоставить информацию о фактической ситуации на рынке в тот момент, когда руководству компании надлежит принять решение о масштабе производства. Принятие предложения зависит от соотношения между ожидаемой ценностью (результативностью) точной информации и величиной запрошенной платы за дополнительную (истинную) информацию, благодаря которой может быть откорректировано принятие решения, т.е. первоначальное действие может быть изменено.
Ожидаемая ценность точной информации о фактическом состоянии рынка равна разности между ожидаемой денежной оценкой при наличии точной информации и максимальной ожидаемой денежной оценкой при отсутствии точной информации.
Слайд 43

Рассчитаем ожидаемую ценность точной информации для при- мера, в котором дополнительное

Рассчитаем ожидаемую ценность точной информации для при- мера, в котором дополнительное обследование

конъюнктуры рынка не проводится. При отсутствии точной информации, как уже было показано выше, максимальная ожидаемая денежная оценка равна:
ОДО = 0,5 • 100 000 - 0,5 • 20 000 = 40 000 дол.
Если точная информация об истинном состоянии рынка будет благоприятной (ОДО = 200 000 дол., см. табл. 1), принимается решение строить крупное производство, если неблагоприятной, то наиболее целесообразное решение - продажа патента (ОДО = 10 000 дол). Учитывая, что вероятности благоприятной и неблагоприятной ситуаций равны 0.5, значение ОДОти (ОДО точной информации) определяется выражением:
ОДОти= 0,5 • 200 000 + 0,5-10 000 = 105 000 дол.
Тогда ожидаемая ценность точной информации ОЦти=ОДОти-ОДО=105000-40000=65000дол.
Значение ОЦти показывает, какую максимальную цену должна быть готова заплатить компания за точную информацию об истинном состоянии рынка в тот момент, когда это ей необходимо.
Слайд 44

Теория ожидаемой полезности. Функция полезности В предыдущих главах мы рассматривали принятие

Теория ожидаемой полезности. Функция полезности

В предыдущих главах мы рассматривали принятие решений

в условиях неопределенности и риска по показателям, учитывающим реальные исходы, выраженные в денежных единицах (прибыль, убытки, и т.д.). Исход хi, который обеспечивал доход в 10 раз больше, чем исход xk выглядел в глазах ЛПР ровно в 10 раз лучше. Учет субъективного отношения ЛПР к риску производился путем выбора подходящих критериев для сравнения альтернатив. Кроме того для некоторых критериев подбирались специальные коэффициенты, вносящие "поправку" на склонность к риску или его неприятие (например, коэффициент α в критерии Гурвица). Но при этом исходы по-прежнему оценивались объективно. Однако, как показывает практика, люди далеко не всегда принимают решения исходя из реальных значений. Подсознательно они ориентируются на субъективную "ценность" исходов.
Слайд 45

Одним из первых, кто сформулировал это и предпринял попытку дать свое

Одним из первых, кто сформулировал это и предпринял попытку дать свое

теоретическое объяснение, был математик Д.Бернулли. Изучая так называемый "петербургский парадокс", он еще в 1738 году предположил, что при сравнении альтернатив реальный человек ориентируется не на ожидаемое значение самого выигрыша, а на математическое ожидание его субъективной "полезности". Развивая данную идею, Бернулли ввел понятие функции полезности, предложил для нее формулу и описал свойства. Это послужило основой теории ожидаемой полезности, которая до сих пор применяется для объяснения поведения экономических агентов в условиях риска.
Функция полезности отражает меру психологического удовлетворения благами. Традиционно она обозначается u(x). Единицей измерения полезности является "ютил". Аргументом х для данной функции выступает количество благ. В наших примерах в качестве х используются денежные суммы выигрышей, прибыли или убытков. Поэтому u(x) представляет функцию полезности денег.
Слайд 46

Предложенная еще в XVIII веке теория ожидаемой полезности получила свое развитие

Предложенная еще в XVIII веке теория ожидаемой полезности получила свое развитие в ХХ

веке в трудах фон Неймана и Моргенштерна. Далее мы рассмотрим лишь некоторые аспекты применения теории ожидаемой полезности для принятия решений в условиях риска.
Использование теории ожидаемой полезности при принятии решений. Свойства функции полезности. Отношение к риску

Согласно предположению Бернулли, альтернативы сравниваются по их ожидаемой полезности. Чтобы ее рассчитать, необходимо в соответствие каждому возможному исходу x поставить некоторое значение полезности u. Это можно сделать, введя функцию полезности u(x), определяющую однозначную зависимость между х и u. Какими же свойствами должна обладать данная функция?
Во-первых, функция полезности должна быть возрастающей. Это отражает принцип: "чем больше благ, тем лучше".
Во-вторых, в общем случае, функция полезности должна быть непрерывна, поскольку если две альтернативы обеспечивают нам близкое количество благ, то и полезности этих двух альтернатив должна быть близкими.

Слайд 47

Примечание Строго говоря, можно представить ситуации, когда функция полезности будет иметь

Примечание
Строго говоря, можно представить ситуации, когда функция полезности будет иметь разрывы.

Например, если с помощью функции полезности попытаться описать прыжок человека через пропасть шириной L с отвесными краями и в качестве х взять длину прыжка. Здесь полезность любого прыжка длиной меньше L будет резко отрицательной, поскольку человек просто разобьется. В то же время любой прыжок на расстояние х > L будет иметь примерно одинаковую полезность, потому что здесь главное - просто перепрыгнуть пропасть. В точке х = L функция полезности практически мгновенно изменяет свое значение от резко отрицательного до некоторого положительного, то есть, фактически имеет разрыв. Разумеется, данный пример очень примитивный, но он иллюстрирует саму возможность существования не непрерывной функции полезности.
Слайд 48

Похожий график функции полезности может встретиться в ситуации, когда риск заключается

Похожий график функции полезности может встретиться в ситуации, когда риск заключается

в недостижении некоторого ключевого показателя, что влечет за собой катастрофические последствия для ЛПР (разорение фирмы, расформирование подразделения, отзыв лицензии и т.д.). Если показатель не достигнут, то уже не важно, сколько не хватило до порогового значения. Если же он превышен, то не принципиально, насколько велико это превышение.
В-третьих, функция полезности должна отражать отношение ЛПР к риску - склонность или неприятие. Это значит, что функция должна корректно описывать различия в психологическом восприятии ЛПР потерь и выигрышей. Какие же типы поведения существую по отношению к риску, и в чем это проявляется?
В зависимости от отношения к риску выделяют три чистых психологических типа:
не склонный к риску ("рискофоб");
нейтральный к риску;
склонный к риску ("рискофил").
Слайд 49

Люди, относящиеся к указанным типам, по-разному оценивают потери и выигрыши. У

Люди, относящиеся к указанным типам, по-разному оценивают потери и выигрыши.
У лиц,

не склонных к риску, психологические переживания в связи с потерей некоторой суммы денег являются более сильными, чем удовлетворение от выигрыша такой же суммы. Это означает, что для такого ЛПР, обладающего богатством в размере х0 рублей, функция полезности должна удовлетворять условию:
u(x0) - u(x0 - Δх) > u(x0 + Δх)- u(x0),
где:
u(x0) - u(x0 - Δх) - отражает уменьшение полезности (то есть меру переживаний, неудовлетворения) из-за потери Δх рублей,
u(x0 + Δх) - u(x0) - отражает увеличение полезности (то есть меру удовлетворения) от выигрыша такой же суммы Δх.
Данное условие выполняется, если функция полезности является "выпуклой вверх". На рис.4.1а хорошо видно, что выпуклая вверх функция u(x)действительно отражает большую "чувствительность" ЛПР к возможным потерям, чем к выигрышам.
Слайд 50

Рис.4.1а. Выпуклая ВВЕРХ функция полезности, отражающая НЕПРИЯТИЕ риска. Напротив, для ЛПР,

Рис.4.1а. Выпуклая ВВЕРХ функция полезности, отражающая НЕПРИЯТИЕ риска.

Напротив, для ЛПР, любящего рисковать,

психологические выгоды от возможности выиграть Δх рублей превосходят переживания из-за такой же потери. Подобное отношение к риску описывается "выпуклой вниз" функцией полезности
Слайд 51

Слайд 52

Использование теории ожидаемой полезности при принятии решений. Особенности поведения в условиях

Использование теории ожидаемой полезности при принятии решений. Особенности поведения в

условиях риска

Чтобы выявить специфику экономического поведения в условиях риска мы будем использовать модель так называемой "простой лотереи" или "простого шанса". У ЛПР есть шанс оказаться в состоянии х1 с вероятностью р1 = р и в состоянии х2 с вероятностью р2 = (1 - р). Других возможностей, кроме этих двух вариантов, нет. Поэтому такую лотерею также часто называют бинарной. В кратком виде "простой шанс" записывается следующим образом:
L = { x1, x2, p}

Слайд 53

Ожидаемый результат такой лотереи ML может быть определен по общей формуле

Ожидаемый результат такой лотереи ML может быть определен по общей формуле для расчета

математического ожидания дискретной СВ:

Ожидаемая полезность данной лотереи MuL рассчитывается по аналогичной формуле, только вместо реальных значений исходов х1 и х2 в нее подставляются значения функции полезности u(х1) и u(х2):

Это означает, что на координатной плоскости ожидаемая полезность будет находиться на отрезке, соединяющем значения функции полезности u(х1) и u(х2)(см.рис.4.2), причем:

Слайд 54

Рис.4.2. Сравнение рисковой и безрисковой альтернатив для ЛПР, несклонного к риску.

Рис.4.2. Сравнение рисковой и безрисковой альтернатив для ЛПР, несклонного к риску.

Слайд 55

Опираясь на график, попробуем понять, как люди, по-разному относящиеся к риску,

Опираясь на график, попробуем понять, как люди, по-разному относящиеся к риску,

ответили бы на два простых вопроса.
Вопрос 1. Что лучше: гарантированно иметь некоторую сумму денег или получить возможность сыграть в лотерею, ожидаемый выигрыш в которой равен этой же сумме?
Вариант с гарантированным обладанием деньгами называется "безрисковая альтернатива" (sure alternative). В свою очередь, возможность сыграть в лотерею по аналогии называют "рисковой альтернативой".
Из графика полезности ЛПР, не склонного к риску (см.рис.4.2), видно, что ожидаемая полезность лотереи MuL при любых значениях х1, х2 и р будет ниже полезности гарантированной суммы в размере ожидаемого выигрыша ML:
u(ML) > MuL
Это означает, что осторожные люди, не любящие риск, предпочтут получить гарантированную сумму вместо того, чтобы сыграть в лотерею с таким же ожидаемым выигрышем. Нетрудно показать, что лица, склонные к риску, в подобных условиях выберут лотерею, а для "нейтрала" рисковая и безрисковая альтернативы будут равноценны.
Слайд 56

Вопрос 2. Какая игра лучше: игра, где можно много выиграть, но

Вопрос 2. Какая игра лучше: игра, где можно много выиграть, но и

много проиграть, или где возможный выигрыш меньше, но проигрыш незначительный?
Для ответа на этот вопрос рассмотрим две простые лотереи L{x1, x2, p} и L'{x'1, x'2, p'}, такие что:
x1 < x'1 и x'2 < x2
Лотерея L дает возможность выиграть больше, чем L', но и возможный проигрыш здесь тяжелее. Исходы лотереи L' не выходят за пределы L. Относительно вероятностей выигрыша или проигрыша никаких предположений не вводим. Как мы увидим дальше, ответ на интересующий нас вопрос в данном случае от вероятностей не зависит.
Как уже отмечалось выше, ожидаемая полезность каждой из этих лотерей лежит на хорде, которая соединяет две точки на графике полезности, соответствующие двум возможным исходам. Точное положение ожидаемой полезности на этой хорде зависит от вероятности выиграть или проиграть.
Слайд 57

Рис.4.3. Влияние разброса исходов простой лотереи на ожидаемую полезность альтернатив для

Рис.4.3. Влияние разброса исходов простой лотереи на ожидаемую полезность альтернатив для ЛПР,

несклонного к риску.

Проводя все возможные хорды для любых значений х1, х2 , х'1 , х'2 при условии, что x1 < x'1 и x'2 < x2 (см.рис.4.3), можно заметить следующую закономерность. При выпуклом вверх графике полезности хорда, описывающая ожидаемую полезность второй лотереи L', всегда выше хорды для L. Это означает, что при заданных пределах ЛПР, не склонный к риску, всегда будет выбирать альтернативу с меньшим разбросом исходов.

Слайд 58

Лицам, хорошо воспринимающим риск, а, значит, и менее чувствительным к возможным

Лицам, хорошо воспринимающим риск, а, значит, и менее чувствительным к возможным

проигрышам, вариант с широким диапазоном исходов (а, значит, и с более значительным выигрышем) кажется привлекательней.
При нейтральном отношении к риску решение будет зависеть не от разброса исходов, а от ожидаемого значения. Здесь может оказаться предпочтительным вариант с широким разбросом, если он обещает больший ожидаемый выигрыш (и, следовательно, более высокую ожидаемую полезность).

Рис.4.1б. Выпуклая ВНИЗ функция полезности, отражающая СКЛОННОСТЬ к риску.

Слайд 59

Функция полезности для лиц, нейтральных к риску, представляет собой прямую (см.

Функция полезности для лиц, нейтральных к риску, представляет собой прямую (см.

рис.4.1в), обеспечивая тем самым одинаковое (равное) отношение как к выигрышам, так и к проигрышам. Все рассмотренные нами в предыдущих главах методы принятия решений были справедливы именно для ЛПР, относящегося к такому типу поведения.

Рис.4.1в. ЛИНЕЙНАЯ функция полезности, отражающая НЕЙТРАЛЬНОЕ отношение к риску.

Слайд 60

Итак, функция полезности в теории - это возрастающая непрерывная функция, выпуклая

Итак, функция полезности в теории - это возрастающая непрерывная функция, выпуклая

вверх для лиц, не склонных к риску, выпуклая вниз для тех, кто любит риск, и прямая для людей, нейтральных к риску.
Следует отметить, что перечисленные типы являются "чистыми". Люди, относящиеся исключительно к одному чистому типу, в жизни встречаются редко. В зависимости от возраста, ситуации, настроения, уровня богатства, величины возможных потерь или выигрышей один и тот же человек может демонстрировать как "рискофобное" поведение, так и склонность к риску, либо "нейтралитет".
Согласно исследованиям, основная часть людей в экономическом плане в большей или меньшей степени демонстрируют неприятие риска. Поэтому в экономической литературе значительное внимание уделено именно такому типу поведения. Какие же особенности принятия решений можно выявить, исследуя функцию полезности лиц, не склонных к риску?
Слайд 61

. Использование теории ожидаемой полезности при принятии решений Детерминированный эквивалент В

. Использование теории ожидаемой полезности при принятии решений
Детерминированный эквивалент

В предыдущем параграфе

было показано, что лица, не склонные к риску, между гарантированной суммой и лотерей с таким же ожидаемым выигрышем выберут безрисковую альтернативу. Из этого следует очень важный вывод, объясняющий существование целой отрасли финансовых отношений, а также некоторых видов деятельности, финансовых продуктов и инструментов.
Человек, который предпочитает не рисковать и иметь меньше, но гарантированно, готов платить за возможность избежать риска! "Страх" потерять проявляется и в обычной хозяйственной деятельности, и при работе на финансовых рынках. А если кто-то готов платить, то всегда найдется тот, кто захочет на этом зарабатывать. Так появились коммерческое страхование, опционы, фьючерсы, всевозможные виды гарантий и т.д. Суть этих инструментов с точки зрения потребителя - передача риска другой стороне за определенную неслучайную плату. Такие инструменты будут надежно работать только при условии, что принимающая риск сторона может его надлежащим образом финансировать (то есть покрыть последствия возможной реализации риска).
Слайд 62

В качестве методов, позволяющих это делать, используются резервы, диверсификация, эффект от

В качестве методов, позволяющих это делать, используются резервы, диверсификация, эффект от

объединения рисков в пул и другие. Пока же остановимся на том, как выявленная готовность платить за безрисковую альтернативу видна на графике функции полезности.

Рассмотрим ситуацию с простой лотерей L из п.4.2 для ЛПР, не склонного к риску. Ожидаемый выигрыш составляет ML, а ожидаемая полезность MuL. На графике 4.1а мы видели, что полезность u(ML) гарантированного обладания суммой в размере ML для лица, не принимающего риск, всегда выше ожидаемой полезности MuL лотереи с таким же ожидаемым выигрышем:
u(ML) > MuL
То есть человек выберет безрисковую альтернативу.

Слайд 63

Теперь рассмотрим ситуацию, когда этому же человеку предлагают выбрать между гарантированным

Теперь рассмотрим ситуацию, когда этому же человеку предлагают выбрать между гарантированным

обладанием фиксированной суммой S и все той же лотерей с ожидаемым выигрышем ML. Как должны соотноситься S и ML, чтобы эти две альтернативы были для эквивалентны, и он не смог однозначно выбрать лучшую? Иными словами, сколько этот человек готов заплатить, чтобы поучаствовать в подобной лотерее?
В рамках рассматриваемой теории две альтернативы считаются эквивалентными, если равны их ожидаемые полезности. Применительно к нашему случаю должны быть равны ожидаемые полезности лотереи и гарантированной суммы.
Ожидаемая полезность лотереи нам известна. Она равна MuL.
Обладание гарантированной суммой S неслучайно, поэтому ожидаемая полезность этой альтернативы равна просто полезности данной суммы S.
MuS = u(S)
Тогда, можем записать условие эквивалентности двух рассматриваемых альтернатив:
u(S) = MuL
Слайд 64

Рис.4.4. Определение детерминированного эквивалента На графике одинаковый уровень полезности задается горизонтальной

Рис.4.4. Определение детерминированного эквивалента

На графике одинаковый уровень полезности задается горизонтальной прямой, которая

параллельна оси абсцисс и проходит на высоте, соответствующей заданному значению полезности (см. рис.4.4). Проведем такую линию на уровне ожидаемой полезности лотереи MuL. Абсцисса точки пересечения этой прямой с графиком функции полезности и будет той суммой S, при которой альтернативы станут равноценными. Величину S называют "детерминированный эквивалент" лотереи L.
Слайд 65

Соотношение ожидаемого выигрыша лотереи ML и ее детерминированного эквивалента S может

Соотношение ожидаемого выигрыша лотереи ML и ее детерминированного эквивалента S может служить индикатором отношения ЛПР

к риску.
В рассмотренном нами случае с выпуклым вверх графиком функции полезности детерминированный эквивалент всегда меньше ожидаемого выигрыша:
S < ML
Это характерно для лиц, негативно воспринимающих риск.
Люди, склонные к риску, имеющие выпуклый вниз график полезности, напротив, готовы заплатить за участие в лотерее больше, чем объективно ожидаемый выигрыш:
S > ML
Отчасти это можно объяснить тем, что сам факт участия в лотерее является для них определенным психологическим благом, представляющим дополнительную полезность. И за это они готовы доплачивать.
Слайд 66

У нейтральных к риску людей детерминированный эквивалент совпадает с ожидаемым выигрышем:

У нейтральных к риску людей детерминированный эквивалент совпадает с ожидаемым выигрышем:
S

= ML

. Использование теории ожидаемой полезности при принятии решений
Мера неприятия риска

До настоящего момента мы делили людей в зависимости от их отношения к риску на три типа: рискофобы, рискофилы и нейтралы. Но на принятие решения влияет не только общая направленность, но и степень толерантности к риску. Действительно, два рискофоба в одинаковых ситуациях могут выбрать разные альтернативы, потому что их "сила отторжения" риска различна. Что же может служить мерой неприятия риска? По каким показателям можно судить, насколько человек толерантен к риску?
В предыдущем параграфе мы отметили готовность человека, не склонного к риску, платить за его отсутствие. Это дает возможность использовать количественные характеристики такой готовности в качестве меры неприятия риска.

Слайд 67

Действительно, чем сильнее человек опасается риска, тем больше он согласен заплатить

Действительно, чем сильнее человек опасается риска, тем больше он согласен заплатить

за его отсутствие. Эта готовность платить (willingness to pay) может быть количественно измерена, как минимум, двумя показателями:
величиной максимальной страховой премии, на которую согласен ЛПР;
величиной так называемой "премии за риск".
Премия за риск может быть представлена как в абсолютных, так и в относительных величинах (как доля от максимальной страховой премии).
Рассмотрим эти характеристики подробнее на примере гипотетической ситуации с человеком, не склонным к риску и обладающим начальным богатством х0 денежных единиц. Предположим, что с вероятностью р может произойти убыток в размере у денежных единиц.
Дискретная случайная величина Y, описывающая данный убыток, может быть записана как простейшая лотерея Y{y, 0, p}.
Слайд 68

Начальное богатство детерминировано и равно х0. Но поскольку убыток случаен, то

Начальное богатство детерминировано и равно х0. Но поскольку убыток случаен, то конечное

богатство также является случайной величиной Х:
Х = x0 - Y
Распределение этой СВ имеет следующий вид:
с вероятностью р конечное богатство равно (х0 - у), а
с вероятностью (1 - р) оно останется неизменным и равным х0.
Данная схема описывает типичную ситуацию так называемого "чистого" риска, который несет в себе возможность только потерять и не предполагает возможность обогатиться. В лучшем случае все просто останется, как есть.
График полезности для рассматриваемой ситуации приведен на рис.4.5.
Слайд 69

Рис.4.5. Полезность возможных исходов конечного богатства.

Рис.4.5. Полезность возможных исходов конечного богатства.

Слайд 70

Так как x0 - детерминированная величина, то ее математическое ожидание равно

Так как x0 - детерминированная величина, то ее математическое ожидание равно самому значению:
M(x0)

= x0
Таким образом:
MX = x0 - MY
Поскольку мы рассматриваем ситуацию с позиции ЛПР, не склонного к риску, то ожидаемая полезность конечного богатства MuX оказывается меньше полезности ожидаемого конечного богатства u(MX) (см.рис.4.6). Значит ЛПР хотел бы избавиться от риска, даже если за это он должен заплатить некоторую сумму.

Рис.4.6. Полезность ожидаемого конечного богатства u(MX) и ожидаемая полезность конечного богатства MuX.

Слайд 71

Одним из самых распространенных способов передачи чистых рисков является страхование. За

Одним из самых распространенных способов передачи чистых рисков является страхование. За

фиксированную плату, которая называется страховой премией, принимающая сторона (страховая компания или страховщик) обязуется возместить передающей стороне возможный убыток, если тот наступит.
Решение застраховаться на случай наступления убытка y будет означать следующее.
Во-первых, богатство уменьшится на величину уплаченной страховой премии Π и составит (x0 - Π).
Во-вторых, даже если риск реализуется, и произойдет убыток, страховая компания его полностью возместит. То есть конечное богатство при наступлении убытка не изменится и составит по-прежнему (x0 - Π). Таким образом, ситуация перестает быть рискованной.
Итак, у ЛПР есть две альтернативы:
Альтернатива А: с вероятностью р потерять часть богатства y или с вероятностью (1 - p) не потерять ничего (это первоначальная ситуация без страхования), и
Слайд 72

Альтернатива В: гарантированно потерять часть богатства Π такую, что Π Для

Альтернатива В: гарантированно потерять часть богатства Π такую, что Π < y, но избавиться от

случайности (это вариант со страхованием).
Для конкретного человека и заданной рисковой ситуации выбор наилучшей альтернативы зависит от величины страховой премии Π. Если страховая компания запросит слишком большую плату, то даже очень осторожный человек может предпочесть не страховаться. Однако, как правило, страховая премия Π настолько меньше возможного убытка y, что данная альтернатива выглядит предпочтительней.
Какую же сумму Π готов заплатить ЛПР, чтобы избавится от риска?

В рамках рассматриваемой теории страхование с премией Π будет выгодным, если ожидаемая полезность альтернативы B со страхованием будет выше ожидаемой полезности варианта А без страхования:
MuB > MuА

Слайд 73

Граничным случаем, когда обе альтернативы эквивалентны, является равенство их ожидаемых полезностей:

Граничным случаем, когда обе альтернативы эквивалентны, является равенство их ожидаемых полезностей:
MuB =

MuА
Ожидаемая полезность альтернативы А (без страхования) составляет:
Ожидаемая полезность альтернативы В (со страхованием) равна полезности конечного богатства после уплаты страховой премии Π, поскольку эта величина является детерминированной и не изменится, даже если убыток реализуется:
MuB = u(x0 - Π)
Предельная страховая премия, которую готов заплатить ЛПР, может быть найдена из равенства ожидаемых полезностей этих двух альтернатив:
u(x0 - Π ) = p u(x0 - y) + (1-p) u(x0)

Используя понятие, введенное нами в предыдущем параграфе, можно сказать, что сумма (x0 - Π) является детерминированным эквивалентом рискованной альтернативы 

Слайд 74

На графике полезности этот детерминированный эквивалент находится как абсцисса точки пересечения

На графике полезности этот детерминированный эквивалент находится как абсцисса точки пересечения

функции полезности и горизонтальной прямой, проходящей на уровне ожидаемой полезности альтернативы А (см. рис.4.7).

Рис.4.7. Максимальная страховая премия Π.

Если запрашиваемая страховой компанией плата будет равна максимальной премии Π, то тогда обе альтернативы (страховать или не страховать) являются эквивалентными. Если же стоимость страхования меньше, то альтернатива В будет более предпочтительной.

Слайд 75

Размер максимальной страховой премии может служить мерой неприятия риска, поскольку, чем

Размер максимальной страховой премии может служить мерой неприятия риска, поскольку, чем выше эта

сумма, тем сильнее человек боится убытков и стремится переложить их на страховщика. Однако в структуре максимальной страховой премии можно выделить объективную и субъективную составляющие (см. рис.4.8).

Рис.4.8. Структура максимальной страховой премии. Рисковая премия π.

Слайд 76

Объективная составляющая, равная ожидаемому убытку MY, представляет собой "чистую" цену риска.

Объективная составляющая, равная ожидаемому убытку MY, представляет собой "чистую" цену риска. Она

определяется только вероятностью и тяжестью убытков и не зависит от отношения ЛПР к риску. Ожидаемый убыток MY одинаков как для рискофоба, так и для нейтрала, либо рискофила, поскольку он рассчитывается исходя из характеристик самого риска и не связан с функцией полезности.
Субъективная составляющая, напротив, зависит не только от объективных параметров риска, но и субъективного отношения ЛПР к риску, которое определяет форму функции полезности. Эту составляющую π называют "премия за риск" (risk premium) или "премия за безопасность" (safety premium). От чего же зависит ее величина? Во-первых, премия за риск зависит от размеров начального богатства. Еще Бернулли предположил, что полезность изменяется пропорционально относительному, а не абсолютному приращению капитала. Если это допущение справедливо, то, чем больше начальное богатство х0, тем слабее влияет убыток y на изменение ожидаемой полезности. Значит, рисковая премия π для больших уровней богатства будет ниже, чем для маленьких.
Слайд 77

Во-вторых, рисковая премия зависит от разброса убытка относительно ожидаемого значения. Это

Во-вторых, рисковая премия зависит от разброса убытка относительно ожидаемого значения. Это

интуитивно понятно - чем шире рассеивание, тем больший убыток можно получить. Следовательно, рисковая премия будет больше.

Эту идею можно подтвердить и в рамках используемой нами упрощенной модели. Разброс случайной величины характеризуется дисперсией DY или среднеквадратическим отклонением σY. Дисперсия DY дискретного случайного убытка Y может быть найдена по общей формуле:
Как уже было показано:
MY = p y
Тогда,
DY = σY2 = p(1 - p)y2
Из полученной зависимости видно, что дисперсия простейшего чистого убытка DY тем выше, когда:
• возможный убыток у больше (тогда крайние исходы случайной величины разнесены на большее расстояние друг от друга), и
• вероятность убытка ближе к 50% (максимум выражения р(1 - р)достигается как раз при р = 0.5).

Слайд 78

Проиллюстрируем это, сравнив два случайных убытка Y1 и Y2, предполагающих возможность

Проиллюстрируем это, сравнив два случайных убытка Y1 и Y2, предполагающих возможность наступления одинакового ущерба у с

вероятностями р1 = 0.5 и р2 = 0.1 соответственно (см.рис.4.9). Даже визуально можно отметить, что рисковая премия для убытка Y1 больше, чем для Y2 . Если рассмотреть еще один убыток Y3 с вероятностью ущерба р3 = 0.9, то окажется, что, несмотря на больший ожидаемый убыток MY3, рисковая премия будет такой же, как и для Y2. Это объясняется тем, что их вероятности отличаются от 0.5 на одну и ту же величину. Следовательно, выражения р(1 - р) в формуле для дисперсии этих убытков равны.

Рис.4.9. Влияние вероятности наступления убытка на величину рисковой премии.

Слайд 79

Третий фактор, влияющий на величину рисковой премии - степень неприятия риска.

Третий фактор, влияющий на величину рисковой премии - степень неприятия риска.

Это также логически объяснимо: чем меньше человек склонен к риску, тем больше он готов заплатить за страхование. На графике "повышенное" неприятие риска выражается большей кривизной (выпуклостью) функции полезности. Как можно заметить на рис.4.10, чем сильнее искривлен график, тем больше рисковая премия.

Рис.4.10. Влияние кривизны графика функции полезности на величину рисковой премии.
Данный фактор является наиболее субъективным из всех рассмотренных. Именно он объясняет, почему два рискофоба, находясь в одинаковых

условиях, могут выбрать разные альтернативы. Просто один из них в большей степени не приемлет риск, чем второй. Поэтому у него выше готовность платить за риск (в частности, больше рисковая премия).

Слайд 80

Использование теории ожидаемой полезности при принятии решений 4.6. Коэффициент неприятия риска

Использование теории ожидаемой полезности при принятии решений
4.6. Коэффициент неприятия риска

Зависимость степени

кривизны функции полезности от "силы отторжения" риска позволила ввести такой относительный показатель как коэффициент неприятия риска.
Как известно из курса математики, первая производная характеризует наклон касательной к графику функции. Знак второй производной определяет направление выпуклости графика - вверх или вниз.
Получается, что, зная первую и вторую производные функции полезности, можно сказать:
к какому типу относится ЛПР - рискофоб, рискофил или нейтрал;
насколько сильно он приемлет или не приемлет риск.
Опираясь на эти сведения можно построить относительный коэффициент для сравнения отношения к риску разных ЛПР. Он называется "коэффициент Эрроу-Пратта".
Слайд 81

Существует два вида данного показателя: коэффициент абсолютного и относительного неприятия риска.

Существует два вида данного показателя: коэффициент абсолютного и относительного неприятия риска.

И тот и другой учитывают первую и вторую производные, но имеют разную размерность и по-разному учитывают абсолютные значения богатства.

Коэффициент абсолютного неприятия риска RA может быть рассчитан по формуле:

Коэффициент относительного неприятия риска RR связан с абсолютным отношением: RR = RA x

Слайд 82

4.8. Функция полезности, приближенная к реальной На практике люди не обязательно

4.8. Функция полезности, приближенная к реальной

На практике люди не обязательно следуют

одному и тому же подходу в различных ситуациях. В зависимости от того, с чем они сталкиваются (потери или выигрыши), и о каких суммах идет речь, один и тот же человек может демонстрировать как неприятие риска, так и склонность к нему. То есть вид функции полезности реального ЛПР при разных значениях богатства не одинаков. Все множество возможных уровней богатств условно делится на несколько интервалов, на каждом из которых проявляется свое отношение к риску и степень его неприятия. Экономисты и психологи исследовали и продолжают исследовать феномены и парадоксы поведения людей в ситуации риска. Эта область науки является развивающейся и там, возможно, нас ожидают новые открытия и объяснения существующих фактов. Пока же мы приведем здесь лишь примерный вид функции полезности реального человека (см. рис. 4.12) и отметим несколько выявленных в процессе изучения особенностей. Сразу оговоримся, что это "собирательный усредненный образ" отношения к риску, составленный на основе отдельных исследований, проведенных в нескольких странах, на различных группах людей. Поэтому мы можем найти несовпадение с собственным отношением к риску и предложить свои объяснения или опровержения представленных гипотез.
Слайд 83

Рис.4.12. Примерный вид функции полезности реального ЛПР. На представленном на рис.4.12

Рис.4.12. Примерный вид функции полезности реального ЛПР.

На представленном на рис.4.12 графике можно

условно выделить несколько диапазонов богатства х, где функция полезности u(x) ведет себя по-разному. Для наглядности за ноль примем текущее состояние (богатство) человека.

Рассмотрим сначала область выигрышей (х > 0). На первом интервале (область 1), пока возможная прибыль относительно невелика, люди могут вести себя как нейтралы или даже рискофилы, готовые рискнуть, чтобы получить чуть больше, чем есть.

Слайд 84

Однако по мере роста возможных выигрышей и гарантированных альтернатив (область 2)

Однако по мере роста возможных выигрышей и гарантированных альтернатив (область 2) все сильнее

проявляется рискофобный подход. При выборе между безрисковой альтернативой, гарантирующей достаточно высокий доход, и еще большим, но случайным выигрышем, повышается процент людей, которые будут выбирать детерминированное богатство. Постепенно при очень высоких значениях богатства (область 3) появится "насыщение". Получение еще одной тысячи или миллиона уже не будет приносить столько удовольствия, как раньше, когда состояние было весьма ограниченным. Этот эффект был отмечен еще Бернулли.

Теперь посмотрим на область потерь (х < 0). Во-первых, исследования показывают, что реальный человек более чувствителен к потерям, чем к выигрышам. Этот эффект называют "неприятие потерь" ("loss aversion"). Он проявляется на всей области убытков, но в большей степени характерен для относительно небольших и средних значений (область 4). Однако по мере роста убытков, люди становятся все менее чувствительны к потере еще одного рубля. То есть в области больших убытков (область 5) имеет место такое же "насыщение", которое наблюдалось в районе значительных богатств, только с обратным знаком. Благодаря такому "отзеркаливанию" отношения к большим суммам, данный феномен получил название "эффект отражения" ("reflection effect").

Слайд 85

Безусловно, исследования, проведенные на достаточно больших группах людей, могут помочь составить

Безусловно, исследования, проведенные на достаточно больших группах людей, могут помочь составить

функцию полезности "усредненного человека". Ей можно пользоваться, прогнозируя ожидаемое поведение потенциальных акционеров, потребителей, избирателей и т.д. Но она не всегда применима для моделирования решений конкретного человека.
Например, если руководитель вынужден принимать решение, которое должно удовлетворить определенного "внешнего пользователя" (например, владельца бизнеса), то ему необходимо иметь представление не об усредненной функции полезности, а о функции полезности именно этого конкретного человека! ЛПР должен знать, какие убытки тот считает недопустимыми, ради каких гарантированных выгод тот может отказаться от рискованного проекта, сулящего большую прибыль, и т.д. Только тогда принимаемые ЛПР решения будут адекватно оценены этим внешним пользователем. Разумеется, построение точной функции полезности другого лица в подобных условиях практически невозможно. Чаще всего приходится ориентироваться на интуитивное понимание ситуации и схожесть в оценке рисков владельца бизнеса и назначенных им руководителей.
Слайд 86

Тем не менее, проблемы с построением функции полезности и с использованием

Тем не менее, проблемы с построением функции полезности и с использованием

ее для принятия решений не исключают ее теоретической ценности.
Отмеченные в настоящем параграфе феномены не единственные. Существуют и другие. В частности, исследователи столкнулись с так называемым "эффектом представления ("framing effect"). Он проявляется в том, что ответы на вопросы анкет значимым образом зависят от формулировки вопроса. При одинаковых объективных (численных) исходных данных, но описанных различными способами, одни и те же люди принимали разные решения. Это говорит не только о трудности сопоставления полученных результатов, но и о том, что на процесс принятия решения в условиях риска влияют всевозможные трудно поддающиеся формализации факторы. Психологи выделяют целый ряд обстоятельств, которые искажают восприятие рисковой ситуации человеком, что влечет за собой возможность принятия им решений, не поддающих корректному описанию с помощью формальной теории.
Слайд 87

Слайд 88

ФУНКЦИЯ ПОЛЕЗНОСТИ НЕЙМАНА - МОРГЕНШТЕРНА

ФУНКЦИЯ ПОЛЕЗНОСТИ НЕЙМАНА - МОРГЕНШТЕРНА

Слайд 89

Слайд 90

Обоснование выбора решения в предыдущем раздее выполнялось с позиций объективиста. Если

Обоснование выбора решения в предыдущем раздее выполнялось с позиций объективиста. Если

же ЛПР - субъективист, то он будет руководствоваться индивидуально определенным БДЭ.
Поясним смысл этой величины.
Рассмотрим ситуацию, когда игрок с вероятностью 0,8 выигрывает 40 дол. и с вероятностью 0,2 проигрывает 20 дол.
Выясним, за какую сумму ЛПР уступит свое право участвовать в игре.
Как отмечалось, объективист пользуется правилом:
БДЭ = ОДО = 0,8 • 40 + 0,2(-20) = 28 дол.
Поэтому свое право на игру он уступит не менее чем за 28 дол.
Субъективист, как правило, готов уступить свое право на игру за меньшую сумму, поскольку для него БДЭ < ОДО.
Причинами такого поведения могут быть:
финансовое состояние игрока (возможно, он на грани банкротства и ему необходимы денежные средства);
отношение игрока к риску вообще (несклонность к риску);
настроение или состояние здоровья игрока;
множество других, даже непосредственно не относящихся к бизнесу, причин.

ФУНКЦИЯ ПОЛЕЗНОСТИ НЕЙМАНА - МОРГЕНШТЕРНА

Слайд 91

Величина БДЭ может изменяться со временем в зависимости от обусловленных указанными

Величина БДЭ может изменяться со временем в зависимости от обусловленных указанными причинами

обстоятельств. Например, в случае катастрофической нехватки финансовых средств (наличных денег) право на игру можно уступить и за более низкий эквивалент.
Исследуем реалистичность критерия выбора решения, основанного на расчете ОДО.
Рассмотрим две альтернативы:
выигрыш 1 000 000 дол. с вероятностью 1;
игра (лотерея): выигрыш 2 100 000 дол. с вероятностью 0,5 и проигрыш 50 000 дол. с вероятностью 0,5.
В этом случае
ОДО = 0,5 • 2 100 000 - 0,5 • 50 000 = 1 025 000 дол.
Относительно получаемого среднего выигрыша указанные альтернативы практически эквивалентны, и если игрок безразличен к риску, он выберет вторую альтернативу. Если он к риску небезразличен, а подавляющее число людей именно таковыми являются, то выбор будет зависеть главным образом от финансового состояния игрока.
Игроки, имеющие скромный денежный доход, предпочтут не рисковать и выберут гарантированный выигрыш.
Для ЛПР, обладающего достаточно крупным капиталом, проигрыш в 50 ООО дол. невелик, и он предпочтет рискнуть. Рисковать будут также игроки, патологически склонные к финансовым авантюрам.
Слайд 92

Методология рационального принятия решений в условиях неопределенности, основанная на функции полезности

Методология рационального принятия решений в условиях неопределенности, основанная на функции полезности

индивида, опирается на пять аксиом, которые отражают минимальный набор необходимых условий непротиворечивого и рационального поведения игрока.
Для компактного изложения аксиом нам потребуется следующее определение.
Определение 4.1. Предположим, что конструируется игра, в ко- торой индивид с вероятностью α получает денежную сумму x и с вероятностью (1 - α) - сумму z. Эту ситуацию будем обозначать G(x, z: α).
Аксиома I. Аксиома сравнимости (полноты). Для всего множества S неопределенных альтернатив (возможных исходов) индивид может сказать, что либо исход х предпочтительнее исхода у (х >у), либо у > х, либо индивид безразличен в отношении к выбору между х и у (х ~ у). Запись х ≥ у означает, что исход х предпочтительнее исхода у либо индивид безразличен в отношении к выбору между х и у.
Слайд 93

Аксиома 2. Аксиома транзитивности (состоятельности). Если х > у и у

Аксиома 2. Аксиома транзитивности (состоятельности). Если х > у и у >

z, то х >z. Если х ~ у и у ~ z,то х ~ z.
Аксиома 3. Аксиома сильной независимости. Предположим, что мы конструируем игру, в которой индивид с вероятностью α полу- чает денежную сумму х и с вероятностью (1 - α) - сумму z, т.е. G(x, z: α). Сильная независимость означает, что если индивид без- различен в отношении к выбору между х и у (х ~ у), то он также будет безразличен в отношении к выбору между игрой (лотереей) G(x, z: а) и игрой G(y, z: а ), т.е. из х ~ у следует G(x, z: ос) ~ G(y, z: а).
Аксиома 4. Аксиома измеримости. Если х > у ~ z или х ~у > z, то существует единственная вероятность а такая, что у ~ G(x, z: а).
Поясним смысл этой аксиомы. Пусть, например, имеем три ис- хода: х = 1000; у = 0; z означает смерть игрока. Исходя из здравого смысла смерть нельзя сравнивать ни с каким выигрышем и соответ- ствующего этому исходу значения вероятности а существовать не может. Однако в жизни бывают ситуации, когда некий проигрыш равнозначен смерти. Тогда утверждение у ~ G{x, z: а ) можно счи- тать справедливым для некоторого значения О ≤α ≤ 1.
Слайд 94

Аксиома 5. Аксиома ранжирования. Если альтернативы у и и находятся по

Аксиома 5. Аксиома ранжирования. Если альтернативы у и и находятся по

предпочтительности между альтернативами х и z и можно построить игры такие, что индивид безразличен в отношении к выбору между у и G(x, z: α1), а также к выбору между u и G(x, z:α2),
то при α1> α2 у >и.
Поясним смысл этой аксиомы. Пусть существуют следующие альтернативы: х = 1000; у = 500; и = 200, z = -10. Пусть эквивалентны две пары ситуаций, одна из которых неигровая, а другая игровая:
1) гарантированно получить 500 или игра: с вероятностью α1выиграть 1000 и с вероятностью (1-α1) проиграть 10, т.е. 500~G(1000,-10: α1);
2) гарантированно получить 200 или игра: с вероятностью α2 выиграть 1000 и с вероятностью (1-α2) проиграть 10, т.е. 200~G(1000,-10: α2).
Очевидно, что при указанных условиях α1> α2. Если α1= α2 то у~ и. : Утверждение аксиомы вполне соответствует здравому смыслу: чем больше вероятность крупного выигрыша, тем больше игра «стоит», т.е. тем большая плата потребуется за приобретение права в ней участвовать.
Если принять приведенные аксиомы и предположить, что люди предпочитают большее количество некоторого блага меньшему, то все это в совокупности определяет рациональное поведение ЛПР.
При названных предположениях американскими учеными Дж. Нейманом и О. Моргенштерном было показано, что ЛПР при принятии решения будет стремиться к максимизации ожидаемой полезности
Слайд 95

Другими словами, из всех возможных решений он выберет то, которое обеспечивает

Другими словами, из всех возможных решений он выберет то, которое обеспечивает

наибольшую ожидаемую полезность.
Сформулируем определение полезности по Нейману-Моргенштерну.
Определение 4.2. Полезность - это некоторое число, приписываемое лицом, принимающим решение, каждому возможному исходу. Функция полезности Неймана - Моргенштерна для ЛПР показывает полезность, которую он приписывает каждому возможному исходу. У каждого ЛПР своя функция полезности, которая показывает его предпочтение к тем или иным исходам в зависимости от его отношения к риску.
Определение 4.3. Ожидаемая полезность события равна сумме произведений вероятностей исходов на значения полезностей этих исходов.
Проиллюстрируем практическую реализацию введенных понятий на примере расчета ОДО и сопоставления этого значения с полезностью.
Слайд 96

Задача . Нефтеперерабатывающая фирма решает вопрос о бурении скважины. Известно, что

Задача . Нефтеперерабатывающая фирма решает вопрос о бурении скважины. Известно, что если

фирма будет бурить, то с ве- роятностью 0,6 нефти найдено не будет; с вероятностью 0,1 запасы месторождения составят 50 ООО т; с вероятностью 0,15- 100 000 т; с вероятностью 0,1 - 500 000 т; с вероятностью 0,05 - 1 000 000 т. Если нефть не будет найдена, то фирма потеряет 50 000 дол.; если мощность месторождения составит 50 000 т, то потери снизятся до 20 000 дол.; мощность месторождения в 100 000 т принесет прибыль 30 000 дол.; 500 000 т - 430 000 дол.; 1 000 000 т - 930 000 дол. Де- рево решений данной задачи представлено на рис.
Слайд 97

Нетрудно рассчитать ожидаемое значение выигрыша: ОДО = 0,6(-50 000) + 0,1(-20

Нетрудно рассчитать ожидаемое значение выигрыша:
ОДО = 0,6(-50 000) + 0,1(-20 000)

+ 0,15 • 30 ООО + 0,1430 000 +
+0,05930 000 = 62 000 дол.
Если ЛПР, представляющий фирму, безразличен к риску и принимает решение о проведении буровых работ на основании рассчитанного ОДО, то он воспринимает ожидаемую полезность как пропорциональную ОДО, полагая
U = 62.
Учитывая, что U - индивидуальное число, характеризующее ЛПР, нули, отвечающие расчету ОДО, можно отбросить. В этом случае функция полезности U(v), где v - прибыль, получаемая при различных исходах, является прямой с положительным наклоном. Можно показать , что U может быть задана с точностью до некоторого монотонного преобразования.
Слайд 98

Для принятия решения в случае небезразличия ЛПР к риску необходимо уметь

Для принятия решения в случае небезразличия ЛПР к риску необходимо уметь

оценивать значения полезности каждого из допустимых исходов.
Дж. Нейман и О. Моргенштерн предложили процедуру построения индивидуальной функции полезности, которая (процедура) заключается в следующем: ЛПР отвечает на ряд вопросов, обнаруживая при этом свои индивидуальные предпочтения, учитывающие его отношение к риску. Значения полезностей могут быть найдены за два шага.
Шаг 1. Присваиваются произвольные значения полезностей выигрышам для худшего и лучшего исходов, причем первой вели- чине (худший исход) ставится в соответствие меньшее число. Например, для приведенной выше задачи U(-50 000 дол.) = 0, а U(930 000 дол.) = 50. Тогда полезности промежуточных выигры- шей будут находиться в интервале от 0 до 50. Полезность исхода даже для одного индивида определяется не однозначно, а с точно- стью до монотонного преобразования. Пусть, например, имеем х1 хг, хп - полезности, приписываемые п ожидаемым значениям вы- игрышей. Тогда
α+βx1 α+β2,а+βхп (где β > 0)
также будут полезностями. Если в задаче 4.1 при расчете полезности отбросить последние нули, это будет эквивалентно линейному преобразованию функции полезности при α= 0 и β = 0,001.
Слайд 99

Шаг 2. Игроку предлагается на выбор: получить некоторую гарантированную денежную сумму

Шаг 2. Игроку предлагается на выбор: получить некоторую гарантированную денежную сумму v,

находящуюся между лучшим и худшим значениями S и s, либо принять участие в игре, т.е. полу- чить с вероятностью р наибольшую денежную сумму S и с вероят- ностью (1 -р) - наименьшую сумму s. При этом вероятность следует изменять (понижать или повышать) до тех пор, пока ЛПР станет без- различным в отношении к выбору между получением гарантирован- ной суммы и игрой. Пусть указанное значение вероятности равно ро. Тогда полезность гарантированной суммы определяется как среднее значение (математическое ожидание) полезностей наименьшей и наибольшей сумм, т.е.
U(v) = p0U(S) + (1-po)U(s). (4.1)
Рассчитаем полезность результатов любого из возможных исходов для задачи 4.1.
Пусть для ЛПР безразлично, потерять 20 ООО дол. или принять участие в игре (выигрыш 930 ООО дол. с вероятностью 0,1 или проигрыш 50 ООО дол. с вероятностью 0,9). Согласно формуле (4.1) имеем:
U(-20) = 0,1 1/(930) + 0,9 t7(-50) = 5,
при этом по определению принято, что U(—50) = 0, U(930) = 50, откуда следует, что U(-20) = 5.
Таким образом, если определена шкала измерения, то может быть построена функция полезности ЛПР (рис. 4.2).
Слайд 100

В общем случае график функции полезности может быть трех типов :

В общем случае график функции полезности может быть трех типов :
для

ЛПР, не склонного к риску, - строго выпуклая функция, у которой каждая дуга кривой лежит выше своей хорды (рис.а);
для ЛПР, безразличного к риску, - прямая линия (рис. б);
для ЛПР, склонного к риску, - строго вогнутая функция, у которой каждая дуга кривой лежит ниже своей хорды (рис. в).
Слайд 101

Измерение отношения к риску Исследуем график функции полезности, представленной на рис.

Измерение отношения к риску

Исследуем график функции полезности, представленной на рис. Для

такого типа ЛПР полезность среднего выигрыша (полезность ОДО) больше ожидаемой полезности игры: с вероятностью р выиграть М1 и с вероятностью (1 -р) выиграть М2
Формально мы имеем график выпуклой функции, о которой известно, что ордината любой точки кривой больше ординаты точки хорды кривой. Определим соотношение, характеризующее ЛПР, несклонное к риску. Нетрудно видеть, что:
U(М1) - значение полезности в точке А; U(М2) - значение полезности в точке В;
U(pМ1 + (1-р)М2) - значение полезности в точке С.
Уравнение хорды АВ имеет вид U1 = а + bМ,
где U1 - совокупность точек, лежащих на отрезке прямой.
Слайд 102

Найдем значения параметров аиb уравнения прямой. В точке А имеем U(M1)

Найдем значения параметров аиb уравнения прямой. В точке А имеем U(M1) =

а + bМ1. В точке В имеем UМ2) = а + bМ2.
Вычитаем из первого выражения второе, исключая величину U(М1)-U(М2) = b(М1-М2),
  откуда получаем:

После подстановки значений для параметров а и b уравнение хорды АВ имеет вид:

где М1 ≤ М ≤М2.

Слайд 103

Пусть М=рМ1 + (1-р)М2, где 0 U(pM1 + (l-p)M2) > а

Пусть М=рМ1 + (1-р)М2, где 0 <р < 1, тогда в

точке С справедливо неравенство
U(pM1 + (l-p)M2) > а + b(рМ1+ (1-р)М2).
Подставив в это неравенство вычисленные значения а и b, получим:
  U(рМ1 + (1 -p)М2) > рU(М1) + (1 -р)U(М2).
(4.2)
Неравенство (4.2) характерно для функций полезности ЛПР, не склонных к риску. Оно действительно показывает, что полезность среднего выигрыша (полезность ОДО) больше ожидаемой полезности игры: с вероятностью р выиграть М1 и с вероятностью (1 - р) выиграть М2.
Аналогично можно показать, что для функций полезности ЛПР, склонных к риску, справедливо неравенство
U(рМ1 + (1 - р)М2) < р U(М1) + (1 - p)U(M2). (4.3)
Для функций полезности ЛПР, безразличных (нейтральных) к риску, имеет место равенство
U(рМ1 +(1-р)М2) = pU(М1) + (1- р)U(М2). (4.4)
Склонность или несклонность ЛПР к риску, как уже отмечалось, зависит от его финансового положения, текущей ситуации принятия решения и других факторов. Иначе говоря, эта характеристика ЛПР не является абсолютной, присущей ему при любых обстоятельствах.
Слайд 104

Приведем пример игры, по отношению к которой любой игрок не склонен

Приведем пример игры, по отношению к которой любой игрок не склонен к

риску.
Петербургский парадокс (игра придумана петербургскими гусарами). Играют двое. Один бросает монету до тех пор, пока не выпадет «орел». Выигрыш равен (2)n руб., где п - число бросков до появления «орла». Ожидаемая величина выигрыша:
ОДО = 2(1/2) + (2)2(1/4) + (2)3(1/8) + ... = 1 + 1 + 1 + ... .
Вряд ли какой-либо игрок согласится заплатить за право участвовать в этой игре сумму, равную ОДО (эта сумма бесконечно велика).
Предположим, что имеет место игра (лотерея) с альтернативами a и b, т.е. G(a, в: α). Исследуем проблему, как целесообразнее по- ступить ЛПР: играть или получить гарантированный выигрыш, рав- ный ожидаемому выигрышу. Пусть функция полезности игрока определена как U(W) = ln(W), где W - величина благосостояния. Пусть игра заключается в выигрыше 5 дол. с вероятностью 0,8 и в выигрыше 30 дол. с вероятностью 0,2. Ожидаемая величина выиг- рыша (ОДО):
E(W) = 5 •*0,8 + 30 * 0,2 = 10 дол.
Для указанной логарифмической функции полезности имеем зависимость, выраженную в табл. 1.
Слайд 105

W - величина благосостояния Рассчитаем полезность ОДО для данной игры: U(Е(W))

W - величина благосостояния

Рассчитаем полезность ОДО для данной игры:
U(Е(W)) = U(10)

= ln(10) = 2,3,
т.е. полезность отказа от игры при получении гарантированного выигрыша, равного 10 дол. (ОДО данной игры), оценивается в 2,3 ютиля (условная единица полезности). Если ЛПР предпочтет игру, то
E(U(W)) = 0,8U(5) +0,2U(30)= 0,8 *1,61 + 0,2 * 3,40 = 1,97 ютиля.
Для рассмотренной логарифмической функции полезности боль- шей полезностью обладает вариант с получением гарантированного выигрыша, равного Е(W) = ОДО, а не участие в игре (2,3 > 1,97). Такое лицо, принимающее решение, не склонно к риску.

Выв од ы. Из соотношений (4.2) - (4.4) вытекает:
если U(E(W)) > E(U(W)\ игрок не склонен к риску;
если U(E(W)) =E(U(W)), игрок нейтрален (безразличен) к риску;
если U(E(W)) < E(U(W)), игрок склонен к риску.
Здесь Е и U - соответственно символы математического ожида- ния и функции полезности.

Слайд 106

Страхование от риска Пусть по-прежнему полезность выражается логарифмической зависимостью U(W) =

Страхование от риска

Пусть по-прежнему полезность выражается логарифмической зависимостью
U(W) =

ln(W) (см. табл. 4.1).
Определим, какую максимальную сумму пожелает заплатить ЛПР, чтобы избежать игры, в которой с вероятностью 0,8 он выигрывает 5 дол. (уменьшение выигрыша на 5 дол. по сравнению с ОДО = 10 дол.) и с вероятностью 0,2 выигрывает 30 дол. (увеличение выигрыша на 20 дол. по сравнению с ОДО).
Значение ожидаемой полезности игры составляет 1,97 ютиля, что соответствует гарантированному выигрышу 7,17 дол. (1n7,17 = 1,97). С другой стороны, сумма ожидаемого выигрыша в случае игры (ОДО) равна 10 дол. Поэтому, чтобы избежать игры, ЛПР согласится заплатить максимальную сумму, равную
10-7,17 = 2,83 дол.
Из этого следует, что, если ЛПР предлагают застраховаться от игры и просят за это сумму, меньшую, чем 2,83 дол., ему выгодно принять предложение. В данном случае величина, равная 2,83 дол. премия (максимальная плата) за риск.
Рассмотрим некоторые приложения теории полезности.
Слайд 107

Задача 4.2. Оптимальная величина страхования. Ювелир владеет бриллиантом стоимостью 100 000

Задача 4.2. Оптимальная величина страхования. Ювелир владеет бриллиантом стоимостью 100 000 дол.

и желает застраховать его от кражи. Страховка покупается по правилу: цена страховки составляет 20% суммы, которую страхуют. Например, если бриллиант страхуется на всю стоимость (100 000 дол.), страховка стоит 20 000 дол., если на половину цены (50 000 дол.), то страховка обходится в 10 000 дол. Если ювелир будет знать (построит) свою функцию
пoлезности, он сможет рассчитать, на какую оптимальную сумму следует застраховать дорогую вещь.
Слайд 108

Ювелир может оказаться в одной из двух ситуаций: 1) бриллиант украден;

Ювелир может оказаться в одной из двух ситуаций:
1) бриллиант украден;


2) бриллиант не украден.
Чем больше сумма страхования, тем больше его состояние (капитал), если бриллиант украден, но тем меньше его состояние, если бриллиант не украден.
Например, если бриллиант застрахован на 50 ООО дол., имеют место два случая.
1. Бриллиант украден. При этом потери ювелира рассчитываются следующим образом:
-100 ООО (бриллиант) - 10 ООО (страховка) + 50 000 (компенсация) = -60 000 дол., а капитал 50 000 - 10 000 = 40 000 дол.
2. Бриллиант не украден. В этом случае капитал ювелира составит:
100 000 (бриллиант) - 10 000 (страховка) = 90 000 дол.
Если бриллиант застрахован на 100 000 дол., то в случае его кражи капитал составит 100 000 - 20 000 = 80 000 дол.;
Если бриллиант не украден, капитал также составит 80 000 дол.
Обозначим капитал ювелира в случае, если бриллиант не украден, через Yn:
Уn =100000-0,2K, (4.5)
где К - сумма страхования.
Если бриллиант украден, то капитал ювелира определим как Y,:
Yt=0,8K.
Слайд 109

Предположим, что можно экспертно определить вероятность р того, что бриллиант будет

Предположим, что можно экспертно определить вероятность р того, что бриллиант будет

украден. Тогда полезность капитала Yt равна U(Yt). Вероятность того, что бриллиант не украден, составляет (1 -р) и U(Yn) - полезность капитала Yn в этом случае.
Ожидаемая полезность U «игры» (с вероятностью р бриллиант украден и с вероятностью (1 -р) - не украден) определяется согласно формуле (4.1) выражением
U = pU(Yt) + {l-p)U(Yn).
Значения Y, и Yn следует выбирать таким образом, чтобы ожидаемая полезность была максимальной, т.е.
рU(Yt)+(1-p)U(Yn)→max.
Пусть точка касания кривой безразличия (линия одинаковой по- лезности) соответствует Уn = 86 000 дол., Yt= 56 000 дол.
Тогда согласно формуле Уn =100000-0,2K имеем 86 000 = 100 000 - 0,2К, откуда оптимальная величина страхования К=70 000 дол.

График, отражающий бюджетное ограничение

О 80 000 86 000 100 000 У„
(К=100 ООО) (К=70 ООО) (К=0)

Слайд 110

Метода Черчмена-Аккофа Исходные положения оценки целей при использовании этого метода: ●

Метода Черчмена-Аккофа

Исходные положения оценки целей при использовании этого метода:
● каждой цели

Ц, соответствует действительное неотрицательное число V, интерпретируемое как величина истинной важности цели Ц;
● если цель Цi важнее цели Цk, то Vi > Vk;
● если Цi и Цк, равноценны, то Vi = Vk;
● если Vi и Vk соответствуют целям Цi и Цк, то Vi + Vk соответствует
совокупности целей Цi + Цк;
●если Цi предпочтительнее Цк, а Цк предпочтительнее Цj - то совместный результат Цi и Цk, предпочтительнее Цj;
●значимость общего результат Цi и Цk эквивалента значимости общего результата Цк и Цi, т.е. порядок представления результатов или их группировки не влияют на предпочтения;
●если общий результат Цi и Цк эквивалентен Цк, то Vi = 0.
Слайд 111

1. Имеется n целей: Ц1 Ц2...., Цn Эксперт определяет их относительную

1. Имеется n целей: Ц1 Ц2...., Цn Эксперт определяет их относительную важность

и осуществляет ранжирование.
2. Цели упорядочиваются в соответствии с их важностью в следующем порядке: Ц1 принимает максимальное значение, Цn принимает минимальное значение.
3. Каждой цели Цi приписывается Vi оценка следующим образом:
V1принимает максимальное значение (V1:=maxV):
i = 2 О < Vi < V1;
i = 3 О < Vi < V2;
i= (n-l), 0i = n, 0 < Vn < Vn-1
Слайд 112

Эксперт(ы) высказывают суждения относительно ценности тех или иных комбинаций результатов, при

Эксперт(ы) высказывают суждения относительно ценности тех или иных комбинаций результатов, при

этом придерживаются следующей схемы
Ц1 сравнивается последовательно с различными комбинациями оставшихся целей, например
Ц1<Ц2+Ц3+….+Цn, что означает предпочтительность Ц2+Ц3+….+Цn относительно Ц1,
Ц1< Ц3+….+Цn, что означает предпочтительность Ц3+….+Цn относительно Ц1.
Таких соотношений строится столько, сколько требуется для описания ситуации решения.
Обычно последним будет соотношение вида
Цn-2<Цn-1+Цn (Цn-2>Цn-1+Цn).
Слайд 113

Задача состоит в том, чтобы скорректировать первоначальные оценки полезности альтернатив, так

Задача состоит в том, чтобы скорректировать первоначальные оценки полезности альтернатив, так

чтобы они не противоречили условиям предпочтительности.
Обычно проверку начинают с последнего условия предпочтительности подставляя в него исходные значения полезностей соответствующих целей
Vn-2Если это условие выполняется, то переходят к следующему условию предпочтительности.
Если не выполняется, то корректируют значение Vn-2 так, чтобы обеспечить выполнение проверяемого условия. Затем переходят к проверке следующего условия, подставляя в него в случае необходимости новое (скорректированное) значение Vn-2. Эта процедура выполняется до тех пор, пока не будет исчерпан весь список условий предпочтительности.
При этом если какое-то скорректированное значение полезности Vj участвовало в предыдущих условиях предпочтительности, то необходимо проверить их выполнение с новым значением Vj.
Если выполнение нарушается, то надо скорректировать еще раз значениеVj, при этом должно сохранится выполнение условия предпочтительности, из которого определялось Vj. Задача считается решенной, если для всех условий предпочтительности будут найдены удовлетворительные значения оценок полезностей альтернатив.
Очевидно, что существует угроза зацикливания алгоритма, которая может возникнуть из-за неудачного выбора первоначальных оценок, а также из-за структуры системы условий предпочтительности.
Слайд 114

Рассмотрим пример [13]. У лица, отвечающего за распределение капиталовложений на некотором

Рассмотрим пример [13]. У лица, отвечающего за распределение капиталовложений на некотором

предприятии, есть 5 предложений по финансированию строительства:
1) расширение отдела технического контроля (ОТК);
2) модернизация цехов;
3) переоборудование кухни;
4) строительство вычислительного центра;
5) расширение автопарка.
Одновременная реализация всех этих замыслов невозможна ввиду ограниченности средств, отпущенных на капитальное строительство. Возникает проблема, требующая выбора на основе решения. Каким мероприятиям отдать предпочтение? Какова степень их срочности? В каком порядке их надо осуществлять?
Итак, надо найти обоснованную последовательность, в которой очередность пяти предлагаемых к реализации мероприятий соответствовала бы их важности. Значит, следует найти и обосновать последовательность предлагаемых к реализации мероприятий, в которой проявлялась бы их относительная важность, причем эту важность нельзя установить, анализируя каждое предложение в отдельности.
Слайд 115

Сначала ответственный за распределение капиталовложений приписывает каждому из предложений некоторое число

Сначала ответственный за распределение капиталовложений приписывает каждому из предложений некоторое число

очков от 0 до 100, причем одно предложение («на первый взгляд» самое важное) должно быть оценено в 100 очков, а другие — соответственно на ступеньку (или несколько ступенек) меньше. При этом для оценки полезности тех или иных статей капиталовложений он может обращаться с запросами к администрации или руководствоваться собственными соображениями. (Эта оценка образует лишь исходный базис, в процессе поиска решения она еще будет корректироваться или укрупняться, закрепляться.) В нашем примере предложениям приписаны следующие числа очков (буквенные обозначения предложений мы вводим для удобства при дальнейших рассуждениях):

После такой подготовки надо организовать оценочную группу, которая будет осуществлять поэтапное сравнение. В этот коллектив должны быть вовлечены не только авторы предложения, но и сотрудники, достаточно далекие от данной проблемы, способные, однако, высказать о ней компетентное суждение (речь идет главным образом о руководящих работниках), в противном случае существует опасность, что вся работа выродится в местническое «перетягивание каната».

Слайд 116

Далее созданный коллектив должен обсудить 17 вопросо в- сравнений, представленных в

Далее созданный коллектив должен обсудить 17 вопросо в- сравнений, представленных в

табл. 15. Эти вопросы читаются следующим образом.
1. Будет ли предложение (намерение, замысел, проект) А более важным, чем все остальные 4 предложения, вместе взятые? (Математический знак > здесь обозначает «важнее чем»,)

2. Будет ли предложение А более важным, чем предложения Б, В и Г, вместе взятые?
3. Будет ли предложение А более важным, чем предложения Б, В и Д, вместе взятые?
Принцип, на котором основана эта опросная схема, виден из табл. 15. Сначала сравнивают (сопоставляют) важнейшее (учитывая очередность поступления) предложение с суммой остальных предложений, причем в правой части неравенства
прежде записывают сумму всех остальных предложений, затем
все сочетания из трех предложений и наконец — из двух.
Отдельные предложения Б...Д с предложением А не сравниваются. Затем А исключается; в левую часть неравенства ставится предложение Б. Справа вначале записывают оставшиеся сочетания из трех предложений, а затем получающиеся из них группы из двух предложений. Далее исключают Б, и в левой части помещают В (вопрос 16), после чего и сравнивают его с парой
Г + Д. Заключает всю эту процедуру вопрос: сравнение Г и Д.

Слайд 117

Слайд 118

Недостаток этого способа: используется только один критерий — важность. Однако в

Недостаток этого способа:
используется только один критерий — важность. Однако в этом

«комплексном» критерии самим правилом в скрытом виде учитываются много частных критериев, например денежные затраты, необходимая рабочая сила, объем кооперации, эконо-мическая эффективность, нормативные акты, требования закона и т. д. Все эти критерии необходимо учитывать при ответе на поставленные вопросы. Это требует от коллектива, принимающего решение, повышенной меры сосредоточенности и внимания. Кроме того, в результате многослойности критерия могут довольно скоро проявиться совершенно противоречивые суждения. Руководитель работы по оценке должен при этом предложить еще 2, 3 или 4, смотря по обстоятельствам, частных критерия и снова объединить их в комплексном критерии «важности». При желании избежать этих трудностей можно ограничиться результатами формального «голосования». Однако не исключено, что это вызовет у некоторых участников чувство неудовлетворенности, так как остались не раскрытыми более глубокие обоснования для решения *.
Слайд 119

Предположим, что все члены коллектива были единодушны в ответах на вопросы,

Предположим, что все члены коллектива были единодушны в ответах на вопросы,

поставленные в табл. 15. На этом фаза качественного сравнения заканчивается и следует этап количественного сравнения с помощью подсчета очков нашей исходной последовательности. Эта работа носит рутинный характер, так что нет необходимости участия в ней всего коллектива, но и целиком отказываться от него не стоит. На этом этапе каждому из 17 вопросов сопоставляют ответ с числом очков исходной ранжировки (см: табл. 16).
Таблица 16
Слайд 120

Повторная проверка неравенств при новом значении А ( =85) показывает, что

Повторная проверка неравенств при новом значении А ( =85) показывает, что

все неравенства для относительных единиц удовлетворяются. Сравнения можно продолжить. Теперь идут 12 и последующие вопросы:

Повторная проверка неравенств при новом значении Б (=95) показывает, что все суммы очков совпадают с ответами табл. 15. Можно продолжить поэтапное сравнение ответов на вопросы16,17

Поскольку на этом этапе произошло изменение Г, то надо повторить сначала. Оказывается, что при рассмотрении вопроса 11 отмечается еще одно изменение:

При этом новом значении А надо опять провести проверку всех вопросов. Поскольку на этот раз при всех 17 вопросах число очков согласуется с ответами в табл. 15, сравнение можно законченным.