Содержание
- 2. Другое определение: деревья решений - это способ представления правил в иерархической, последовательной структуре, где каждому объекту
- 5. Построение деревьев Способ 1. Рисуют деревья слева направо. Необходимо начинать с отображения структуры проблемы в «стволе»
- 6. Помимо этого, на дереве решений необходимо отобразить всю информацию о времени работ, их стоимости, а также
- 7. Составляя дерево решений, необходимо осознавать, что число вариантов развития ситуации должно быть обозримым и иметь какое-то
- 8. Процесс принятия решений с помощью дерева решений в общем случае предполагает выполнение следующих пяти этапов. Этап
- 9. Этап 2. Построение дерева решений. Этап 3 . Оценка вероятностей состояний среды, т.е. сопоставление шансов возникновения
- 11. Вероятность сложных событий, которые представляют собой серию опытов и комбинацию всех возможных исходов, определяется согласно двум
- 12. Рис. 2.1. Правила определения вероятности сложных событий
- 13. Пример 1. ИС работает при условии одновременного функционирования узлов А, В и С, которые работают независимо
- 14. Для каждого узла вероятности таковы: Р (поломка узла А) = 0,2, следовательно, Р (узел А работает)
- 15. Прежде чем продемонстрировать процедуру применения дерева решений, введем ряд определений. В зависимости от отношения к риску
- 17. Пример : Нужно принять решение о целесообразности приобретения оборудования для выполнения сервисных работ двух типов M1
- 18. Этап 3 . Оценка возможных исходов и их вероятностей (носят случайный характер). ЛПР оценивает возможные варианты
- 19. Е MV(M1) = 9000 *0.4 + 25000 *0.6 =8600 ЕMV (M2) = 7800 *0.4 + 27000
- 20. В дальнейшем будем предполагать, что решения принимаются с позиции объективиста. Пример 1. Компания рассматривает вопрос о
- 21. Нарисовав дерево решений, определим наиболее эффективную последовательность действий, основываясь на ожидаемых доходах. Решение. Строим дерево решений.
- 22. Рисуем из этих узлов-исходов ветви с возможными исходами при выборе того или иного варианта из условия.
- 24. Далее считаем ожидаемые стоимостные оценки узлов. Ожидаемая стоимостная оценка узла А равна: ЕМV(А) = 0,8 х
- 25. Области применения деревьев Деревья решений и деревья классификации широко используются в таких прикладных областях, как медицина
- 26. Пример 2. Для финансирования проекта бизнесмену нужно занять сроком на один год 15000 д. е. Банк
- 27. Если банк решает выдать заем, то максимальный ожидаемый чистый доход равен 1560 ф. ст. Решение 2
- 28. Далее расчет ведется аналогично расчетам по таблице доходов. Ожидаемый чистый доход в кружках А и В
- 30. Этап 2. Используя данные табл. 2, вычислим вероятность каждого исхода: Р (клиент ссуду вернет; фирма рекомендовала)
- 32. Доход, ожидаемый от исхода В: Е (В) = 17250 д.е. х 0,98 + 0 х 0,02
- 33. Наконец приступаем к расчету кружков исходов F и G, которые являются результатами решения 4. Е (F)
- 36. Рассмотрим процедуру принятия решения на примере следую- щей задачи, предполагая, что решения принимаются с позиции объективиста.
- 37. Дерево решений без дополнительного обследования конъюнктуры рынка: и □-решение (решение принимает игрок); * - случай (решение
- 38. Процедура принятия решения заключается в вычислении для каждой вершины дерева (при движении справа налево) ожидаемых денежных
- 39. Усложним рассмотренную выше задачу. Пусть перед тем как принимать решение о строительстве, руко- водство компании должно
- 40. Предположим, что фирма, которой заказали прогноз состояния рынка, утверждает: ситуация будет благоприятной с вероятностью 0,45; ситуация
- 42. В ы в о д ы . Из анализа дерева решений следует: необходимо проводить дополнительное исследование
- 43. Рассчитаем ожидаемую ценность точной информации для при- мера, в котором дополнительное обследование конъюнктуры рынка не проводится.
- 44. Теория ожидаемой полезности. Функция полезности В предыдущих главах мы рассматривали принятие решений в условиях неопределенности и
- 45. Одним из первых, кто сформулировал это и предпринял попытку дать свое теоретическое объяснение, был математик Д.Бернулли.
- 46. Предложенная еще в XVIII веке теория ожидаемой полезности получила свое развитие в ХХ веке в трудах
- 47. Примечание Строго говоря, можно представить ситуации, когда функция полезности будет иметь разрывы. Например, если с помощью
- 48. Похожий график функции полезности может встретиться в ситуации, когда риск заключается в недостижении некоторого ключевого показателя,
- 49. Люди, относящиеся к указанным типам, по-разному оценивают потери и выигрыши. У лиц, не склонных к риску,
- 50. Рис.4.1а. Выпуклая ВВЕРХ функция полезности, отражающая НЕПРИЯТИЕ риска. Напротив, для ЛПР, любящего рисковать, психологические выгоды от
- 52. Использование теории ожидаемой полезности при принятии решений. Особенности поведения в условиях риска Чтобы выявить специфику экономического
- 53. Ожидаемый результат такой лотереи ML может быть определен по общей формуле для расчета математического ожидания дискретной
- 54. Рис.4.2. Сравнение рисковой и безрисковой альтернатив для ЛПР, несклонного к риску.
- 55. Опираясь на график, попробуем понять, как люди, по-разному относящиеся к риску, ответили бы на два простых
- 56. Вопрос 2. Какая игра лучше: игра, где можно много выиграть, но и много проиграть, или где
- 57. Рис.4.3. Влияние разброса исходов простой лотереи на ожидаемую полезность альтернатив для ЛПР, несклонного к риску. Проводя
- 58. Лицам, хорошо воспринимающим риск, а, значит, и менее чувствительным к возможным проигрышам, вариант с широким диапазоном
- 59. Функция полезности для лиц, нейтральных к риску, представляет собой прямую (см. рис.4.1в), обеспечивая тем самым одинаковое
- 60. Итак, функция полезности в теории - это возрастающая непрерывная функция, выпуклая вверх для лиц, не склонных
- 61. . Использование теории ожидаемой полезности при принятии решений Детерминированный эквивалент В предыдущем параграфе было показано, что
- 62. В качестве методов, позволяющих это делать, используются резервы, диверсификация, эффект от объединения рисков в пул и
- 63. Теперь рассмотрим ситуацию, когда этому же человеку предлагают выбрать между гарантированным обладанием фиксированной суммой S и
- 64. Рис.4.4. Определение детерминированного эквивалента На графике одинаковый уровень полезности задается горизонтальной прямой, которая параллельна оси абсцисс
- 65. Соотношение ожидаемого выигрыша лотереи ML и ее детерминированного эквивалента S может служить индикатором отношения ЛПР к
- 66. У нейтральных к риску людей детерминированный эквивалент совпадает с ожидаемым выигрышем: S = ML . Использование
- 67. Действительно, чем сильнее человек опасается риска, тем больше он согласен заплатить за его отсутствие. Эта готовность
- 68. Начальное богатство детерминировано и равно х0. Но поскольку убыток случаен, то конечное богатство также является случайной
- 69. Рис.4.5. Полезность возможных исходов конечного богатства.
- 70. Так как x0 - детерминированная величина, то ее математическое ожидание равно самому значению: M(x0) = x0
- 71. Одним из самых распространенных способов передачи чистых рисков является страхование. За фиксированную плату, которая называется страховой
- 72. Альтернатива В: гарантированно потерять часть богатства Π такую, что Π Для конкретного человека и заданной рисковой
- 73. Граничным случаем, когда обе альтернативы эквивалентны, является равенство их ожидаемых полезностей: MuB = MuА Ожидаемая полезность
- 74. На графике полезности этот детерминированный эквивалент находится как абсцисса точки пересечения функции полезности и горизонтальной прямой,
- 75. Размер максимальной страховой премии может служить мерой неприятия риска, поскольку, чем выше эта сумма, тем сильнее
- 76. Объективная составляющая, равная ожидаемому убытку MY, представляет собой "чистую" цену риска. Она определяется только вероятностью и
- 77. Во-вторых, рисковая премия зависит от разброса убытка относительно ожидаемого значения. Это интуитивно понятно - чем шире
- 78. Проиллюстрируем это, сравнив два случайных убытка Y1 и Y2, предполагающих возможность наступления одинакового ущерба у с
- 79. Третий фактор, влияющий на величину рисковой премии - степень неприятия риска. Это также логически объяснимо: чем
- 80. Использование теории ожидаемой полезности при принятии решений 4.6. Коэффициент неприятия риска Зависимость степени кривизны функции полезности
- 81. Существует два вида данного показателя: коэффициент абсолютного и относительного неприятия риска. И тот и другой учитывают
- 82. 4.8. Функция полезности, приближенная к реальной На практике люди не обязательно следуют одному и тому же
- 83. Рис.4.12. Примерный вид функции полезности реального ЛПР. На представленном на рис.4.12 графике можно условно выделить несколько
- 84. Однако по мере роста возможных выигрышей и гарантированных альтернатив (область 2) все сильнее проявляется рискофобный подход.
- 85. Безусловно, исследования, проведенные на достаточно больших группах людей, могут помочь составить функцию полезности "усредненного человека". Ей
- 86. Тем не менее, проблемы с построением функции полезности и с использованием ее для принятия решений не
- 88. ФУНКЦИЯ ПОЛЕЗНОСТИ НЕЙМАНА - МОРГЕНШТЕРНА
- 90. Обоснование выбора решения в предыдущем раздее выполнялось с позиций объективиста. Если же ЛПР - субъективист, то
- 91. Величина БДЭ может изменяться со временем в зависимости от обусловленных указанными причинами обстоятельств. Например, в случае
- 92. Методология рационального принятия решений в условиях неопределенности, основанная на функции полезности индивида, опирается на пять аксиом,
- 93. Аксиома 2. Аксиома транзитивности (состоятельности). Если х > у и у > z, то х >z.
- 94. Аксиома 5. Аксиома ранжирования. Если альтернативы у и и находятся по предпочтительности между альтернативами х и
- 95. Другими словами, из всех возможных решений он выберет то, которое обеспечивает наибольшую ожидаемую полезность. Сформулируем определение
- 96. Задача . Нефтеперерабатывающая фирма решает вопрос о бурении скважины. Известно, что если фирма будет бурить, то
- 97. Нетрудно рассчитать ожидаемое значение выигрыша: ОДО = 0,6(-50 000) + 0,1(-20 000) + 0,15 • 30
- 98. Для принятия решения в случае небезразличия ЛПР к риску необходимо уметь оценивать значения полезности каждого из
- 99. Шаг 2. Игроку предлагается на выбор: получить некоторую гарантированную денежную сумму v, находящуюся между лучшим и
- 100. В общем случае график функции полезности может быть трех типов : для ЛПР, не склонного к
- 101. Измерение отношения к риску Исследуем график функции полезности, представленной на рис. Для такого типа ЛПР полезность
- 102. Найдем значения параметров аиb уравнения прямой. В точке А имеем U(M1) = а + bМ1. В
- 103. Пусть М=рМ1 + (1-р)М2, где 0 U(pM1 + (l-p)M2) > а + b(рМ1+ (1-р)М2). Подставив в
- 104. Приведем пример игры, по отношению к которой любой игрок не склонен к риску. Петербургский парадокс (игра
- 105. W - величина благосостояния Рассчитаем полезность ОДО для данной игры: U(Е(W)) = U(10) = ln(10) =
- 106. Страхование от риска Пусть по-прежнему полезность выражается логарифмической зависимостью U(W) = ln(W) (см. табл. 4.1). Определим,
- 107. Задача 4.2. Оптимальная величина страхования. Ювелир владеет бриллиантом стоимостью 100 000 дол. и желает застраховать его
- 108. Ювелир может оказаться в одной из двух ситуаций: 1) бриллиант украден; 2) бриллиант не украден. Чем
- 109. Предположим, что можно экспертно определить вероятность р того, что бриллиант будет украден. Тогда полезность капитала Yt
- 110. Метода Черчмена-Аккофа Исходные положения оценки целей при использовании этого метода: ● каждой цели Ц, соответствует действительное
- 111. 1. Имеется n целей: Ц1 Ц2...., Цn Эксперт определяет их относительную важность и осуществляет ранжирование. 2.
- 112. Эксперт(ы) высказывают суждения относительно ценности тех или иных комбинаций результатов, при этом придерживаются следующей схемы Ц1
- 113. Задача состоит в том, чтобы скорректировать первоначальные оценки полезности альтернатив, так чтобы они не противоречили условиям
- 114. Рассмотрим пример [13]. У лица, отвечающего за распределение капиталовложений на некотором предприятии, есть 5 предложений по
- 115. Сначала ответственный за распределение капиталовложений приписывает каждому из предложений некоторое число очков от 0 до 100,
- 116. Далее созданный коллектив должен обсудить 17 вопросо в- сравнений, представленных в табл. 15. Эти вопросы читаются
- 118. Недостаток этого способа: используется только один критерий — важность. Однако в этом «комплексном» критерии самим правилом
- 119. Предположим, что все члены коллектива были единодушны в ответах на вопросы, поставленные в табл. 15. На
- 120. Повторная проверка неравенств при новом значении А ( =85) показывает, что все неравенства для относительных единиц
- 122. Скачать презентацию
Другое определение: деревья решений - это способ представления правил в иерархической,
Другое определение: деревья решений - это способ представления правил в иерархической,
Под правилом понимается логическая конструкция вида «если - то».
Объект – некоторый пример, действие, шаблон, наблюдение. Атрибут – признак, свойство.
Узел – внутренний узел дерева, узел проверки.
Лист – конечный узел дерева, узел решения.
Построение деревьев
Способ 1. Рисуют деревья слева направо. Необходимо начинать с
Построение деревьев
Способ 1. Рисуют деревья слева направо. Необходимо начинать с
Дерево решений не содержит циклических элементов (новый лист или ветвь могут только расщепляться).
Места, где принимаются решения, обозначают квадратами, места появления исходов – кругами.
Ветви – это альтернативные решения, которые теоретически могут быть приняты в данной ситуации, а также возможные следствия принятия этих альтернативных решений. Ветви берут свое начало из одной точки (исходных данных), а «разрастаются» до получения конечного результата. Количество ветвей вовсе не свидетельствует о качестве дерева. В некоторых случаях (если дерево получается чересчур «ветвистым») рекомендуется даже воспользоваться отсечением второстепенных ветвей.
Ветви бывают двух видов:
пунктирные линии, которые соединяют квадраты - возможные решения;
сплошные линии, соединяющие кружки возможных конечных результатов.
.
Помимо этого, на дереве решений необходимо отобразить всю информацию о времени
Помимо этого, на дереве решений необходимо отобразить всю информацию о времени
после того, как все решения и предполагаемые результаты будут указаны на дереве, проводится анализ и выбор наиболее выгодного пути.
Одной из наиболее распространенной моделей дерева является трехслойная модель, когда за исходным вопросом идет первый слой возможных решений.
В методе деревьев решений после выбора одного из них вводится второй слой – события, которые могут последовать за принятием решения.
Третий слой – последствия для каждого случая.
.
Составляя дерево решений, необходимо осознавать, что число вариантов развития ситуации должно
Составляя дерево решений, необходимо осознавать, что число вариантов развития ситуации должно
Важным плюсом является то, что дерево решений можно совмещать с экспертными методами на этапах, требующих оценки результата специалистами. Это увеличивает качество анализа дерева решений и способствует правильному выбору стратегии. При анализе деревьев решений для каждой альтернативы рассчитывается ожидаемая стоимостная оценка (EMV) – максимальная из сумм оценок выигрышей, умноженных на вероятность реализации выигрышей, для всех возможных вариантов (см. пример 1).
Процесс принятия решений с помощью дерева решений в общем случае предполагает
Процесс принятия решений с помощью дерева решений в общем случае предполагает
Этап 1 . Формулирование задачи. Прежде всего необходимо отбросить не относящиеся к проблеме факторы, а среди множества оставшихся выделить существенные и несущественные. Это позволит привести описание задачи принятия решения к поддающейся анализу форме. Должны быть выполнены следующие основные процедуры: определение возможностей сбора информации для экспериментирования и реальных действий; составление перечня событий, которые с определенной вероятностью могут произойти; установление временного порядка расположения событий, в исходах которых содержится полезная и доступная информация, и тех последовательных действий, которые можно предпринять.
Этап 2. Построение дерева решений.
Этап 3 . Оценка вероятностей состояний среды,
Этап 2. Построение дерева решений.
Этап 3 . Оценка вероятностей состояний среды,
Этап 4 . Установление выигрышей (или проигрышей как выигрышей со знаком минус) для каждой возможной комбинации альтернатив (действий) и состояний среды.
Этап 5 . Решение задачи.
Вероятность сложных событий, которые представляют собой серию опытов и комбинацию всех
Вероятность сложных событий, которые представляют собой серию опытов и комбинацию всех
Независимыми событиями А и В называются такие, если появление одного из них не изменяет вероятности появления другого.
Несовместимыми событиями А и В называются такие, если может произойти только одно из них.
Рассмотрим пример использования правила вычисления вероятностей для более чем двух событий.
Рис. 2.1. Правила определения вероятности сложных событий
Рис. 2.1. Правила определения вероятности сложных событий
Пример 1. ИС работает при условии одновременного функционирования узлов А, В
Пример 1. ИС работает при условии одновременного функционирования узлов А, В
Решение.
ИС функционирует только в случае бесперебойной работы каждого узла, в противном случае происходит остановка оборудования.
Для каждого узла вероятности таковы:
Р (поломка узла А) = 0,2, следовательно,
Для каждого узла вероятности таковы:
Р (поломка узла А) = 0,2, следовательно,
Р (поломка узла В) = 0,3, следовательно, Р (узел В работает) = 0,7;
Р (поломка узла С) = 0,1, следовательно, Р (узел С работает) = 0,9.
По дереву вероятностей, представленному на рис.2.2 Определим вероятность бесперебойной работы узлов в течение года:
Р (работает А и работает В и работает С)=0,8*0,7*0,9=0,504
Однако необходимо вычислить вероятность поломки оборудования в течение года.
Эта вероятность равна сумме семи остальных «ветвей» или, так как вероятность полной группы событий (т.е. бесперебойная работа и поломка), равна 1, то:
Р(поломка) = 1 – Р(бесперебойная работа) = 1 – 0,504 = 0,496
С целью модификации вероятности в случае, когда появилась новая дополнительная информация, используется формула Байеса:
Р(АВ) = Р(А) * З(В/А) или Р(АВ) = Р(В) * Р(А/В),
Вероятность Р(А) подсчитывается до проведения опыта, поэтому носит теоретический, предварительный характер. Вероятность Р(А/В) основывается на данных уже проведенного эксперимента, поэтому более точна с практической точки зрения.
Прежде чем продемонстрировать процедуру применения дерева решений, введем ряд определений.
Прежде чем продемонстрировать процедуру применения дерева решений, введем ряд определений.
Пример : Нужно принять решение о целесообразности приобретения оборудования для выполнения
Пример : Нужно принять решение о целесообразности приобретения оборудования для выполнения
Процесс принятия решения может быть выполнен в несколько этапов :
Этап 1, Определение цели .
В качестве критерия выбиралась максимизация математического ожидания прибыли .
Этап 2 . Определение набора возможных действий для рассмотрения и анализа ((контролируются лицом , принимающим решение)
Может выбрать один из двух вариантов :
а1 - {покупка Ml}
а2 = {покупка М2}
Этап 3 . Оценка возможных исходов и их вероятностей (носят случайный
Этап 3 . Оценка возможных исходов и их вероятностей (носят случайный
ЛПР оценивает возможные варианты годового спроса (кол-во заявок на обслуживание) и соответствующие им вероятности следующим образом :
х! = 1200 единиц с вероятностью 0.4
х2 = 2000 единиц с вероятностью 0.6
Этап 4. Оценка математического ожидания возможного дохода (EMV или ОДО) :
Е MV(M1) = 9000 *0.4 + 25000 *0.6 =8600
ЕMV (M2)
Е MV(M1) = 9000 *0.4 + 25000 *0.6 =8600
ЕMV (M2)
Таким образом, вариант с приобретением станка М2 экономически более целесообразен.
В дальнейшем будем предполагать, что решения принимаются с позиции объективиста.
Пример 1.
В дальнейшем будем предполагать, что решения принимаются с позиции объективиста.
Пример 1.
а). Построить большой завод стоимостью Ст1 = 500 тысяч д.е.
При этом варианте возможны:
большой спрос- годовой доход в размере Д1 = 200 тысяч д.е. в течение следующих 5 лет с вероятностью p1 = 0,8;
низкий спрос- ежегодные убытки Д2 = 90 тысяч д.е. с вероятностью р2 = 0,2. б). Построить маленький завод стоимостью Ст2 = 300 тысяч д.е.
При этом варианте возможны:
большой спрос - годовой доход в размере Д3 = 100 тысяч д.е. в течение следующих 5 лет с вероятностью p3 = 0,8 ;
низкий спрос - ежегодные убытки Д4 = 40 тысяч д.е. с вероятностью р4 = 0,2; в). Отложить строительство завода на один год для сбора дополнительной информации, которая может быть позитивной или негативной с вероятностью p5 = 0,7и p6 = 0,3 соответственно. Доходы на последующие четыре года остаются прежними. В случае негативной информации компания заводы строить не будет.
Нарисовав дерево решений, определим наиболее эффективную последовательность действий, основываясь на ожидаемых
Нарисовав дерево решений, определим наиболее эффективную последовательность действий, основываясь на ожидаемых
Решение. Строим дерево решений. Строим узел 1, из которого исходят три заявленные в условии варианты. Обозначаем эти ветви пунктиром, поскольку это – возможные решения. На концах ветвей ставим узлы-исходы, заключаем их в круг и обозначаем буквами А, В и т.д.
Рисуем из этих узлов-исходов ветви с возможными исходами при выборе того
Рисуем из этих узлов-исходов ветви с возможными исходами при выборе того
Далее считаем ожидаемые стоимостные оценки узлов.
Ожидаемая стоимостная оценка узла А
Далее считаем ожидаемые стоимостные оценки узлов.
Ожидаемая стоимостная оценка узла А
ЕМV(А) = 0,8 х 1000 + 0,2 х (-450) -500 = 210.
EMV( B) = 0,8 х 500 + 0,2 х (-200) - 300 = 60.
EMV( D) = 0,9 x 800 + 0,1 x (-360) - 500 = 184.
EMV(E) = 0,9 x 400 + 0,1 х (-160) - 300 = 44.
Для узлов принятия решения 2 (второй уровень, условно) выбираем максимальную оценку:
EMV(2) = max {EMV( D), EMV( E)} = max {184, 44} = 184 = EMV(D).
Поэтому в узле 2 отбрасываем возможное решение «маленький завод».
EMV(C) = 0,7 x 184 + 0,3 x 0 = 128,8.
Для узла принятия решения 1 – узла принятия окончательного решения, аналогично выбираем максимальную оценку на других узлах.
EMV(1) = max {ЕМV(A), EMV(B), EMV(C)} = max {210; 60; 128,8} = 210 = EMV(А). Поэтому в узле 1 выбираем решение «большой завод». Исследование проводить не нужно. Строим большой завод. Ожидаемая стоимостная оценка этого наилучшего решения равна 210 тысяч д.е.
Ответ: наиболее подходящее решение – решение строить большой завод.
Области применения деревьев Деревья решений и деревья классификации широко используются в
Области применения деревьев Деревья решений и деревья классификации широко используются в
Пример 2. Для финансирования проекта бизнесмену нужно занять сроком на один
Пример 2. Для финансирования проекта бизнесмену нужно занять сроком на один
Решение 1 (по таблице доходов).
Максимизируем ожидаемый в конце года чистый доход, который представляет собой разность суммы, полученной в конце года, и инвестированной в его начале. Таким образом, если заем был выдан и возвращен, то чистый доход составит:.
Чистый доход = ((15000 + 15% от 15000) - 15000) = 2250 д. е.
Таблица 1. Чистый доход в конце года, д. е.
Если банк решает выдать заем, то максимальный ожидаемый чистый доход равен
Если банк решает выдать заем, то максимальный ожидаемый чистый доход равен
Решение 2 (по "дереву" решений).
В данном случае также используем критерий максимизации ожидаемого чистого дохода на конец года.
Далее расчет ведется аналогично расчетам по таблице доходов. Ожидаемый чистый доход
Далее расчет ведется аналогично расчетам по таблице доходов. Ожидаемый чистый доход
В кружке А:
Е (давать заем) = {17250 х 0,96 + 0 х 0,04} - 15000 =
= 16500 - 15000 = 1560 д. е.
В кружке Б:
Е (не давать заем) = {16350 х 1,0 - 15000} = 1350 д. е.
Поскольку ожидаемый чистый доход больше в кружке А, то принимаем решение выдать заем.
2. Расчет двухуровневого "дерева" решений
Пример 2. Рассмотрим ситуацию более сложную, чем в предыдущем а именно: банк решает вопрос, проверять ли конкурентоспособность клиента, перед тем, как выдавать заем. Аудиторская фирма берет с банка 80 д.е. за проверку. В результате этого перед банком встают две проблемы: первая проводить или нет проверку, вторая — выдавать после этого заем или нет.
Решая первую проблему, банк проверяет правильность выдаваемых аудиторской фирмой сведений. Для этого выбираются 1000 человек, которые были проверены и которым впоследствии выдавались ссуды
Этап 2. Используя данные табл. 2, вычислим вероятность каждого исхода:
Р (клиент
Этап 2. Используя данные табл. 2, вычислим вероятность каждого исхода:
Р (клиент
Р (клиент ссуду не вернет; фирма рекомендовала) = 15/750 = 0,02;
Р (клиент ссуду вернет; фирма не рекомендовала) = 225/ 250 = 0,9;
Р (клиент ссуду не вернет; фирма не рекомендовала)= 25/250= 0,1.
Этап 3. На этом этапе слева направо проставим денежные исходы каждого из "узлов", используя конечные результаты, вычисленные ранее. Любые встречающиеся расходы вычитаем из ожидаемых доходов. Таким образом подсчитываем все "дерево", опираясь на ранее полученные результаты. После того, как пройдены квадраты "решений", выбирается "ветвь", ведущая к наибольшему из возможных при данном решении ожидаемому доходу. Другая "ветвь" зачеркивается, а ожидаемый доход проставляется над квадратом решения.
Сначала посмотрим на кружки исходов В и С, являющиеся следствием квадрата 2 (выдавать ли заем клиенту?)
Доход, ожидаемый от исхода В:
Е (В) = 17250 д.е. х 0,98
Доход, ожидаемый от исхода В:
Е (В) = 17250 д.е. х 0,98
NЕ (В) = 16905 - 15000 = 1905 д. е.
Доход, ожидаемый от исхода С:
Е (С) = 16350 д. е. х 1,0 = 16350 д. е., чистый ожидаемый доход:
NЕ (С) = 16350 - 15000 = 1350 д. е. Предположим, что мы сейчас в квадрате 2. Максимальный ожидаемый доход 1905 д. е. в кружке В, поэтому принимаем решение выдать заем.
Приняв решение, корректируем "дерево", проставив чистый ожидаемый доход 1905 д.е. над квадратом 2. "Ветвь" - не давать заем - зачеркивается, показано на рис. 3.
То же самое с кружками исходов D и Е - результатами решения 3.
Доход, ожидаемый от исхода D:
Е(D) = (17250 д. е. хО,9) + (0 х 0,1)= 15525 д. е., чистый ожидаемый доход:
NЕ (D) = 15525 - 15000 = 525 д. е.
Аналогично для исхода Е:
Е (Е) = 16350 д. е. х 1,0 = 16350 д. е., чистый ожидаемый доход:
NЕ (Е) = 16350 - 15000 - 1350 д. е.
Если бы мы были в квадрате 3, то максимальный ожидаемый доход был бы равен 1350 д. е. и можно было бы принять решение не выдавать заем. Теперь скорректируем эту часть схемы: над квадратом 3 пишем чистый ожидаемый доход и принимаем решение выдать заем.
Наконец приступаем к расчету кружков исходов F и G, которые являются
Наконец приступаем к расчету кружков исходов F и G, которые являются
Е (F) = 17250 д. е. х 0,96 + 0 х 0,04 = 16560 д. е.;
NЕ (F) - 16560 - 15000 = 1560 д. е.;
Е (G) = 16350 х 1,0 = 16350 д. е.;
NЕ (G) = 16350 - 15000 = 1350 д. е.
В квадрате 4 максимальный ожидаемый чистый доход составляет 1560 д. е., и поэтому принимаем решение выдать клиенту ссуду. Сумма 1560 д. е. надписывается над квадратом 4, а альтернативная "ветвь" перечеркивается.
Теперь вернемся к "узлам" А и 1. Используя ожидаемые чистые доходы над квадратами 2 и 3, рассчитаем математическое ожидание для кружка А:
Е (А) = (1905 д. е. х 0,75) + (1350 д. е. х 0,25) = 1766 д. е.
Так как аудиторская проверка стоит 80 ф. ст., ожидаемый чистый доход;
NЕ (А) = 1766 - 80 = 1686 д. е. Теперь можно проставить значения первого решения квадрата 1. Должен ли банк воспользоваться аудиторской проверкой? В этом "узле" максимальное математическое ожидание - 1686 д. е., поэтому перечеркиваем альтернативную "ветвь". "Дерево" окончательных решений для примера 2. приведено на рис. 3.
На рис. 3 стрелками показана последовательность решений, ведущая к максимальному чистому доходу: в квадрате 1 воспользуемся аудиторской проверкой. Если выдача займа рекомендуется фирмой, тогда в квадрате 2 - выдать ссуду, если не рекомендуется, то в квадрате 3 - не выдавать ссуду, а инвестировать эти деньги под стабильные 9% годовых.
Рассмотрим процедуру принятия решения на примере следую-
щей задачи, предполагая, что решения
Рассмотрим процедуру принятия решения на примере следую- щей задачи, предполагая, что решения
Задача 3. Руководство некоторой компании решает, создавать ли для выпуска новой
продукции крупное производство, малое предприятие или продать патент другой фирме.
Размер выигрыша, который компания может получить, зависит от благоприятного или неблагоприятного состояния рынка (табл. 1). Вероятность благоприятного и
неблагоприятного состояний экономической среды 0.5
Дерево решений без дополнительного обследования конъюнктуры
рынка: и □-решение (решение принимает
Дерево решений без дополнительного обследования конъюнктуры рынка: и □-решение (решение принимает
Процедура принятия решения заключается в вычислении для
каждой вершины дерева (при движении
Процедура принятия решения заключается в вычислении для каждой вершины дерева (при движении
Определим средний ожидаемый выигрыш:
для вершины 1 ОДО, = 0,5 • 200 ООО + 0,5(-180 ООО) = 10 ООО дол.;
для вершины 2 ОД02 = 0,5 • 100 000 + 0,5(-20 000) = 40 000 дол.;
для вершины 3 ОД03 = 10 000 дол.
Вывод. Наиболее целесообразно выбрать стратегию а2, т.е. строить малое предприятие, а ветви (стратегии) а1 и а3 дерева реше- ний можно отбросить. ОДО наилучшего решения равна 40 000 дол. Следует отметить, что наличие состояния с вероятностями 50% неудачи и 50% удачи на практике часто означает, что истинные вероятности игроку, скорее всего, неизвестны и он всего лишь принимает такую гипотезу (так называемое предположение «fifty - fifty. - пятьдесят на пятьдесят).
Усложним рассмотренную выше задачу.
Пусть перед тем как принимать решение о строительстве,
Усложним рассмотренную выше задачу.
Пусть перед тем как принимать решение о строительстве,
Относительно фирмы, которой можно заказать прогноз, извест- но, что она способна уточнить значения вероятностей благоприятно- го или неблагоприятного исхода. Возможности фирмы в виде ус- ловных вероятностей благоприятности и неблагоприятности рынка сбыта представлены в табл. 3.2. Например, когда фирма утверждает, что рынок благоприятный, то с вероятностью 0,78 этот прогноз оправдывается (с вероятностью 0,22 могут возникнуть неблагопри- ятные условия), прогноз о неблагоприятности рынка оправдывается с вероятностью 0,73.
Предположим, что фирма, которой заказали прогноз состояния рынка,
утверждает:
ситуация будет благоприятной
Предположим, что фирма, которой заказали прогноз состояния рынка,
утверждает:
ситуация будет благоприятной
ситуация будет неблагоприятной с вероятностью 0,55.
На основании дополнительных сведений можно построить новое дерево
решений (рис. 2), где развитие событий происходит от корня дерева к
исходам, а расчет прибыли выполняется от конечных состояний к начальным.
В ы в о д ы . Из анализа дерева решений
В ы в о д ы . Из анализа дерева решений
необходимо проводить дополнительное исследование конъ- юнктуры рынка, поскольку это позволяет существенно уточнить принимаемое решение;
если фирма прогнозирует благоприятную ситуацию на рынке, то целесообразно строить большое предприятие (ожидаемая макси- мальная прибыль 116 400 дол.), если прогноз неблагоприятный - малое (ожидаемая максимальная прибыль 12 400 дол.).
3. Ожидаемая ценность точной информации
Предположим, что консультационная фирма за определенную плату готова предоставить информацию о фактической ситуации на рынке в тот момент, когда руководству компании надлежит принять решение о масштабе производства. Принятие предложения зависит от соотношения между ожидаемой ценностью (результативностью) точной информации и величиной запрошенной платы за дополнительную (истинную) информацию, благодаря которой может быть откорректировано принятие решения, т.е. первоначальное действие может быть изменено.
Ожидаемая ценность точной информации о фактическом состоянии рынка равна разности между ожидаемой денежной оценкой при наличии точной информации и максимальной ожидаемой денежной оценкой при отсутствии точной информации.
Рассчитаем ожидаемую ценность точной информации для при-
мера, в котором дополнительное обследование
Рассчитаем ожидаемую ценность точной информации для при- мера, в котором дополнительное обследование
ОДО = 0,5 • 100 000 - 0,5 • 20 000 = 40 000 дол.
Если точная информация об истинном состоянии рынка будет благоприятной (ОДО = 200 000 дол., см. табл. 1), принимается решение строить крупное производство, если неблагоприятной, то наиболее целесообразное решение - продажа патента (ОДО = 10 000 дол). Учитывая, что вероятности благоприятной и неблагоприятной ситуаций равны 0.5, значение ОДОти (ОДО точной информации) определяется выражением:
ОДОти= 0,5 • 200 000 + 0,5-10 000 = 105 000 дол.
Тогда ожидаемая ценность точной информации ОЦти=ОДОти-ОДО=105000-40000=65000дол.
Значение ОЦти показывает, какую максимальную цену должна быть готова заплатить компания за точную информацию об истинном состоянии рынка в тот момент, когда это ей необходимо.
Теория ожидаемой полезности. Функция полезности
В предыдущих главах мы рассматривали принятие решений
Теория ожидаемой полезности. Функция полезности
В предыдущих главах мы рассматривали принятие решений
Одним из первых, кто сформулировал это и предпринял попытку дать свое
Одним из первых, кто сформулировал это и предпринял попытку дать свое
Функция полезности отражает меру психологического удовлетворения благами. Традиционно она обозначается u(x). Единицей измерения полезности является "ютил". Аргументом х для данной функции выступает количество благ. В наших примерах в качестве х используются денежные суммы выигрышей, прибыли или убытков. Поэтому u(x) представляет функцию полезности денег.
Предложенная еще в XVIII веке теория ожидаемой полезности получила свое развитие в ХХ
Предложенная еще в XVIII веке теория ожидаемой полезности получила свое развитие в ХХ
Использование теории ожидаемой полезности при принятии решений. Свойства функции полезности. Отношение к риску
Согласно предположению Бернулли, альтернативы сравниваются по их ожидаемой полезности. Чтобы ее рассчитать, необходимо в соответствие каждому возможному исходу x поставить некоторое значение полезности u. Это можно сделать, введя функцию полезности u(x), определяющую однозначную зависимость между х и u. Какими же свойствами должна обладать данная функция?
Во-первых, функция полезности должна быть возрастающей. Это отражает принцип: "чем больше благ, тем лучше".
Во-вторых, в общем случае, функция полезности должна быть непрерывна, поскольку если две альтернативы обеспечивают нам близкое количество благ, то и полезности этих двух альтернатив должна быть близкими.
Примечание
Строго говоря, можно представить ситуации, когда функция полезности будет иметь разрывы.
Примечание
Строго говоря, можно представить ситуации, когда функция полезности будет иметь разрывы.
Похожий график функции полезности может встретиться в ситуации, когда риск заключается
Похожий график функции полезности может встретиться в ситуации, когда риск заключается
В-третьих, функция полезности должна отражать отношение ЛПР к риску - склонность или неприятие. Это значит, что функция должна корректно описывать различия в психологическом восприятии ЛПР потерь и выигрышей. Какие же типы поведения существую по отношению к риску, и в чем это проявляется?
В зависимости от отношения к риску выделяют три чистых психологических типа:
не склонный к риску ("рискофоб");
нейтральный к риску;
склонный к риску ("рискофил").
Люди, относящиеся к указанным типам, по-разному оценивают потери и выигрыши.
У лиц,
Люди, относящиеся к указанным типам, по-разному оценивают потери и выигрыши.
У лиц,
u(x0) - u(x0 - Δх) > u(x0 + Δх)- u(x0),
где:
u(x0) - u(x0 - Δх) - отражает уменьшение полезности (то есть меру переживаний, неудовлетворения) из-за потери Δх рублей,
u(x0 + Δх) - u(x0) - отражает увеличение полезности (то есть меру удовлетворения) от выигрыша такой же суммы Δх.
Данное условие выполняется, если функция полезности является "выпуклой вверх". На рис.4.1а хорошо видно, что выпуклая вверх функция u(x)действительно отражает большую "чувствительность" ЛПР к возможным потерям, чем к выигрышам.
Рис.4.1а. Выпуклая ВВЕРХ функция полезности, отражающая НЕПРИЯТИЕ риска.
Напротив, для ЛПР, любящего рисковать,
Рис.4.1а. Выпуклая ВВЕРХ функция полезности, отражающая НЕПРИЯТИЕ риска.
Напротив, для ЛПР, любящего рисковать,
Использование теории ожидаемой полезности при принятии решений. Особенности поведения в
Использование теории ожидаемой полезности при принятии решений. Особенности поведения в
Чтобы выявить специфику экономического поведения в условиях риска мы будем использовать модель так называемой "простой лотереи" или "простого шанса". У ЛПР есть шанс оказаться в состоянии х1 с вероятностью р1 = р и в состоянии х2 с вероятностью р2 = (1 - р). Других возможностей, кроме этих двух вариантов, нет. Поэтому такую лотерею также часто называют бинарной. В кратком виде "простой шанс" записывается следующим образом:
L = { x1, x2, p}
Ожидаемый результат такой лотереи ML может быть определен по общей формуле для расчета
Ожидаемый результат такой лотереи ML может быть определен по общей формуле для расчета
Ожидаемая полезность данной лотереи MuL рассчитывается по аналогичной формуле, только вместо реальных значений исходов х1 и х2 в нее подставляются значения функции полезности u(х1) и u(х2):
Это означает, что на координатной плоскости ожидаемая полезность будет находиться на отрезке, соединяющем значения функции полезности u(х1) и u(х2)(см.рис.4.2), причем:
Рис.4.2. Сравнение рисковой и безрисковой альтернатив для ЛПР, несклонного к риску.
Рис.4.2. Сравнение рисковой и безрисковой альтернатив для ЛПР, несклонного к риску.
Опираясь на график, попробуем понять, как люди, по-разному относящиеся к риску,
Опираясь на график, попробуем понять, как люди, по-разному относящиеся к риску,
Вопрос 1. Что лучше: гарантированно иметь некоторую сумму денег или получить возможность сыграть в лотерею, ожидаемый выигрыш в которой равен этой же сумме?
Вариант с гарантированным обладанием деньгами называется "безрисковая альтернатива" (sure alternative). В свою очередь, возможность сыграть в лотерею по аналогии называют "рисковой альтернативой".
Из графика полезности ЛПР, не склонного к риску (см.рис.4.2), видно, что ожидаемая полезность лотереи MuL при любых значениях х1, х2 и р будет ниже полезности гарантированной суммы в размере ожидаемого выигрыша ML:
u(ML) > MuL
Это означает, что осторожные люди, не любящие риск, предпочтут получить гарантированную сумму вместо того, чтобы сыграть в лотерею с таким же ожидаемым выигрышем. Нетрудно показать, что лица, склонные к риску, в подобных условиях выберут лотерею, а для "нейтрала" рисковая и безрисковая альтернативы будут равноценны.
Вопрос 2. Какая игра лучше: игра, где можно много выиграть, но и
Вопрос 2. Какая игра лучше: игра, где можно много выиграть, но и
Для ответа на этот вопрос рассмотрим две простые лотереи L{x1, x2, p} и L'{x'1, x'2, p'}, такие что:
x1 < x'1 и x'2 < x2
Лотерея L дает возможность выиграть больше, чем L', но и возможный проигрыш здесь тяжелее. Исходы лотереи L' не выходят за пределы L. Относительно вероятностей выигрыша или проигрыша никаких предположений не вводим. Как мы увидим дальше, ответ на интересующий нас вопрос в данном случае от вероятностей не зависит.
Как уже отмечалось выше, ожидаемая полезность каждой из этих лотерей лежит на хорде, которая соединяет две точки на графике полезности, соответствующие двум возможным исходам. Точное положение ожидаемой полезности на этой хорде зависит от вероятности выиграть или проиграть.
Рис.4.3. Влияние разброса исходов простой лотереи на ожидаемую полезность альтернатив для ЛПР,
Рис.4.3. Влияние разброса исходов простой лотереи на ожидаемую полезность альтернатив для ЛПР,
Проводя все возможные хорды для любых значений х1, х2 , х'1 , х'2 при условии, что x1 < x'1 и x'2 < x2 (см.рис.4.3), можно заметить следующую закономерность. При выпуклом вверх графике полезности хорда, описывающая ожидаемую полезность второй лотереи L', всегда выше хорды для L. Это означает, что при заданных пределах ЛПР, не склонный к риску, всегда будет выбирать альтернативу с меньшим разбросом исходов.
Лицам, хорошо воспринимающим риск, а, значит, и менее чувствительным к возможным
Лицам, хорошо воспринимающим риск, а, значит, и менее чувствительным к возможным
При нейтральном отношении к риску решение будет зависеть не от разброса исходов, а от ожидаемого значения. Здесь может оказаться предпочтительным вариант с широким разбросом, если он обещает больший ожидаемый выигрыш (и, следовательно, более высокую ожидаемую полезность).
Рис.4.1б. Выпуклая ВНИЗ функция полезности, отражающая СКЛОННОСТЬ к риску.
Функция полезности для лиц, нейтральных к риску, представляет собой прямую (см.
Функция полезности для лиц, нейтральных к риску, представляет собой прямую (см.
Рис.4.1в. ЛИНЕЙНАЯ функция полезности, отражающая НЕЙТРАЛЬНОЕ отношение к риску.
Итак, функция полезности в теории - это возрастающая непрерывная функция, выпуклая
Итак, функция полезности в теории - это возрастающая непрерывная функция, выпуклая
Следует отметить, что перечисленные типы являются "чистыми". Люди, относящиеся исключительно к одному чистому типу, в жизни встречаются редко. В зависимости от возраста, ситуации, настроения, уровня богатства, величины возможных потерь или выигрышей один и тот же человек может демонстрировать как "рискофобное" поведение, так и склонность к риску, либо "нейтралитет".
Согласно исследованиям, основная часть людей в экономическом плане в большей или меньшей степени демонстрируют неприятие риска. Поэтому в экономической литературе значительное внимание уделено именно такому типу поведения. Какие же особенности принятия решений можно выявить, исследуя функцию полезности лиц, не склонных к риску?
. Использование теории ожидаемой полезности при принятии решений
Детерминированный эквивалент
В предыдущем параграфе
. Использование теории ожидаемой полезности при принятии решений
Детерминированный эквивалент
В предыдущем параграфе
Человек, который предпочитает не рисковать и иметь меньше, но гарантированно, готов платить за возможность избежать риска! "Страх" потерять проявляется и в обычной хозяйственной деятельности, и при работе на финансовых рынках. А если кто-то готов платить, то всегда найдется тот, кто захочет на этом зарабатывать. Так появились коммерческое страхование, опционы, фьючерсы, всевозможные виды гарантий и т.д. Суть этих инструментов с точки зрения потребителя - передача риска другой стороне за определенную неслучайную плату. Такие инструменты будут надежно работать только при условии, что принимающая риск сторона может его надлежащим образом финансировать (то есть покрыть последствия возможной реализации риска).
В качестве методов, позволяющих это делать, используются резервы, диверсификация, эффект от
В качестве методов, позволяющих это делать, используются резервы, диверсификация, эффект от
Рассмотрим ситуацию с простой лотерей L из п.4.2 для ЛПР, не склонного к риску. Ожидаемый выигрыш составляет ML, а ожидаемая полезность MuL. На графике 4.1а мы видели, что полезность u(ML) гарантированного обладания суммой в размере ML для лица, не принимающего риск, всегда выше ожидаемой полезности MuL лотереи с таким же ожидаемым выигрышем:
u(ML) > MuL
То есть человек выберет безрисковую альтернативу.
Теперь рассмотрим ситуацию, когда этому же человеку предлагают выбрать между гарантированным
Теперь рассмотрим ситуацию, когда этому же человеку предлагают выбрать между гарантированным
В рамках рассматриваемой теории две альтернативы считаются эквивалентными, если равны их ожидаемые полезности. Применительно к нашему случаю должны быть равны ожидаемые полезности лотереи и гарантированной суммы.
Ожидаемая полезность лотереи нам известна. Она равна MuL.
Обладание гарантированной суммой S неслучайно, поэтому ожидаемая полезность этой альтернативы равна просто полезности данной суммы S.
MuS = u(S)
Тогда, можем записать условие эквивалентности двух рассматриваемых альтернатив:
u(S) = MuL
Рис.4.4. Определение детерминированного эквивалента
На графике одинаковый уровень полезности задается горизонтальной прямой, которая
Рис.4.4. Определение детерминированного эквивалента
На графике одинаковый уровень полезности задается горизонтальной прямой, которая
Соотношение ожидаемого выигрыша лотереи ML и ее детерминированного эквивалента S может служить индикатором отношения ЛПР
Соотношение ожидаемого выигрыша лотереи ML и ее детерминированного эквивалента S может служить индикатором отношения ЛПР
В рассмотренном нами случае с выпуклым вверх графиком функции полезности детерминированный эквивалент всегда меньше ожидаемого выигрыша:
S < ML
Это характерно для лиц, негативно воспринимающих риск.
Люди, склонные к риску, имеющие выпуклый вниз график полезности, напротив, готовы заплатить за участие в лотерее больше, чем объективно ожидаемый выигрыш:
S > ML
Отчасти это можно объяснить тем, что сам факт участия в лотерее является для них определенным психологическим благом, представляющим дополнительную полезность. И за это они готовы доплачивать.
У нейтральных к риску людей детерминированный эквивалент совпадает с ожидаемым выигрышем:
S
У нейтральных к риску людей детерминированный эквивалент совпадает с ожидаемым выигрышем:
S
. Использование теории ожидаемой полезности при принятии решений
Мера неприятия риска
До настоящего момента мы делили людей в зависимости от их отношения к риску на три типа: рискофобы, рискофилы и нейтралы. Но на принятие решения влияет не только общая направленность, но и степень толерантности к риску. Действительно, два рискофоба в одинаковых ситуациях могут выбрать разные альтернативы, потому что их "сила отторжения" риска различна. Что же может служить мерой неприятия риска? По каким показателям можно судить, насколько человек толерантен к риску?
В предыдущем параграфе мы отметили готовность человека, не склонного к риску, платить за его отсутствие. Это дает возможность использовать количественные характеристики такой готовности в качестве меры неприятия риска.
Действительно, чем сильнее человек опасается риска, тем больше он согласен заплатить
Действительно, чем сильнее человек опасается риска, тем больше он согласен заплатить
величиной максимальной страховой премии, на которую согласен ЛПР;
величиной так называемой "премии за риск".
Премия за риск может быть представлена как в абсолютных, так и в относительных величинах (как доля от максимальной страховой премии).
Рассмотрим эти характеристики подробнее на примере гипотетической ситуации с человеком, не склонным к риску и обладающим начальным богатством х0 денежных единиц. Предположим, что с вероятностью р может произойти убыток в размере у денежных единиц.
Дискретная случайная величина Y, описывающая данный убыток, может быть записана как простейшая лотерея Y{y, 0, p}.
Начальное богатство детерминировано и равно х0. Но поскольку убыток случаен, то конечное
Начальное богатство детерминировано и равно х0. Но поскольку убыток случаен, то конечное
Х = x0 - Y
Распределение этой СВ имеет следующий вид:
с вероятностью р конечное богатство равно (х0 - у), а
с вероятностью (1 - р) оно останется неизменным и равным х0.
Данная схема описывает типичную ситуацию так называемого "чистого" риска, который несет в себе возможность только потерять и не предполагает возможность обогатиться. В лучшем случае все просто останется, как есть.
График полезности для рассматриваемой ситуации приведен на рис.4.5.
Рис.4.5. Полезность возможных исходов конечного богатства.
Рис.4.5. Полезность возможных исходов конечного богатства.
Так как x0 - детерминированная величина, то ее математическое ожидание равно самому значению:
M(x0)
Так как x0 - детерминированная величина, то ее математическое ожидание равно самому значению:
M(x0)
Таким образом:
MX = x0 - MY
Поскольку мы рассматриваем ситуацию с позиции ЛПР, не склонного к риску, то ожидаемая полезность конечного богатства MuX оказывается меньше полезности ожидаемого конечного богатства u(MX) (см.рис.4.6). Значит ЛПР хотел бы избавиться от риска, даже если за это он должен заплатить некоторую сумму.
Рис.4.6. Полезность ожидаемого конечного богатства u(MX) и ожидаемая полезность конечного богатства MuX.
Одним из самых распространенных способов передачи чистых рисков является страхование. За
Одним из самых распространенных способов передачи чистых рисков является страхование. За
Решение застраховаться на случай наступления убытка y будет означать следующее.
Во-первых, богатство уменьшится на величину уплаченной страховой премии Π и составит (x0 - Π).
Во-вторых, даже если риск реализуется, и произойдет убыток, страховая компания его полностью возместит. То есть конечное богатство при наступлении убытка не изменится и составит по-прежнему (x0 - Π). Таким образом, ситуация перестает быть рискованной.
Итак, у ЛПР есть две альтернативы:
Альтернатива А: с вероятностью р потерять часть богатства y или с вероятностью (1 - p) не потерять ничего (это первоначальная ситуация без страхования), и
Альтернатива В: гарантированно потерять часть богатства Π такую, что Π < y, но избавиться от
Альтернатива В: гарантированно потерять часть богатства Π такую, что Π < y, но избавиться от
Для конкретного человека и заданной рисковой ситуации выбор наилучшей альтернативы зависит от величины страховой премии Π. Если страховая компания запросит слишком большую плату, то даже очень осторожный человек может предпочесть не страховаться. Однако, как правило, страховая премия Π настолько меньше возможного убытка y, что данная альтернатива выглядит предпочтительней.
Какую же сумму Π готов заплатить ЛПР, чтобы избавится от риска?
В рамках рассматриваемой теории страхование с премией Π будет выгодным, если ожидаемая полезность альтернативы B со страхованием будет выше ожидаемой полезности варианта А без страхования:
MuB > MuА
Граничным случаем, когда обе альтернативы эквивалентны, является равенство их ожидаемых полезностей:
MuB =
Граничным случаем, когда обе альтернативы эквивалентны, является равенство их ожидаемых полезностей:
MuB =
Ожидаемая полезность альтернативы А (без страхования) составляет:
Ожидаемая полезность альтернативы В (со страхованием) равна полезности конечного богатства после уплаты страховой премии Π, поскольку эта величина является детерминированной и не изменится, даже если убыток реализуется:
MuB = u(x0 - Π)
Предельная страховая премия, которую готов заплатить ЛПР, может быть найдена из равенства ожидаемых полезностей этих двух альтернатив:
u(x0 - Π ) = p u(x0 - y) + (1-p) u(x0)
Используя понятие, введенное нами в предыдущем параграфе, можно сказать, что сумма (x0 - Π) является детерминированным эквивалентом рискованной альтернативы
На графике полезности этот детерминированный эквивалент находится как абсцисса точки пересечения
На графике полезности этот детерминированный эквивалент находится как абсцисса точки пересечения
Рис.4.7. Максимальная страховая премия Π.
Если запрашиваемая страховой компанией плата будет равна максимальной премии Π, то тогда обе альтернативы (страховать или не страховать) являются эквивалентными. Если же стоимость страхования меньше, то альтернатива В будет более предпочтительной.
Размер максимальной страховой премии может служить мерой неприятия риска, поскольку, чем выше эта
Размер максимальной страховой премии может служить мерой неприятия риска, поскольку, чем выше эта
Рис.4.8. Структура максимальной страховой премии. Рисковая премия π.
Объективная составляющая, равная ожидаемому убытку MY, представляет собой "чистую" цену риска. Она
Объективная составляющая, равная ожидаемому убытку MY, представляет собой "чистую" цену риска. Она
Субъективная составляющая, напротив, зависит не только от объективных параметров риска, но и субъективного отношения ЛПР к риску, которое определяет форму функции полезности. Эту составляющую π называют "премия за риск" (risk premium) или "премия за безопасность" (safety premium). От чего же зависит ее величина? Во-первых, премия за риск зависит от размеров начального богатства. Еще Бернулли предположил, что полезность изменяется пропорционально относительному, а не абсолютному приращению капитала. Если это допущение справедливо, то, чем больше начальное богатство х0, тем слабее влияет убыток y на изменение ожидаемой полезности. Значит, рисковая премия π для больших уровней богатства будет ниже, чем для маленьких.
Во-вторых, рисковая премия зависит от разброса убытка относительно ожидаемого значения. Это
Во-вторых, рисковая премия зависит от разброса убытка относительно ожидаемого значения. Это
Эту идею можно подтвердить и в рамках используемой нами упрощенной модели. Разброс случайной величины характеризуется дисперсией DY или среднеквадратическим отклонением σY. Дисперсия DY дискретного случайного убытка Y может быть найдена по общей формуле:
Как уже было показано:
MY = p y
Тогда,
DY = σY2 = p(1 - p)y2
Из полученной зависимости видно, что дисперсия простейшего чистого убытка DY тем выше, когда:
• возможный убыток у больше (тогда крайние исходы случайной величины разнесены на большее расстояние друг от друга), и
• вероятность убытка ближе к 50% (максимум выражения р(1 - р)достигается как раз при р = 0.5).
Проиллюстрируем это, сравнив два случайных убытка Y1 и Y2, предполагающих возможность наступления одинакового ущерба у с
Проиллюстрируем это, сравнив два случайных убытка Y1 и Y2, предполагающих возможность наступления одинакового ущерба у с
Рис.4.9. Влияние вероятности наступления убытка на величину рисковой премии.
Третий фактор, влияющий на величину рисковой премии - степень неприятия риска.
Третий фактор, влияющий на величину рисковой премии - степень неприятия риска.
Рис.4.10. Влияние кривизны графика функции полезности на величину рисковой премии.
Данный фактор является наиболее субъективным из всех рассмотренных. Именно он объясняет, почему два рискофоба, находясь в одинаковых
условиях, могут выбрать разные альтернативы. Просто один из них в большей степени не приемлет риск, чем второй. Поэтому у него выше готовность платить за риск (в частности, больше рисковая премия).
Использование теории ожидаемой полезности при принятии решений
4.6. Коэффициент неприятия риска
Зависимость степени
Использование теории ожидаемой полезности при принятии решений
4.6. Коэффициент неприятия риска
Зависимость степени
Как известно из курса математики, первая производная характеризует наклон касательной к графику функции. Знак второй производной определяет направление выпуклости графика - вверх или вниз.
Получается, что, зная первую и вторую производные функции полезности, можно сказать:
к какому типу относится ЛПР - рискофоб, рискофил или нейтрал;
насколько сильно он приемлет или не приемлет риск.
Опираясь на эти сведения можно построить относительный коэффициент для сравнения отношения к риску разных ЛПР. Он называется "коэффициент Эрроу-Пратта".
Существует два вида данного показателя: коэффициент абсолютного и относительного неприятия риска.
Существует два вида данного показателя: коэффициент абсолютного и относительного неприятия риска.
Коэффициент абсолютного неприятия риска RA может быть рассчитан по формуле:
Коэффициент относительного неприятия риска RR связан с абсолютным отношением: RR = RA x
4.8. Функция полезности, приближенная к реальной
На практике люди не обязательно следуют
4.8. Функция полезности, приближенная к реальной
На практике люди не обязательно следуют
Рис.4.12. Примерный вид функции полезности реального ЛПР.
На представленном на рис.4.12 графике можно
Рис.4.12. Примерный вид функции полезности реального ЛПР.
На представленном на рис.4.12 графике можно
Рассмотрим сначала область выигрышей (х > 0). На первом интервале (область 1), пока возможная прибыль относительно невелика, люди могут вести себя как нейтралы или даже рискофилы, готовые рискнуть, чтобы получить чуть больше, чем есть.
Однако по мере роста возможных выигрышей и гарантированных альтернатив (область 2) все сильнее
Однако по мере роста возможных выигрышей и гарантированных альтернатив (область 2) все сильнее
Теперь посмотрим на область потерь (х < 0). Во-первых, исследования показывают, что реальный человек более чувствителен к потерям, чем к выигрышам. Этот эффект называют "неприятие потерь" ("loss aversion"). Он проявляется на всей области убытков, но в большей степени характерен для относительно небольших и средних значений (область 4). Однако по мере роста убытков, люди становятся все менее чувствительны к потере еще одного рубля. То есть в области больших убытков (область 5) имеет место такое же "насыщение", которое наблюдалось в районе значительных богатств, только с обратным знаком. Благодаря такому "отзеркаливанию" отношения к большим суммам, данный феномен получил название "эффект отражения" ("reflection effect").
Безусловно, исследования, проведенные на достаточно больших группах людей, могут помочь составить
Безусловно, исследования, проведенные на достаточно больших группах людей, могут помочь составить
Например, если руководитель вынужден принимать решение, которое должно удовлетворить определенного "внешнего пользователя" (например, владельца бизнеса), то ему необходимо иметь представление не об усредненной функции полезности, а о функции полезности именно этого конкретного человека! ЛПР должен знать, какие убытки тот считает недопустимыми, ради каких гарантированных выгод тот может отказаться от рискованного проекта, сулящего большую прибыль, и т.д. Только тогда принимаемые ЛПР решения будут адекватно оценены этим внешним пользователем. Разумеется, построение точной функции полезности другого лица в подобных условиях практически невозможно. Чаще всего приходится ориентироваться на интуитивное понимание ситуации и схожесть в оценке рисков владельца бизнеса и назначенных им руководителей.
Тем не менее, проблемы с построением функции полезности и с использованием
Тем не менее, проблемы с построением функции полезности и с использованием
Отмеченные в настоящем параграфе феномены не единственные. Существуют и другие. В частности, исследователи столкнулись с так называемым "эффектом представления ("framing effect"). Он проявляется в том, что ответы на вопросы анкет значимым образом зависят от формулировки вопроса. При одинаковых объективных (численных) исходных данных, но описанных различными способами, одни и те же люди принимали разные решения. Это говорит не только о трудности сопоставления полученных результатов, но и о том, что на процесс принятия решения в условиях риска влияют всевозможные трудно поддающиеся формализации факторы. Психологи выделяют целый ряд обстоятельств, которые искажают восприятие рисковой ситуации человеком, что влечет за собой возможность принятия им решений, не поддающих корректному описанию с помощью формальной теории.
ФУНКЦИЯ ПОЛЕЗНОСТИ
НЕЙМАНА - МОРГЕНШТЕРНА
ФУНКЦИЯ ПОЛЕЗНОСТИ
НЕЙМАНА - МОРГЕНШТЕРНА
Обоснование выбора решения в предыдущем раздее выполнялось с позиций объективиста. Если
Обоснование выбора решения в предыдущем раздее выполнялось с позиций объективиста. Если
Поясним смысл этой величины.
Рассмотрим ситуацию, когда игрок с вероятностью 0,8 выигрывает 40 дол. и с вероятностью 0,2 проигрывает 20 дол.
Выясним, за какую сумму ЛПР уступит свое право участвовать в игре.
Как отмечалось, объективист пользуется правилом:
БДЭ = ОДО = 0,8 • 40 + 0,2(-20) = 28 дол.
Поэтому свое право на игру он уступит не менее чем за 28 дол.
Субъективист, как правило, готов уступить свое право на игру за меньшую сумму, поскольку для него БДЭ < ОДО.
Причинами такого поведения могут быть:
финансовое состояние игрока (возможно, он на грани банкротства и ему необходимы денежные средства);
отношение игрока к риску вообще (несклонность к риску);
настроение или состояние здоровья игрока;
множество других, даже непосредственно не относящихся к бизнесу, причин.
ФУНКЦИЯ ПОЛЕЗНОСТИ
НЕЙМАНА - МОРГЕНШТЕРНА
Величина БДЭ может изменяться со временем в зависимости от
обусловленных указанными причинами
Величина БДЭ может изменяться со временем в зависимости от обусловленных указанными причинами
Исследуем реалистичность критерия выбора решения, основанного на расчете ОДО.
Рассмотрим две альтернативы:
выигрыш 1 000 000 дол. с вероятностью 1;
игра (лотерея): выигрыш 2 100 000 дол. с вероятностью 0,5 и проигрыш 50 000 дол. с вероятностью 0,5.
В этом случае
ОДО = 0,5 • 2 100 000 - 0,5 • 50 000 = 1 025 000 дол.
Относительно получаемого среднего выигрыша указанные альтернативы практически эквивалентны, и если игрок безразличен к риску, он выберет вторую альтернативу. Если он к риску небезразличен, а подавляющее число людей именно таковыми являются, то выбор будет зависеть главным образом от финансового состояния игрока.
Игроки, имеющие скромный денежный доход, предпочтут не рисковать и выберут гарантированный выигрыш.
Для ЛПР, обладающего достаточно крупным капиталом, проигрыш в 50 ООО дол. невелик, и он предпочтет рискнуть. Рисковать будут также игроки, патологически склонные к финансовым авантюрам.
Методология рационального принятия решений в условиях неопределенности, основанная на функции полезности
Методология рационального принятия решений в условиях неопределенности, основанная на функции полезности
Для компактного изложения аксиом нам потребуется следующее определение.
Определение 4.1. Предположим, что конструируется игра, в ко- торой индивид с вероятностью α получает денежную сумму x и с вероятностью (1 - α) - сумму z. Эту ситуацию будем обозначать G(x, z: α).
Аксиома I. Аксиома сравнимости (полноты). Для всего множества S неопределенных альтернатив (возможных исходов) индивид может сказать, что либо исход х предпочтительнее исхода у (х >у), либо у > х, либо индивид безразличен в отношении к выбору между х и у (х ~ у). Запись х ≥ у означает, что исход х предпочтительнее исхода у либо индивид безразличен в отношении к выбору между х и у.
Аксиома 2. Аксиома транзитивности (состоятельности). Если
х > у и у >
Аксиома 2. Аксиома транзитивности (состоятельности). Если х > у и у >
Аксиома 3. Аксиома сильной независимости. Предположим, что мы конструируем игру, в которой индивид с вероятностью α полу- чает денежную сумму х и с вероятностью (1 - α) - сумму z, т.е. G(x, z: α). Сильная независимость означает, что если индивид без- различен в отношении к выбору между х и у (х ~ у), то он также будет безразличен в отношении к выбору между игрой (лотереей) G(x, z: а) и игрой G(y, z: а ), т.е. из х ~ у следует G(x, z: ос) ~ G(y, z: а).
Аксиома 4. Аксиома измеримости. Если х > у ~ z или х ~у > z, то существует единственная вероятность а такая, что у ~ G(x, z: а).
Поясним смысл этой аксиомы. Пусть, например, имеем три ис- хода: х = 1000; у = 0; z означает смерть игрока. Исходя из здравого смысла смерть нельзя сравнивать ни с каким выигрышем и соответ- ствующего этому исходу значения вероятности а существовать не может. Однако в жизни бывают ситуации, когда некий проигрыш равнозначен смерти. Тогда утверждение у ~ G{x, z: а ) можно счи- тать справедливым для некоторого значения О ≤α ≤ 1.
Аксиома 5. Аксиома ранжирования. Если альтернативы у и и находятся по
Аксиома 5. Аксиома ранжирования. Если альтернативы у и и находятся по
то при α1> α2 у >и.
Поясним смысл этой аксиомы. Пусть существуют следующие альтернативы: х = 1000; у = 500; и = 200, z = -10. Пусть эквивалентны две пары ситуаций, одна из которых неигровая, а другая игровая:
1) гарантированно получить 500 или игра: с вероятностью α1выиграть 1000 и с вероятностью (1-α1) проиграть 10, т.е. 500~G(1000,-10: α1);
2) гарантированно получить 200 или игра: с вероятностью α2 выиграть 1000 и с вероятностью (1-α2) проиграть 10, т.е. 200~G(1000,-10: α2).
Очевидно, что при указанных условиях α1> α2. Если α1= α2 то у~ и. : Утверждение аксиомы вполне соответствует здравому смыслу: чем больше вероятность крупного выигрыша, тем больше игра «стоит», т.е. тем большая плата потребуется за приобретение права в ней участвовать.
Если принять приведенные аксиомы и предположить, что люди предпочитают большее количество некоторого блага меньшему, то все это в совокупности определяет рациональное поведение ЛПР.
При названных предположениях американскими учеными Дж. Нейманом и О. Моргенштерном было показано, что ЛПР при принятии решения будет стремиться к максимизации ожидаемой полезности
Другими словами, из всех возможных решений он выберет то, которое обеспечивает
Другими словами, из всех возможных решений он выберет то, которое обеспечивает
Сформулируем определение полезности по Нейману-Моргенштерну.
Определение 4.2. Полезность - это некоторое число, приписываемое лицом, принимающим решение, каждому возможному исходу. Функция полезности Неймана - Моргенштерна для ЛПР показывает полезность, которую он приписывает каждому возможному исходу. У каждого ЛПР своя функция полезности, которая показывает его предпочтение к тем или иным исходам в зависимости от его отношения к риску.
Определение 4.3. Ожидаемая полезность события равна сумме произведений вероятностей исходов на значения полезностей этих исходов.
Проиллюстрируем практическую реализацию введенных понятий на примере расчета ОДО и сопоставления этого значения с полезностью.
Задача . Нефтеперерабатывающая фирма решает вопрос о
бурении скважины. Известно, что если
Задача . Нефтеперерабатывающая фирма решает вопрос о бурении скважины. Известно, что если
Нетрудно рассчитать ожидаемое значение выигрыша:
ОДО = 0,6(-50 000) + 0,1(-20 000)
Нетрудно рассчитать ожидаемое значение выигрыша:
ОДО = 0,6(-50 000) + 0,1(-20 000)
+0,05930 000 = 62 000 дол.
Если ЛПР, представляющий фирму, безразличен к риску и принимает решение о проведении буровых работ на основании рассчитанного ОДО, то он воспринимает ожидаемую полезность как пропорциональную ОДО, полагая
U = 62.
Учитывая, что U - индивидуальное число, характеризующее ЛПР, нули, отвечающие расчету ОДО, можно отбросить. В этом случае функция полезности U(v), где v - прибыль, получаемая при различных исходах, является прямой с положительным наклоном. Можно показать , что U может быть задана с точностью до некоторого монотонного преобразования.
Для принятия решения в случае небезразличия ЛПР к риску необходимо уметь
Для принятия решения в случае небезразличия ЛПР к риску необходимо уметь
Дж. Нейман и О. Моргенштерн предложили процедуру построения индивидуальной функции полезности, которая (процедура) заключается в следующем: ЛПР отвечает на ряд вопросов, обнаруживая при этом свои индивидуальные предпочтения, учитывающие его отношение к риску. Значения полезностей могут быть найдены за два шага.
Шаг 1. Присваиваются произвольные значения полезностей выигрышам для худшего и лучшего исходов, причем первой вели- чине (худший исход) ставится в соответствие меньшее число. Например, для приведенной выше задачи U(-50 000 дол.) = 0, а U(930 000 дол.) = 50. Тогда полезности промежуточных выигры- шей будут находиться в интервале от 0 до 50. Полезность исхода даже для одного индивида определяется не однозначно, а с точно- стью до монотонного преобразования. Пусть, например, имеем х1 хг, хп - полезности, приписываемые п ожидаемым значениям вы- игрышей. Тогда
α+βx1 α+β2,а+βхп (где β > 0)
также будут полезностями. Если в задаче 4.1 при расчете полезности отбросить последние нули, это будет эквивалентно линейному преобразованию функции полезности при α= 0 и β = 0,001.
Шаг 2. Игроку предлагается на выбор: получить некоторую
гарантированную денежную сумму v,
Шаг 2. Игроку предлагается на выбор: получить некоторую гарантированную денежную сумму v,
U(v) = p0U(S) + (1-po)U(s). (4.1)
Рассчитаем полезность результатов любого из возможных исходов для задачи 4.1.
Пусть для ЛПР безразлично, потерять 20 ООО дол. или принять участие в игре (выигрыш 930 ООО дол. с вероятностью 0,1 или проигрыш 50 ООО дол. с вероятностью 0,9). Согласно формуле (4.1) имеем:
U(-20) = 0,1 1/(930) + 0,9 t7(-50) = 5,
при этом по определению принято, что U(—50) = 0, U(930) = 50, откуда следует, что U(-20) = 5.
Таким образом, если определена шкала измерения, то может быть построена функция полезности ЛПР (рис. 4.2).
В общем случае график функции полезности может быть трех типов :
для
В общем случае график функции полезности может быть трех типов :
для
для ЛПР, безразличного к риску, - прямая линия (рис. б);
для ЛПР, склонного к риску, - строго вогнутая функция, у которой каждая дуга кривой лежит ниже своей хорды (рис. в).
Измерение отношения к риску
Исследуем график функции полезности, представленной на рис.
Для
Измерение отношения к риску
Исследуем график функции полезности, представленной на рис. Для
Формально мы имеем график выпуклой функции, о которой известно, что ордината любой точки кривой больше ординаты точки хорды кривой. Определим соотношение, характеризующее ЛПР, несклонное к риску. Нетрудно видеть, что:
U(М1) - значение полезности в точке А; U(М2) - значение полезности в точке В;
U(pМ1 + (1-р)М2) - значение полезности в точке С.
Уравнение хорды АВ имеет вид U1 = а + bМ,
где U1 - совокупность точек, лежащих на отрезке прямой.
Найдем значения параметров аиb уравнения прямой.
В точке А имеем U(M1) =
Найдем значения параметров аиb уравнения прямой. В точке А имеем U(M1) =
Вычитаем из первого выражения второе, исключая величину U(М1)-U(М2) = b(М1-М2),
откуда получаем:
После подстановки значений для параметров а и b уравнение хорды АВ имеет вид:
где М1 ≤ М ≤М2.
Пусть М=рМ1 + (1-р)М2, где 0 <р < 1, тогда в
Пусть М=рМ1 + (1-р)М2, где 0 <р < 1, тогда в
U(pM1 + (l-p)M2) > а + b(рМ1+ (1-р)М2).
Подставив в это неравенство вычисленные значения а и b, получим:
U(рМ1 + (1 -p)М2) > рU(М1) + (1 -р)U(М2).
(4.2)
Неравенство (4.2) характерно для функций полезности ЛПР, не склонных к риску. Оно действительно показывает, что полезность среднего выигрыша (полезность ОДО) больше ожидаемой полезности игры: с вероятностью р выиграть М1 и с вероятностью (1 - р) выиграть М2.
Аналогично можно показать, что для функций полезности ЛПР, склонных к риску, справедливо неравенство
U(рМ1 + (1 - р)М2) < р U(М1) + (1 - p)U(M2). (4.3)
Для функций полезности ЛПР, безразличных (нейтральных) к риску, имеет место равенство
U(рМ1 +(1-р)М2) = pU(М1) + (1- р)U(М2). (4.4)
Склонность или несклонность ЛПР к риску, как уже отмечалось, зависит от его финансового положения, текущей ситуации принятия решения и других факторов. Иначе говоря, эта характеристика ЛПР не является абсолютной, присущей ему при любых обстоятельствах.
Приведем пример игры, по отношению к которой любой игрок
не склонен к
Приведем пример игры, по отношению к которой любой игрок не склонен к
Петербургский парадокс (игра придумана петербургскими гусарами). Играют двое. Один бросает монету до тех пор, пока не выпадет «орел». Выигрыш равен (2)n руб., где п - число бросков до появления «орла». Ожидаемая величина выигрыша:
ОДО = 2(1/2) + (2)2(1/4) + (2)3(1/8) + ... = 1 + 1 + 1 + ... .
Вряд ли какой-либо игрок согласится заплатить за право участвовать в этой игре сумму, равную ОДО (эта сумма бесконечно велика).
Предположим, что имеет место игра (лотерея) с альтернативами a и b, т.е. G(a, в: α). Исследуем проблему, как целесообразнее по- ступить ЛПР: играть или получить гарантированный выигрыш, рав- ный ожидаемому выигрышу. Пусть функция полезности игрока определена как U(W) = ln(W), где W - величина благосостояния. Пусть игра заключается в выигрыше 5 дол. с вероятностью 0,8 и в выигрыше 30 дол. с вероятностью 0,2. Ожидаемая величина выиг- рыша (ОДО):
E(W) = 5 •*0,8 + 30 * 0,2 = 10 дол.
Для указанной логарифмической функции полезности имеем зависимость, выраженную в табл. 1.
W - величина благосостояния
Рассчитаем полезность ОДО для данной игры:
U(Е(W)) = U(10)
W - величина благосостояния
Рассчитаем полезность ОДО для данной игры:
U(Е(W)) = U(10)
т.е. полезность отказа от игры при получении гарантированного выигрыша, равного 10 дол. (ОДО данной игры), оценивается в 2,3 ютиля (условная единица полезности). Если ЛПР предпочтет игру, то
E(U(W)) = 0,8U(5) +0,2U(30)= 0,8 *1,61 + 0,2 * 3,40 = 1,97 ютиля.
Для рассмотренной логарифмической функции полезности боль- шей полезностью обладает вариант с получением гарантированного выигрыша, равного Е(W) = ОДО, а не участие в игре (2,3 > 1,97). Такое лицо, принимающее решение, не склонно к риску.
Выв од ы. Из соотношений (4.2) - (4.4) вытекает:
если U(E(W)) > E(U(W)\ игрок не склонен к риску;
если U(E(W)) =E(U(W)), игрок нейтрален (безразличен) к риску;
если U(E(W)) < E(U(W)), игрок склонен к риску.
Здесь Е и U - соответственно символы математического ожида-
ния и функции полезности.
Страхование от риска
Пусть по-прежнему полезность выражается логарифмической зависимостью
U(W) =
Страхование от риска
Пусть по-прежнему полезность выражается логарифмической зависимостью
U(W) =
Определим, какую максимальную сумму пожелает заплатить ЛПР, чтобы избежать игры, в которой с вероятностью 0,8 он выигрывает 5 дол. (уменьшение выигрыша на 5 дол. по сравнению с ОДО = 10 дол.) и с вероятностью 0,2 выигрывает 30 дол. (увеличение выигрыша на 20 дол. по сравнению с ОДО).
Значение ожидаемой полезности игры составляет 1,97 ютиля, что соответствует гарантированному выигрышу 7,17 дол. (1n7,17 = 1,97). С другой стороны, сумма ожидаемого выигрыша в случае игры (ОДО) равна 10 дол. Поэтому, чтобы избежать игры, ЛПР согласится заплатить максимальную сумму, равную
10-7,17 = 2,83 дол.
Из этого следует, что, если ЛПР предлагают застраховаться от игры и просят за это сумму, меньшую, чем 2,83 дол., ему выгодно принять предложение. В данном случае величина, равная 2,83 дол. премия (максимальная плата) за риск.
Рассмотрим некоторые приложения теории полезности.
Задача 4.2. Оптимальная величина страхования. Ювелир владеет
бриллиантом стоимостью 100 000 дол.
Задача 4.2. Оптимальная величина страхования. Ювелир владеет бриллиантом стоимостью 100 000 дол.
пoлезности, он сможет рассчитать, на какую оптимальную сумму следует застраховать дорогую вещь.
Ювелир может оказаться в одной из двух ситуаций:
1) бриллиант украден;
Ювелир может оказаться в одной из двух ситуаций:
1) бриллиант украден;
2) бриллиант не украден.
Чем больше сумма страхования, тем больше его состояние (капитал), если бриллиант украден, но тем меньше его состояние, если бриллиант не украден.
Например, если бриллиант застрахован на 50 ООО дол., имеют место два случая.
1. Бриллиант украден. При этом потери ювелира рассчитываются следующим образом:
-100 ООО (бриллиант) - 10 ООО (страховка) + 50 000 (компенсация) = -60 000 дол., а капитал 50 000 - 10 000 = 40 000 дол.
2. Бриллиант не украден. В этом случае капитал ювелира составит:
100 000 (бриллиант) - 10 000 (страховка) = 90 000 дол.
Если бриллиант застрахован на 100 000 дол., то в случае его кражи капитал составит 100 000 - 20 000 = 80 000 дол.;
Если бриллиант не украден, капитал также составит 80 000 дол.
Обозначим капитал ювелира в случае, если бриллиант не украден, через Yn:
Уn =100000-0,2K, (4.5)
где К - сумма страхования.
Если бриллиант украден, то капитал ювелира определим как Y,:
Yt=0,8K.
Предположим, что можно экспертно определить вероятность р того, что бриллиант будет
Предположим, что можно экспертно определить вероятность р того, что бриллиант будет
Ожидаемая полезность U «игры» (с вероятностью р бриллиант украден и с вероятностью (1 -р) - не украден) определяется согласно формуле (4.1) выражением
U = pU(Yt) + {l-p)U(Yn).
Значения Y, и Yn следует выбирать таким образом, чтобы ожидаемая полезность была максимальной, т.е.
рU(Yt)+(1-p)U(Yn)→max.
Пусть точка касания кривой безразличия (линия одинаковой по- лезности) соответствует Уn = 86 000 дол., Yt= 56 000 дол.
Тогда согласно формуле Уn =100000-0,2K имеем 86 000 = 100 000 - 0,2К, откуда оптимальная величина страхования К=70 000 дол.
График, отражающий бюджетное ограничение
О 80 000 86 000 100 000 У„
(К=100 ООО) (К=70 ООО) (К=0)
Метода Черчмена-Аккофа
Исходные положения оценки целей при использовании этого метода:
● каждой цели
Метода Черчмена-Аккофа
Исходные положения оценки целей при использовании этого метода:
● каждой цели
● если цель Цi важнее цели Цk, то Vi > Vk;
● если Цi и Цк, равноценны, то Vi = Vk;
● если Vi и Vk соответствуют целям Цi и Цк, то Vi + Vk соответствует
совокупности целей Цi + Цк;
●если Цi предпочтительнее Цк, а Цк предпочтительнее Цj - то совместный результат Цi и Цk, предпочтительнее Цj;
●значимость общего результат Цi и Цk эквивалента значимости общего результата Цк и Цi, т.е. порядок представления результатов или их группировки не влияют на предпочтения;
●если общий результат Цi и Цк эквивалентен Цк, то Vi = 0.
1. Имеется n целей: Ц1 Ц2...., Цn Эксперт определяет их относительную
важность
1. Имеется n целей: Ц1 Ц2...., Цn Эксперт определяет их относительную важность
2. Цели упорядочиваются в соответствии с их важностью в следующем порядке: Ц1 принимает максимальное значение, Цn принимает минимальное значение.
3. Каждой цели Цi приписывается Vi оценка следующим образом:
V1принимает максимальное значение (V1:=maxV):
i = 2 О < Vi < V1;
i = 3 О < Vi < V2;
i= (n-l), 0
Эксперт(ы) высказывают суждения относительно ценности тех или иных комбинаций результатов, при
Эксперт(ы) высказывают суждения относительно ценности тех или иных комбинаций результатов, при
Ц1 сравнивается последовательно с различными комбинациями оставшихся целей, например
Ц1<Ц2+Ц3+….+Цn, что означает предпочтительность Ц2+Ц3+….+Цn относительно Ц1,
Ц1< Ц3+….+Цn, что означает предпочтительность Ц3+….+Цn относительно Ц1.
Таких соотношений строится столько, сколько требуется для описания ситуации решения.
Обычно последним будет соотношение вида
Цn-2<Цn-1+Цn (Цn-2>Цn-1+Цn).
Задача состоит в том, чтобы скорректировать первоначальные оценки полезности альтернатив, так
Задача состоит в том, чтобы скорректировать первоначальные оценки полезности альтернатив, так
Обычно проверку начинают с последнего условия предпочтительности подставляя в него исходные значения полезностей соответствующих целей
Vn-2
Если не выполняется, то корректируют значение Vn-2 так, чтобы обеспечить выполнение проверяемого условия. Затем переходят к проверке следующего условия, подставляя в него в случае необходимости новое (скорректированное) значение Vn-2. Эта процедура выполняется до тех пор, пока не будет исчерпан весь список условий предпочтительности.
При этом если какое-то скорректированное значение полезности Vj участвовало в предыдущих условиях предпочтительности, то необходимо проверить их выполнение с новым значением Vj.
Если выполнение нарушается, то надо скорректировать еще раз значениеVj, при этом должно сохранится выполнение условия предпочтительности, из которого определялось Vj. Задача считается решенной, если для всех условий предпочтительности будут найдены удовлетворительные значения оценок полезностей альтернатив.
Очевидно, что существует угроза зацикливания алгоритма, которая может возникнуть из-за неудачного выбора первоначальных оценок, а также из-за структуры системы условий предпочтительности.
Рассмотрим пример [13]. У лица, отвечающего за распределение капиталовложений на некотором
Рассмотрим пример [13]. У лица, отвечающего за распределение капиталовложений на некотором
1) расширение отдела технического контроля (ОТК);
2) модернизация цехов;
3) переоборудование кухни;
4) строительство вычислительного центра;
5) расширение автопарка.
Одновременная реализация всех этих замыслов невозможна ввиду ограниченности средств, отпущенных на капитальное строительство. Возникает проблема, требующая выбора на основе решения. Каким мероприятиям отдать предпочтение? Какова степень их срочности? В каком порядке их надо осуществлять?
Итак, надо найти обоснованную последовательность, в которой очередность пяти предлагаемых к реализации мероприятий соответствовала бы их важности. Значит, следует найти и обосновать последовательность предлагаемых к реализации мероприятий, в которой проявлялась бы их относительная важность, причем эту важность нельзя установить, анализируя каждое предложение в отдельности.
Сначала ответственный за распределение капиталовложений приписывает каждому из предложений некоторое число
Сначала ответственный за распределение капиталовложений приписывает каждому из предложений некоторое число
После такой подготовки надо организовать оценочную группу, которая будет осуществлять поэтапное сравнение. В этот коллектив должны быть вовлечены не только авторы предложения, но и сотрудники, достаточно далекие от данной проблемы, способные, однако, высказать о ней компетентное суждение (речь идет главным образом о руководящих работниках), в противном случае существует опасность, что вся работа выродится в местническое «перетягивание каната».
Далее созданный коллектив должен обсудить 17 вопросо в- сравнений, представленных в
Далее созданный коллектив должен обсудить 17 вопросо в- сравнений, представленных в
1. Будет ли предложение (намерение, замысел, проект) А более важным, чем все остальные 4 предложения, вместе взятые? (Математический знак > здесь обозначает «важнее чем»,)
2. Будет ли предложение А более важным, чем предложения Б, В и Г, вместе взятые?
3. Будет ли предложение А более важным, чем предложения Б, В и Д, вместе взятые?
Принцип, на котором основана эта опросная схема, виден из табл. 15. Сначала сравнивают (сопоставляют) важнейшее (учитывая очередность поступления) предложение с суммой остальных предложений, причем в правой части неравенства
прежде записывают сумму всех остальных предложений, затем
все сочетания из трех предложений и наконец — из двух.
Отдельные предложения Б...Д с предложением А не сравниваются. Затем А исключается; в левую часть неравенства ставится предложение Б. Справа вначале записывают оставшиеся сочетания из трех предложений, а затем получающиеся из них группы из двух предложений. Далее исключают Б, и в левой части помещают В (вопрос 16), после чего и сравнивают его с парой
Г + Д. Заключает всю эту процедуру вопрос: сравнение Г и Д.
Недостаток этого способа:
используется только один критерий — важность. Однако в этом
Недостаток этого способа:
используется только один критерий — важность. Однако в этом
Предположим, что все члены коллектива были единодушны в ответах на вопросы,
Предположим, что все члены коллектива были единодушны в ответах на вопросы,
Таблица 16
Повторная проверка неравенств при новом значении А ( =85) показывает, что
Повторная проверка неравенств при новом значении А ( =85) показывает, что
Повторная проверка неравенств при новом значении Б (=95) показывает, что все суммы очков совпадают с ответами табл. 15. Можно продолжить поэтапное сравнение ответов на вопросы16,17
Поскольку на этом этапе произошло изменение Г, то надо повторить сначала. Оказывается, что при рассмотрении вопроса 11 отмечается еще одно изменение:
При этом новом значении А надо опять провести проверку всех вопросов. Поскольку на этот раз при всех 17 вопросах число очков согласуется с ответами в табл. 15, сравнение можно законченным.