Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 9 лет назад пользователемЛюдмила Телепнева
1 Функция полезности Неймана-Моргенштерна Студенты 245 группы Загляда В.А. Захаров Д.
2 Основные определения и аксиомы Определение 1. Предположим, что конструируется игра, в которой индивид с вероятностью α получает денежную сумму х и с вероятностью (1 - α) - сумму z. Эту ситуацию будем обозначать G(x, z: α). Аксиома 1. Аксиома сравнимости (полноты). Для всего множества S неопределенных альтернатив (возможных исходов) индивид может сказать, что либо исход х предпочтительнее исхода у (х > у), либо у > х, либо индивид безразличен в отношении к выбору между х и у (х ~ у). Запись х > у означает, что исход х предпочтительнее исхода у либо индивид безразличен в отношении к выбору между х и у. Аксиома 2. Аксиома транзитивности (состоятельности). Если х > у и у > z, то х > z. Если х ~ у и у ~ z, то х ~ z. Аксиома 3. Аксиома сильной независимости. Предположим, что мы конструируем игру, в которой индивид с вероятностью α получает денежную сумму х и с вероятностью (1 - α) - сумму z, т.е. G(x, z: α). Сильная независимость означает, что если индивид безразличен в отношении к выбору между х и у (х ~ у), то он также будет безразличен в отношении к выбору между игрой (лотереей) G(x, z: α) и игрой G(y, z: α), т.е. из х ~ у следует G(x, z: α) ~ G(y, z: α). Аксиома 4. Аксиома измеримости. Если х > у ~ z или х ~ у > z, то существует единственная вероятность α такая, что у ~ G(x, z: α). Пусть, например, имеем три исхода: х = 1000; у = 0; z означает смерть игрока. Исходя из здравого смысла смерть нельзя сравнивать ни с каким выигрышем и соответствующего этому исходу значения вероятности a существовать не может. Однако в жизни бывают ситуации, когда некий проигрыш равнозначен смерти. Тогда утверждение у ~ G(y, z: α) можно считать справедливым для некоторого значения 0 α 1.
3 Аксиома 5. Аксиома ранжирования. Если альтернативы у и u находятся по предпочтительности между альтернативами х и z и можно построить игры такие, что индивид безразличен в отношении к выбору между у и G(x, z: α 1 ), а также к выбору между u и G(x, z: α 2 ), то при α 1 > α 2 у > и. Пусть существуют следующие альтернативы: х = 1000; у = 500; u= 200, z = -10. И пусть эквивалентны две пары ситуаций, одна из которых неигровая, а другая игровая: 1) гарантированно получить 500 или игра: с вероятностью α 1 выиграть 1000 и с вероятностью (1- α 1 ) проиграть 10, т.е. 500 ~ G(1000, -10: α 1 ); 2) гарантированно получить 200 или игра: с вероятностью а 2 выиграть 1000 и с вероятностью (1-а 2 ) проиграть 10, т.е. 200 ~ G( 1000,- 10: α 2 ). Очевидно, что при указанных условиях α 1 > α 2. Если α 1 = α 2, то у > и. Утверждение аксиомы вполне соответствует здравому смыслу: чем больше вероятность крупного выигрыша, тем больше игра «стоит», т.е. тем большая плата потребуется за приобретение права в ней участвовать. Если принять приведенные аксиомы и предположить, что люди предпочитают большее количество некоторого блага меньшему, то все это в совокупности определяет рациональное поведение ЛПР.
4 При названных предположениях американскими учеными Дж. Нейманом и О. Моргенштерном было показано, что ЛПР при принятии решения будет стремиться к максимизации ожидаемой полезности. Другими словами, из всех возможных решений он выберет то, которое обеспечивает наибольшую ожидаемую полезность. Определение полезности по Нейману-Моргенштерну: Полезность - это некоторое число, приписываемое лицом, принимающим решение, каждому возможному исходу. Функция полезности Неймана - Моргенштерна для ЛПР показывает полезность, которую он приписывает каждому возможному исходу. У каждого ЛПР своя функция полезности, которая показывает его предпочтение к тем или иным исходам в зависимости от его отношения к риску. Определение 2. Ожидаемая полезность события равна сумме произведений вероятностей исходов на значения полезностей этих исходов.
5 Задача 1. Нефтеперерабатывающая фирма решает вопрос о бурении скважины. Дерево решений данной задачи представлено на рисунке. Ожидаемое значение выигрыша: ОДО = 0,6x( ) + 0,1x( ) + 0,15x ,lx ,05 x =62000 дол. Если ЛПР, представляющий фирму, безразличен к риску и принимает решение о проведении буровых работ на основании рассчитанного ОДО, то он воспринимает ожидаемую полезность как пропорциональную ОДО, полагая U = 62. Учитывая, что U - индивидуальное число, характеризующее ЛПР, нули, отвечающие расчету ОДО, можно отбросить. В этом случае функция полезности U(v), где v прибыль, получаемая при различных исходах, является прямой с положительным наклоном. U можно задавать с точностью до некоторого монотонного преобразования.
6 Дж. Нейман и О. Моргенштерн предложили процедуру построения индивидуальной функции полезности: ЛПР отвечает на ряд вопросов, обнаруживая при этом свои индивидуальные предпочтения, учитывающие его отношение к риску. Значения полезностей могут быть найдены за два шага. Шаг 1. Присваиваются произвольные значения выигрышам для худшего и лучшего исходов, причем первой величине (худший исход) ставится в соответствие меньшее число. Например, для приведенной выше задачи U( дол.) = 0, а U( дол.) = 50. Тогда полезности промежуточных выигрышей будут находиться в интервале от 0 до 50. Полезность исхода даже для одного индивида определяется не однозначно, а с точностью до монотонного преобразования. Пусть, например, имеем x 1, x 2,…, x n - полезности, приписываемые n ожидаемым значениям выигрышей. Тогда α +βx 1,α +β x 2,…, α +β x n (где β>0 ) также будут полезностями. Если в нашей задаче при расчете полезности отбросить нули, это будет эквивалентно линейному преобразованию функции полезности при α=0 и β=0,001. Шаг 2. Игроку предлагается на выбор: получить некоторую гарантированную денежную сумму v, находящуюся между лучшим и худшим значениями S и s, либо принять участие в игре, т.е. получить с вероятностью p наибольшую денежную сумму S и с вероятностью (1-p) – наименьшую сумму s. При этом вероятность нужно изменять до тех пор, пока ЛПР станет безразличным в отношении к выбору между получением гарантированной суммы и игрой.
7 Пусть указанное значение вероятности равно p 0. Тогда полезность гарантированной суммы определяется как среднее значение полезностей наименьшей и наибольшей сумм., т.е. U(v)= p 0 U(S)+(1- p 0 ) U(s) (1) Рассчитаем полезность результатов любого из возможных исходов для нашей задачи. Пусть для ЛПР безразлично, потерять дол. Или принять участие в игре (выигрыш дол. с вероятностью 0.1 или проигрыш дол. с вероятностью 0.9). Согласно формуле (1) имеем: U(-20)= 0.1U(930)+0.9 U(-50)=5, при этом по определению принято, что U(-50)=0, U(930)=50, откуда следует, что U(-20)=5. Таким образом может быть построена функция полезности ЛПР:
8 В общем случае график функции полезности может быть трех типов: для ЛПР, не склонного к риску,- строго вогнутая функция, у которой каждая дуга лежит выше своей хорды (рис.2 а); для ЛПР, безразличного к риску,- прямая линия (рис.2 б); для ЛПР, склонного к риску,- строго выпуклая функция, у которой каждая дуга лежит ниже своей хорды (рис.2 в); рис.2
9 Измерение отношения к риску Исследуем график функции полезности (рис.3). Для такого типа ЛПР полезность среднего выигрыша (полезность ОДО) больше ожидаемой полезности игры: с вероятностью p выиграть M 1 и с вероятностью (1-p) выиграть M 2. Формально мы имеем график вогнутой функции, о которой известно, что ордината любой точки кривой больше ординаты точки хорды кривой.
10 Определим соотношение, характеризующее ЛПР, не склонное к риску. U(M 1 )-значение полезности в точке A; U(M 2 )-значение полезности в точке B; U(pM 1 +(1-p) M 2 ) - значение полезности в точке C. Уравнение хорды AB имеет вид U 1 = a + bM, где U 1 - совокупность точек, лежащих на отрезке прямой. (2) U(pM 1 +(1-p) M 2 ) > pU(M 1 ) +(1-p)U(M 2 ) – неравенство характерно для функций полезности ЛПР, не склонных к риску. Оно действительно показывает, что полезность среднего выигрыша (полезность ОДО) больше ожидаемой полезности игры: с вероятностью p выигрывать M 1 и с вероятностью (1-p) выигрывать M 2. (3) U(pM 1 +(1-p) M 2 ) < pU(M 1 ) +(1-p)U(M 2 ) - неравенство характерно для функций полезности ЛПР, склонных к риску. (4) U(pM 1 +(1-p) M 2 ) < pU(M 1 ) +(1-p)U(M 2 ) - неравенство характерно для функций полезности ЛПР,,безразличных к риску. Склонность или несклонность ЛПР к риску зависит от его финансового положения, текущей ситуации принятия решения и других факторов. Иначе говоря, эта характеристика ЛПР не является абсолютной, присущей ему при любых обстоятельствах.
11 Предположим, что имеет место игра (лотерея), с альтернативами а и в, т.е. G(a, в: α). Исследуем проблему, как целесообразнее поступить ЛПР: играть или получить, гарантированный выигрыш, равный ожидаемому выигрышу. Пусть функция полезности игрока определена как U(W) = ln(W), где W - величина благосостояния, Пусть игра заключается в выигрыше 5 дол. с вероятностью 0,8 и в выигрыше 30 дол. с вероятностью 0,2. Ожидаемая величина выигрыша(ОДО): E(W) = 5x0,8 + 30x0,2 = 10 дол. Для указанной логарифмической функции полезности имеем зависимость, выраженную в таблице 1. Рассчитаем полезность ОДО для данной игры: U(E(W)) = U(10) = ln(10) = 2,3, т.е. полезность отказа от игры при получении гарантированного выигрыша, равного 10 дол. (ОДО данной игры), оценивается в 2,3 утиля (условная единица полезности). Если ЛПР предпочтет игру, то E(U(W)) = 0,8U(5) +0,2U(30)= 0,8 x1,61 + 0,2x3,40 = 1,97 утиля.
12 Для рассмотренной логарифмической функции полезности большей полезностью обладает вариант с получением гарантированного выигрыша, равного E(W) = ОДО, а не участие в игре (2,3 > 1,97). Такое лицо, принимающее решение, не склонно к риску. Выводы. Из соотношений (2) - (4) вытекает: если U(E(W)) > E(U(W)), игрок не склонен к риску; если U(E(W)) = E(U(W)), игрок нейтрален (безразличен) к риску; если U(E(W)) < E(U(W)), игрок склонен к риску. Здесь Е и U - соответственно символы математического ожидания и функции полезности.
13 Страхование от риска Пусть по-прежнему полезность выражается логарифмической зависимостью U(W) = ln(W) (см. табл.1). Определим, какую максимальную сумму пожелает заплатить ЛПР, чтобы избежать игры, в которой с вероятностью 0,8 он выигрывает 5 дол. (уменьшение выигрыша на 5 дол. по сравнению с ОДО = 10 дол.) и с вероятностью 0,2 выигрывает 30 дол. (увеличение выигрыша на 20 дол. по сравнению с ОДО). Значение ожидаемой полезности игры составляет 1,97 утиля, что соответствует гарантированному выигрышу 7,17 дол. (ln7,17 = 1,97). С другой стороны, сумма ожидаемого выигрыша в случае игры (ОДО) равна 10 дол. Поэтому, чтобы избежать игры, ЛПР согласится заплатить максимальную сумму, равную 10-7,17 = 2,83 дол. Из этого следует, что, если ЛПР предлагают застраховаться от игры и просят за это сумму, меньшую, чем 2,83 дол., ему выгодно принять предложение. В данном случае величина, равная 2,83 дол.,- премия (максимальная плата) за риск.
14 Задача 2. Оптимальная величина страхования. Ювелир владеет бриллиантом стоимостью дол. и желает застраховать его от кражи. Страховка покупается по правилу: цена страховки составляет 20% суммы, которую страхуют. Например, если бриллиант страхуется на всю стоимость ( дол.), страховка стоит дол., если на половину цены ( дол.), то страховка обходится в дол. Если ювелир будет знать (построит) свою функцию полезности, он сможет рассчитать, на какую оптимальную сумму следует застраховать дорогую вещь. Ювелир может оказаться в одной из двух ситуаций: 1) бриллиант украден; 2) бриллиант не украден. Чем больше сумма страхования, тем больше его состояние (капитал), если бриллиант украден, но тем меньше его состояние, если бриллиант не украден. Например, если бриллиант застрахован на дол., имеют место два случая. 1. Бриллиант украден. При этом потери ювелира рассчитываютcя следующим образом: (бриллиант) (страховка) (компенсация) = дол., а капитал = дол. 2. Бриллиант не украден. В этом случае капитал ювелира составит: (бриллиант) (страховка) = дол. Если бриллиант застрахован на дол., то в случае его кражи капитал составит : = дол.; Если бриллиант не украден, капитал также составит дол.
15 Обозначим капитал ювелира в случае, если бриллиант не украден, через Y n : Y n = ,2K, (5) где K-сумма страхования. Если бриллиант украден, то капитал ювелира определим как Y t : Y t =0,8 K. Соответствующий график, отражающий бюджетное ограничение, представлен на рис. 4.
16 Предположим, что можно экспертно определить вероятность р того, что бриллиант будет украден. Тогда полезность капитала Y t равна U(Y t ). Вероятность того, что бриллиант не украден, составляет (1 - р) и U(Y n ) - полезность капитала Y n в этом случае. Ожидаемая полезность U «игры» (с вероятностью р бриллиант украден и с вероятностью (1 - р) - не украден) определяется согласно формуле (1) выражением U= p U(Y t )+(1- p) U(Y n ). Значения Y t и Y n следует выбирать таким образом, чтобы ожидаемая полезность была максимальной, т.е. pU(Y t ) + (1-p)U(Y n )max. Пусть точка касания кривой безразличия (линия одинаковой полезности) на рис. 4 соответствует Y n = дол., Y t = дол. Тогда согласно формуле (5) имеем = – 0,2K, откуда оптимальная величина страхования K= дол.
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.