Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 9 лет назад пользователемАнжела Лонгинова
1 Принятие решений в условиях неопределённости и риска Игры с природой. Принятие решений в условиях полной неопределенности Выполнил студент 245 гр. Пермяков Максим
2 Понятие игры с природой Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, в большинстве случаев называемый игроком 1. Игрок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные «ходы» партнёр по игре.
3 Понятие игры с природой Термин «природа» характеризует некую объективную действительность, которую не следует понимать буквально, хотя вполне могут встретится ситуации, в которых игроком 2 действительно может быть природа (например, обстоятельства, связанные с погодными условиями или с природными стихийными силами).
4 Пример: проблема заготовки угля на зиму Необходимо закупить уголь для обогрева дома. Количество хранимого угля ограничено и в течение холодного периода должно быть полностью израсходовано. Предполагается, что неизрасходованный зимой уголь в лето пропадает. Покупать уголь можно в любое время, однако летом он дешевле. Неопределённость состоит в том, что неизвестно, какой будет зима: суровой, тогда придётся докупать уголь, или мягкой, тогда часть угля может остаться неиспользованной.
5 Решение Матрица игры с природой аналогична матрице стратегической игры:, где - выигрыш игрока 1 при реализации его чистой стратегии i и чистой стратегии j игрока 2 (i=1,…m; j=1,…n).
6 Организация и аналитическое представление игры с природой Пусть игрок 1 имеет m возможных стратегий: A 1, A 2,…,A m, а у природы имеется n возможных состояний (стратегий): П 1,…,П n, тогда условия игры с природой задаются матрицей А выигрышей игрока 1:
7 Организация и аналитическое представление игры с природой Платит, естественно, не природа, а некая третья сторона (или совокупность сторон, влияющих на принятие решений игроком 1 и объединённых в понятие «природа»). Возможен и другой способ задания матрицы игры с природой: не в виде матрицы выигрышей, а в виде так называемой матрицы рисков или матрицы упущенных возможностей. Величина риска – это размер платы за отсутствие информации о состоянии среды.
8 Организация и аналитическое представление игры с природой Риском r ij игрока при использовании им стратегии A i и при состоянии среды П j будем называть разность между выигрышем, который игрок получил бы, если бы он знал, что состояние среды будет П j, и выигрышем, который игрок получит, не имея этой информации. Зная состояние природы (стратегию) П j, игрок выбирает ту стратегию, при которой его выигрыш максимальный, т. е. r ij =b j -a ij, где b j =max(a ij ) 1im при заданном j.
9 Пример матрицы рисков Для матрицы выигрышей b 1 =4, b 2 =8, b 3 =6, b 4 =9. Согласно введённым определённым r ij и b j получаем матрицу рисков
10 Принятие решений в условиях полной неопределённости Для определения наилучших решений используются следующие критерии: максимакса; Вальда; Сэвиджа; Гурвица; Байеса-Лапласа.
11 Критерий максимакса С его помощью определяется стратегия, максимизирующая максимальные выигрыши для каждого состояния природы. Это критерий крайнего оптимизма. Наилучшим признаётся решение, при котором достигается максимальный выигрыш, равный M=max(a ij ) 1im, 1jn. Для матрицы А из предыдущего примера наилучшим решением будет А1, при котором достигается максимальный выигрыш – 9.
12 Максиминный критерий Вальда С позиции данного критерия природа рассматривается как агрессивно настроенный и сознательно действующий противник типа тех, которые противодействуют в стратегических играх. Выбирается решение, для которого достигается значение W=max min(a ij ) 1im, 1jn.
13 Максиминный критерий Вальда Для платёжной матрицы А нетрудно рассчитать: для 1-й стратегии (i=1) min(a ij )=1 по 1j4; для 2-й стратегии (i=2) min(a ij )=3 по 1j4; для 3-й стратегии (i=3) min(a ij )=2 по 1j4. Тогда W=max min(a ij )=3 по 1i3, 1j4, что соответствует второй стратегии A 2 игрока 1. В соответствии с критерием Вальда из всех самых неудачных результатов выбирается лучший (W=3). Это перестраховочная позиция крайнего пессимизма.
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.