Стохастические игры Игры с «природой»
Основные определения К теории игр примыкает так называемая теория статистических решений. Зачастую принятие управленческих решений предполагает наличие ситуаций выбора наиболее выгодного варианта поведения из нескольких имеющихся вариантов в условиях неопределённости. В этом случае противником игрока (лица, принимающего решения – ЛПР) является некоторая объективная действительность, которую принято называть природой. Игра с природой (статистическая игра) – это парная матричная игра, в которой сознательный игрок А (статистик) выступает против участника, совершенно безразличного к результату игры, называемого природой.
Платежная матрица Объективно система (природа, окружающая среда) не заинтересована в проигрыше игрока. В процессе принятия решения о выборе варианта поведения игрок имеет информацию о том, что окружающая среда может принять одно из нескольких возможных состояний и сталкивается с неопределённостью относительно того конкретного состояния, которое примет окружающая среда в данный момент времени. S1S1 S2S2 …SnSn A1A1 а 11 а 12...а 1n A2A2 а 21 а 22...а 2n …... AnAn a m1 a m2...a mn В общем виде платёжная матрица статистической игры имеет вид: В данной игре строки матрицы (Ai ) - стратегии ЛПР, а столбцы матрицы (Sj) – состояния окружающей среды.
Исследование платежной матрицы Начинать анализ платежной матрицы следует с определения «заведомо невыгодных» стратегий игрока А (доминируемых), которые исключаются из платежной матрицы. Удалять доминируемые стратегии – состояния окружающей среды нельзя, т.к. они принципиально не могут быть выгодными или невыгодными. Нецелесообразно решать такую игру методами решения антагонистических игр, определяя смешанную стратегию игрока А. Здесь качественно другая ситуация. Поэтому решением является чистая стратегия игрока А, которая определяется с помощью критериев принятия решения.
Понятие риска Риском r ij игрока при выборе стратегии А i в условиях S j называется разность r ij = b j - a i, где b j - максимальный элемент в j - м столбце. Другими словами риск при выборе стратегии А i это проигрыш по сравнению с тем случаем, когда игрок знал бы условие при котором он может получить выигрыш b j.
Матрица риска Найдем матрицу риска R для следующей матрицы игры А.
Если известны вероятности состояний природы Предположим, что неопределенность состояний природы (доброкачественная ), то есть вероятности состояний p j известны, вычислим математическое ожидание выигрыша первого игрока, то есть выбрать стратегию удовлетворяющую условию (критерий Байеса) Следует отметить, что точно та же стратегия соответствует минимальному математическому ожиданию риска
Пример Пусть распределение вероятности состояний природы в последней задаче равны: – P(S 1 )=2/5; P(S 2 )=1/5; P(S 3 )=1/5; P(S 4 )=1/5; Тогда – a 1 = 13/5; a 2 = 69/5; a 3 = 13; – a = max (13/5, 69/5, 13) = 69/5 = 13,8. Следовательно оптимальной по этому критерию является стратегия А 2. Далее рассмотрим критерий минимального математического ожидания риска – r 1 = 78/5; r 2 = 22/5; r 3 = 26/5; – r = min (78/5, 22/5, 26/5) = 22/5 = 4,4.
Критерии принятия решений Критерий недостаточного основания Лапласа – максимальное среднее значение каждой строки. Критерий Вальда (максиминный) совпадает с крайне осторожной максиминной стратегией.
Критерии принятия решения Критерий минимального риска Севиджа рекомендует выбирать стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации Игрок, применяющий критерий Севиджа, также придерживается позиции пессимизма, ориентирующийся на минимально возможный риск Критерий Гурвица соответствует всем промежуточным стратегиям между пессимизмом и крайним оптимизмом. Выигрыш рассчитывается по формуле: где (0 1) - коэффициент пессимизма; чем больше игрок хочет подстраховаться тем большее значение он выбирает. При = 1 критерий Гурвица соответствует критерию крайнего пессимизма, критерию Вальда.
Задание Рассмотрим пример решения статистической игры в экономической задаче. Сельскохозяйственное предприятие может реализовать некоторую продукцию: – А1 – сразу после уборки; – А2 – в зимние месяцы; – А3 – в весенние месяцы. Прибыль зависит от цены реализации в данный период времени, затратами на хранение и возможных потерь. Размер прибыли, рассчитанный для разных состояний-соотношений дохода и издержек (S1, S2 и S3), в течение всего периода реализации, представлен в виде матрицы (млн. руб.) S1S2S3 A12-37 A254 A
Задание Решить игру, если неизвестны состояния природы. S1S1 S2S2 S3S3 A1A A2A A3A A4A