Задачи поддержки принятия решений (ЗПР) Задачи принятия решений – НПС 1. Детерминированные ЗПР2. ЗПР при неконтролируемых параметрах 2.1. Совпадающая информированность 2.2. Асимметрия информированности Задачи принятия решений – НПН Задачи принятия решений – НПС и НПН ЗПР для n ЛПР
Теоретико-игровые модели
3 Задачи поддержки принятия решений ЗПР в условиях определенности (1) ЗПР при неконтролируемых параметрах (2)
4 Задачи поддержки принятия решений Принцип осреднения параметров (3) Принцип гарантированного результата (4) Определение 1. Пусть, тогда вариационным расширением (ВР) задачи (2) будем называть следующую задачу (5)
5 Пример Игра «Государство-Предприниматели» Целевая функция центра: Целевая функция предпринимателей: x – предпринимательская прибыль ( 0 x x max ); k – доля прибыли, отчисляемая в качестве налогов ( 0 k 1 ); φ ( x,δ ) – предпринимательские риски.
6 Вариационное расширение: Пример
7 Пример игры 2-х лиц с совпадающими интересами при асимметрии информированности Целевая функция (6) при условиях (7)
8 Игры n лиц Определение 2. Ситуация является равновесной по Нэшу, если для всех справедливо неравенство: Предположим Тогда задача (6), (7) примет вид:
9 Задачи поддержки принятия решений при асимметрии информированности w=(w 1,w 2,…,w m ) – случайный вектор с функцией распределения Φ(w) множество I m ={1,2,…,m} – индексы компонент вектора w множество S i I m – совокупность индексов, определяющих информационную структуру i- ой решающей функции, i I n ={1,2,…,n} x=(x 1,x 2,…,x n ) – вектор управления, где x i =x i (d i ), d i =(w j ), j S i. Таким образом, задача примет вид: J i (x)=M[F i (x(w),w)]max, i I n (8) x i X i условие разной информированности приводит к отсутствию соответствующей переменной :
10 Вариационное расширение Целевая функция центра: Целевая функция предпринимателей: Цели игроков Максимизировать целевую функцию путем изменения ставки налога Максимизировать целевую функцию путем изменения совокупной активности Информационные гипотезы 1.Центр знает вероятностное распределение параметра δ, а предприниматели – его точное значение. 2.Компромисс центра и предпринимателей достигается в ситуациях равновесия по Штакельбергу. Решение при
11 Задачи поддержки принятия решений при асимметрии информированности Игра в нормальной форме: (9)
12 Необходимые условия оптимальности Функция Лагранжа: Уравнение Эйлера: Условие трансверсальности: (10)
13 Игра двух лиц при асимметрии информированности (11) (12)
14 Игра двух лиц при асимметрии информированности Утверждение 1 Пусть компоненты случайного вектора w есть независимые случайные величины, тогда равновесие по Нэшу задачи (12) при условиях (11), и a 11, b 22 0 достигается на линейных по своим переменным функциях и, где a 11 и b 22 элементы матриц A и B соответственно.
15 Игра двух лиц при асимметрии информированности (13)
16 Игра двух лиц при асимметрии информированности Утверждение 2 Решение задачи (12) при условиях (11), в концепции равновесия Нэша существует и единственно, если выполняются условия:
17 Задача стимулирования в активных системах Обозначим – действие i -го АЭ, – множество активных элементов. z = Q(y), где z –результат деятельности АЭ, входящих в систему. Пусть индивидуальные затраты i -го АЭ будут Функцию стимулирования для i -го АЭ обозначим тогда, целевая функция i -го АЭ примет вид: Целевая функция центра будет выражаться как разность между результатом деятельности системы и суммарными затратами на стимулирование:
Задача стимулирования в активных системах Ограничения а) функция непрерывна по всем переменным; б), не убывает по ; в) ; г) ; 3.Функции стимулирования кусочно-непрерывные и принимают неотрицательные значения. 4.Целевая функция центра непрерывна по всем переменным и достигает максимума при не нулевых действиях агентов.
Задача стимулирования в активных системах с разной информированностью АЭ Обозначим – действие i -го АЭ, – множество АЭ z = Q(u), где z –результат деятельности АЭ, входящих в систему. Пусть индивидуальные затраты i -го АЭ будут Для оценки затрат будем использовать усредненное значение: где – математическое ожидание. Функцию стимулирования для i -го АЭ обозначим тогда, целевая функция i -го АЭ примет вид: Целевая функция центра будет выражаться как разность между результатом деятельности системы и суммарными затратами на стимулирование:
Задача стимулирования в активных системах с разной информированностью АЭ Ограничения ,где 3.а) функция, является неубывающей по, если и выполнено неравенство ; б) затраты i -го АЭ не убывают по ; в) ; г) ; 3.Функционалы стимулирования кусочно-непрерывные и принимают неотрицательные значения. 4.Целевая функция центра непрерывна по всем переменным и достигает максимума при не нулевых действиях агентов.
Пусть ситуация равновесия в игре, тогда является ситуацией равновесия для игры
Задача стимулирования в случае квадратичной структуры Выпишем функции Лагранжа, : где – множители Лагранжа. Уравнение Эйлера: Условие трансверсальности: Отсюда система уравнений Эйлера путем несложных преобразований сводится к интегральному уравнению Фредгольма: где,,,,
Рассмотрим задачу стимулирования второго рода в АС с двумя АЭ, имеющими функции затрат: где – некоторый параметр, – оценка квалификации АЭ. Пусть функция дохода центра Фонд заработной платы ограничен величиной R (глобальное ограничение) Центр использует систему стимулирования: Задача центра сводится к поиску оптимальных реализуемых действий: Пример задачи стимулирования второго рода
Задачу (6) решим с помощью метода множителей Лагранжа. Выпишем функцию Лагранжа: где – множитель Лагранжа,. Необходимые условия: 1., решения не существует 2., решение существует и имеет вид: 3. и,решение будет следующим: Пример задачи стимулирования второго рода
Матрица вторых производных: Выпишем главные миноры матрицы : В обоих точках достигается максимум функции, найдем значения данной функции в точках (10) и (11) и сравним их: Абсолютный максимум достигается в первой точке. Пример задачи стимулирования второго рода
Рассмотрим задачу стимулирования второго рода в АС с двумя АЭ, имеющими функции затрат:, где – некоторый параметр, – оценка квалификации АЭ, Пусть функция дохода центра Фонд заработной платы ограничен величиной R (глобальное ограничение) Центр использует систему стимулирования: Задача центра сводится к поиску оптимальных реализуемых действий: Разная информированность АЭ: Пример задачи стимулирования второго рода при разной информированности активных элементов
Для решения задачи воспользуемся методом множителей Лагранжа: где – множитель Лагранжа,. Необходимые условия: Обозначим: Отсюда система () путем несложных преобразований сводится к интегральному уравнению: где,,, Пример задачи стимулирования второго рода при разной информированности активных элементов
Применим метод моментов для решения интегрального уравнения Фредгольма: Пусть в качестве линейно независимой системы возьмем следующую: Возьмем,, и отрезок. Рассмотрим систему ( i = 1,2,3 ), где,,. Откуда решение уравнения () имеет вид: