ТЕОРИЯ ИГР Литература 1.Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. – М., 1998. 2. Воробьев Н.Н. Теория игр для экономистов- кибернетиков. –

Презентация:



Advertisements
Похожие презентации
Теория игр Теория игр – это совокупность математических методов анализа и оценки конфликтных ситуаций. Задача теории игр состоит в выборе такой линии поведения.
Advertisements

Теория игр Теория игр изучает и рассматривает методы определения оптимального поведения при управлении системами, в которых характерно наличие конфликтной.
Нелинейное программирование Практическое занятие 6.
Игры в смешанных стратегиях. Моделирование конфликтных ситуаций в экономике Рассмотрим две игры в чистых стратегиях A i \B j B1B1B1B1 B2B2B2B2 B3B3B3B3.
Теория Риска. Стратегические игры Выполнил Ланге В.А. группа 245.
ТЕМА 7. Применение теории игр в экономико-математическом моделировании 7.1. Основные понятия теории игр Поиск решения в игре Игры с природой.
Моделирование конфликтных ситуаций в экономике Методы решения игровых задач.
Стохастические игры Игры с «природой». Основные определения К теории игр примыкает так называемая теория статистических решений. Зачастую принятие управленческих.
Элементы теории матричных игр. Определения процесс принятия решений в конфликтных ситуациях… игры 2 (парные) и n 3 лиц. участники игры - игроки. Игра.
Тема 7. Игровое моделирование стратегий управления и принятия решений Лекции Учебные вопросы: 1. Понятие игрового моделирования. 2. Решение игр.
Симплекс-метод Лекции 6, 7. Симплекс-метод с естественным базисом Симплекс –метод основан на переходе от одного опорного плана к другому, при котором.
Игровые задачи исследования операций. Предмет теории игр Теория игр представляет собой математическую теорию конфликтных ситуаций и математически объясняет.
Конституционная экономика Игровые теории экономических процессов. Основные понятия и классификация игр. Белова Т.А. группа ю.з-1841.
План лекции: 1. Векторы. Линейные операции над векторами. 2. Линейная зависимость и независимость векторов. 3.Понятие базиса. Координаты вектора. 4. Разложение.
Моделирование конфликтных ситуаций в экономике с применением математической теории игр.
Лекция 2. Биматричные игры Биматричная игра - это бескоалиционная игра двух игроков, каждый из которых имеет конечное множество стратегий. Пусть первый.
1 3. Системы линейных уравнений. Леопо́льд Кро́некер.
СТАТИСТИЧЕСКИЕ ИГРЫ Выполнили: Петрук К. Черняк А. Чикиш Ю.
Редок Полина, студентка 1 курса экономического факультета группы э 122 б.
Модели принятия решений Богословский факультет ПСТГУ.
Транксрипт:

ТЕОРИЯ ИГР

Литература 1.Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. – М., Воробьев Н.Н. Теория игр для экономистов- кибернетиков. – М.: Наука, Дюбин Г.Н., Суздаль В.Г. Введение в прикладную теорию игр.– М.: Наука, 1981.

1. Основные понятия теории матричных игр

Теория игр – это совокупность математических методов анализа и оценки конфликтных ситуаций.

Содержание теории игр: установление принципов оптимального поведения в условиях неопределенности (конфликта), доказательство существования решений, удовлетворяющих этим принципам, указание алгоритмов нахождения решений, их реализация.

Моделями теории игр можно описать экономические, правовые, классовые, военные конфликты, взаимодействие человека с природой. Все такие модели в теории игр принято называть играми.

Игры можно классифицировать по различным признакам: стратегические и чисто случайные, бескоалиционные и коалиционные, игры 1, 2, …, n лиц (по числу игроков), конечные и бесконечные (по числу стратегий), игры в нормальной форме и динамические, с нулевой суммой («антагонистические») и с ненулевой суммой.

Рассмотрим простейшую модель – игру, в которой участвуют два игрока, множество стратегий каждого игрока конечно, а выигрыш одного игрока равен проигрышу другого (бескоалиционная, конечная, антагонистическая игра двух лиц).

Такую игру (Г ) называют матричной. Она определяется тройкой Г=(X,Y,K), где Х – множество стратегий 1-го игрока, Y – множество стратегий 2-го игрока, K=K(x,y) – функция выигрыша (выигрыш 1-го игрока и соответственно проигрыш 2-го при условии, что 1-й игрок выбрал стратегию, а 2-й – стратегию ). Пару (x,y) называют ситуацией в игре Г.

Пусть 1-й игрок имеет всего m стратегий, а 2-й – n стратегий: Х=М={1,2, …, m}, Y=N={1,2, …, n}. Тогда игра Г полностью определяется заданием матрицы, где a ij =K(i,j) – выигрыш 1-го игрока при условии, что он выбрал стратегию (т.е. строку) i, а 2-й игрок – стратегию (т.е. столбец) j (эти стратегии называют чистыми). Матрица А называется матрицей игры или платежной матрицей.

Пусть – платежная матрица игры Г. Если 1-й игрок выбрал стратегию i, то в худшем случае он выиграет. Поэтому он всегда может гарантировать себе выигрыш, обозначим его – нижняя цена игры, или максимин, соответствующая стратегия 1-го игрока называется максиминной.

Второй игрок, выбрав стратегию j, в худшем случае проиграет, а значит, может гарантировать себе проигрыш, обозначим его – верхняя цена игры, или минимакс, соответствующая стратегия 2-го игрока называется минимаксной.

Схема:

Например, Соответствующие стратегии: i 0 =1(максиминная), j 0 =1,2 (минимаксная).

Справедливо неравенство:

Ситуация (i*, j*) называется ситуацией равновесия, или седловой точкой, если для любых,, выполняется неравенство Соответствующие стратегии i*, j* называются оптимальными чистыми стратегиями 1-го и 2-го игроков, а число называется ценой игры. Элемент является одновременно минимумом в своей строке и максимумом в своем столбце.

Ситуация равновесия существует тогда и только тогда, когда (это значение и является ценой игры v).

Например, (2,3)-ситуация равновесная, v =4 – цена игры, i*=2, j*=3 – оптимальные стратегии 1-го и 2-го игроков. Выбрав их, 1-й игрок обеспечит себе выигрыш не менее 4 ед., а 2- й игрок проиграет не более 4 ед. при любом выборе другого игрока.

Смешанной стратегией для 1-го игрока называется упорядоченная система m действительных чисел x=(x 1, x 2, …, x m ),,, которые можно рассматривать как относительные частоты (вероятности), с которыми 1-й игрок выбирает чистые стратегии i=1, 2, …, m. Аналогично определяется смешанная стратегия для 2-го игрока: y=(y 1, y 2, …, y n ),,.

Функция выигрыша K(x,y) в ситуации (x,y) определяется как математическое ожидание выигрыша 1-го игрока при условии, что 1-й и 2-й игроки выбрали соответственно стратегии x=(x 1, x 2, …, x m ) и y=(y 1, y 2, …, y n ):.

Если для некоторых и и для всех и выполняется неравенство, то x*, y* называются оптимальными смешанными стратегиями игроков, число называется ценой игры, пара (x*, y*) – стратегической седловой точкой тройка x*, y*, v – решением игры.

Свойства оптимальных стратегий.

1. Пусть K(x,y) – математическое ожидание выигрыша в игре Г А с ценой v. Тогда, для того чтобы элемент был оптимальной стратегией 1-го игрока, необходимо и достаточно, чтобы для каждого элемента выполнялось неравенство Аналогично, для того чтобы был оптимальной стратегией 2-го игрока, необходимо и достаточно, чтобы для каждого выполнялось неравенство

2. Пусть K(x,y) – математическое ожидание выигрыша в игре Г А, v – действительное число,,. Тогда, для того чтобы v было ценой игры, а x* и y* были оптимальными стратегиями соответственно 1-го и 2-го игроков, необходимо и достаточно, чтобы для любых и выполнялось неравенство

3. Пусть K(x,y) – математическое ожидание выигрыша в игре Г А с ценой v. Тогда, для того чтобы элемент был оптимальной стратегией 1-го игрока, необходимо и достаточно, чтобы для каждого выполнялось неравенство. Аналогично, для того чтобы был оптимальной стратегией 2-го игрока, необходимо и достаточно, чтобы для каждого выполнялось неравенство.

4. Если x*, y* – решение -игры Г А, то

5. Пусть,, v – решение игры Г А. Тогда для любого, при котором, выполняется неравенство x i =0, а для любого, при котором, выполняется неравенство y j =0.

6 (Лемма о масштабе). Если Г А – игра с матрицей, а – игра с матрицей, где, где α, =const, α>0, то множества оптимальных стратегий игроков в играх Г А и совпадают, а. Иначе говоря, две игры, отличающиеся лишь началом отсчета выигрышей и масштабом их измерения, стратегически эквивалентны.

2. ( ) - игры

Пусть – платежная матрица игры Г. Если она не имеет седловой точки, то единственное решение игры Г можно найти

1) решив две системы:

2) по формулам: или

3) в матричном виде: где – определитель матрицы А, А* – присоединенная к А матрица,,,, J T и y T – транспонированные матрицы J и y.

Найдем, например, решение игры с платежной матрицей, которая не имеет седловой точки.

1) Составим системы: Решив системы, получим: то есть -решение игры.

2) Найдем решение по формулам:

3) Найдем решение в матричном виде:

3. и – игры

Рассмотрим игру с платежной матрицей

Если 1-й игрок применит смешанную стратегию, а 2-й игрок – чистую стратегию, то.(1)

Аналогично при выборе 2-м игроком чистых стратегий,, (2) (3) (4)

1 A Рис.1 (1) x 0 x (3) (2) (4)

Точка A является точкой пересечения прямых (2) и (3), поэтому решение исходной игры можно найти, решив игру

По формулам решения – игры получим:

Тогда решение исходной игры имеет вид (номерам столбцов, не вошедших в матрицу, соответствуют нулевые координаты вектора ),.

Аналогично решаются - игры. Пусть, например,, – смешанная стратегия 2-го игрока, 1-й игрок выбирает чистые стратегии i=1,2,3.

(1) (2) (3)

(1) y 0 y (3) (2) 1 B Рис.2

Точка B является точкой пересечения прямых (2) и (3). Найдем решение игры

Тогда решение исходной игры:

Пусть платежная матрица игры (3) x 0 x2x2 (2) (1) Рис.3 1 BA x1x1

A – точка пересечения прямых (2) и (3), ее абсциссу найдем, решая игру

B – точка пересечения прямых (1) и (2), ее абсциссу найдем, решая игру

Решение исходной игры:, где,, то есть 1-й игрок имеет множество оптимальных стратегий, 2-й игрок – единственную оптимальную стратегию, это чистая стратегия j=2.

4. Доминирование стратегий

Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью.

В результате вместо игры Г А с матрицей А можно рассмотреть игру с матрицей

Легко найти решение игры Можно предположить, что решение игры Г А будет иметь вид:

Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если для всех и хотя бы для одного j. В этом случае говорят также, что i-я стратегия (или строка) – доминирующая, k-я – доминируемая.

Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех и хотя бы для одного i В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю – доминируемой.

Стратегия может доминироваться также выпуклой линейной комбинацией других стратегий. Так, i-я стратегия 1-го игрока доминируется выпуклой линейной комбинацией остальных стратегий, если ; j-я стратегия 2-го игрока доминируется выпуклой линейной комбинацией остальных стратегий, если

Если – некоторая смешанная стратегия, то ее расширением на i- ом месте будем называть стратегию вида

теорема: пусть Г А – -игра, в которой i-я строка доминируема, – игра с матрицей, полученной из А вычеркиванием i-ой строки. Тогда 1) ; 2) всякая оптимальная стратегия 2-го игрока в игре является оптимальной и в игре Г А ; 3) если x* – оптимальная стратегия 1-го игрока в игре, то – его оптимальная стратегия в игре Г А. Аналогичная теорема имеет место для доминируемого столбца.

5. Множество решений матричной игры

Чтобы найти множество всех решений игры с платежной матрицей А, нужно рассмотреть все квадратные подматрицы матрицы А. Найдя решения игр, заданных подматрицами, нужно составить их расширения на соответствующих местах и проверить, являются ли полученные стратегии оптимальными для игры Г А.

Множество всех решений каждого игрока является выпуклой линейной комбинацией найденных решений.

Решение игры, заданной квадратной подматрицей В, можно найти в матричном виде по формулам

Найдем, например, множество всех решений игры Г А с платежной матрицей

Подматрицы не дадут решений, так как матрица А не имеет седловых точек. Рассмотрим подматрицы :

Для В: является решением игры Г А (убеждаемся в этом проверкой).

Для С: – является решением игры Г А. Для D получим такое же решение, как для В.

Таким образом, в игре Г А 1-й игрок имеет единственную оптимальную стратегию 2-й игрок имеет множество оптимальных стратегий где,, цена игры v=1.

6. Сведение матричной игры к двойственной задаче линейного программирования

Пусть матрица игры имеет вид K=K(x,y)– функция выигрыша,,,.

Тогда по свойству 2 оптимальных стратегий для любых, должно выполняться условие

То есть

Пример. Найти решение игры с матрицей

Решение. Перейдем к положительной матрице, прибавив 3 ко всем элементам матрицы А:

Составим двойственную задачу линейного программирования:

Решим задачу симплексным методом

Базис С0С0 P0P q1q1 q2q2 q3q3 q4q4 q5q5 q6q6 1-я итерация q4q q5q q6q

Базис С0С0 P0P q1q1 q2q2 q3q3 q4q4 q5q5 q6q6 2-я итерация q4q4 02/301/37/310-1/3 q5q5 02/3 0 7/3 4/301-1/3 q1q1 11/3 1 2/3 001/ /3 001/3

Базис С0С0 P0P q1q1 q2q2 q3q3 q4q4 q5q5 q6q6 3-я итерация q4q4 04/70015/71-1/7-2/7 q2q2 12/7 0 14/703/7-1/7 q1q1 11/7 10 2/70-2/73/ /701/72/7

Базис С0С0 P0P q1q1 q2q2 q3q3 q4q4 q5q5 q6q6 4-я итерация q3q3 14/150017/15-1/15-2/15 q2q2 12/ /157/15-1/15 q1q1 11/ /15-4/157/ /152/154/15

Получаем решение двойственной задачи:

Тогда решение игры с матрицей Решение исходной игры:

7. Приближенное решение матричных игр

где v – цена игры, k– номер партии, – максимальное значение суммарного выигрыша 1-го игрока в k-ой партии при выборе различных стратегий, – минимальное значение суммарного проигрыша 2-го игрока в k-ой партии при выборе различных стратегий.

За приближенные оптимальные стратегии игроков принимают векторы, координатами которых являются относительные частоты выбора соответствующих чистых стратегий.

Пример. Найти приближенное решение игры, заданной матрицей

партии k выбор 1-го игрока выбор 2-го игрока суммарный выигрыш 1-го игрока при выборе стратегии суммарный проигрыш 2-го игрока при выборе стратегии abcαβ 1 aα bβ bβ cβ cβ cβ ,8331,167

партии k выбор 1-го игрока выбор 2-го игрока суммарный выигрыш 1-го игрока при выборе стратегии суммарный проигрыш 2-го игрока при выборе стратегии abcαβ 7 cβ ,8571,286 8 c ,751,25 9 c ,6671, c ,71,2 11 a ,8181, a ,9171,417

Приближенное решение игры за 12 партий: v =1,45, ;,