![]()
Главная Обратная связь Дисциплины:
Архитектура (936) ![]()
|
Чистые и смешанные стратегии и их свойства
Чистая стратегия Ai (i=1,m) первого игрока – это возможный ход первого игрока, выбранный им с вероятностью, равной единице. Аналогично определяется стратегия Bj (j=1,n) второго игрока. Если первый игрок имеет m стратегий, а второй n стратегий, то для всех пар стратегий первого и второго игроков чистые стратегии можно представить в виде единичных векторов, т.е. для пары стратегий AiBj чистую стратегию можно записать в виде pi=(0,0,…,1(i-е место),0,…,0), qj=(0,0,…,1(j-е место),0,…,0). Теорема. В МИ нижняя чистая цена игры не превосходит верхней чистой цены игры: a£b. Если для чистых стратегий AiBj игроков А и В соответственно имеет место равенство a=b, то пару чистых стратегий (AiBj) называют седловой точкой МИ, элемент матрицы aij на пересечении i-й строки и j-го столбца, – седловым элементом платежной таблицы, а число n=a=b называется чистой ценой игры. Если МИ не имеет седловой точки, то решение игры затрудняется, в таких играх a<b. Для решения этих задач применяют смешанные стратегии. Смешанными стратегиями двух игроков называются векторы p и q: p=(p1,p2,…,pm), pi³0, Вектор p(q) есть вероятность применения i-й чистой стратегии первым игроком (j-й чистой стратегии вторым игроком). Средняя величина выигрыша или проигрыша – мат. ожидание, которое является ф-ей от смешанных стратегий (это и будет целевая функция линейного программирования: f (p,q) – v ® 0):
Стратегии p*=(p1*,p2*,…,pm*); q*=(q1*,q2*,…,qn*) называются оптимальными, если для произвольных стратегий p и q выполняются условия: f(p, q*) £ f(p*, q*) £ f(p*, q). Совокупность оптимальных стратегии и цены игры составляет решение игры. Значение платежной функции при оптимальных стратегиях определяет чистую цену игры: f(p*, q*) = n Теорема. В смешанных стратегиях любая конечная МИ имеет седловую точку. Теорема. Для того, чтобы смешанные стратегии p* и q* были оптимальными в игре с матрицей [aij]mxn с выигрышем n необходимо и достаточно выполнение неравенств: i=1ån aijpi* ³ n; j=1åm aijqj* £ n (ограничения для задачи линейного программирования) Если игрок А принимает оптимальную смешанную стратегию р*, а игрок В любую чистую стратегию Bj, то выигрыш игрока А будет не меньше цены игры n. Аналогично, если игрок В использует оптимальную смешанную стратегию q*, то проигрыш игрока В не превысит цены игры n. Активные стратегии игрока – это чистые стратегии игрока, которые входят в его оптимальную смешанную стратегию с вероятностями отличными от 0. Теорема. Если один из игроков придерживается своей оптимальной стратегии, то его выигрыш остается неизменным и равным цене игры, независимо от того, какую стратегию применяет другой игрок (если только второй игрок не выходит за пределы своих активных стратегий). Решение МИ можно упростить, если выявить доминирование одних стратегий над другими. Рассмотрим стратегии игрока А и элементы строк s и t. Если asj³atj, то выигрыш игрока А при стратегии As больше, чем при стратегии At, т.е. As доминирует над At. В этом случае строка s называется доминирующей, а строка t доминируемой. Для игрока В доминирующим будет столбец с наименьшими элементами. Предположим, что цена игры положительна (v>0).Если это не так, то всегда можно подобрать такое число с, прибавление которого ко всем элементам матрицы выигрышей даёт матрицу с положительными элементами, и следовательно, с положительным значением цены игры. При этом оптимальные смешанные стратегии обоих игроков не изменяются. Пусть дана матричная игра с матрицей А порядка m×n. Оптимальные смешанные стратегии х = (х1, ..., хm) и y = (y1,..., yn) игроков 1 и 2 и цена игры v должны удовлетворять соотношениям: Разделим все уравнения и неравенства на v (это можно сделать,т.к. по предположению v > 0).
Поскольку первый игрок стремится найти такие значения хi и, следовательно, pi , чтобы цена игры была макс., то решение первой задачи сводится к нахождению таких значений pi>0, при которых Поскольку второй игрок стремится найти такие значения yj и,следовательно, qj, чтобы цена игры v была мин., то решение второй задачи сводится к нахождению таких значений qj>0, при которых Эти формулы выражают двойственные друг другу задачи линейного программирования. Решив эти задачи, получим значения pi, qj и v.Тогда смешанные стратегии, т.е. xi и yj получаются:
Пример. Найти решение игры, определяемой матрицей. При решении этой игры к каждому элементу матрицы А прибавим 1 и получим следующую матрицу: Составим теперь пару взаимно-двойственных задач : Решим вторую из них симплексным методом. Из оптимальной симплекс-таблицы следует, что (q1, q2, q3) = (0; 1/2; 1), а из соотношений двойственности следует, что ( p1, p2, p3) = (1/2; 1; 0). Следовательно, цена игры с платёжной матрицей А1 равна а игры с платёжной матрицей А: При этом оптимальные стратегии игроков имеют вид: Х = (х1, х2, х3) = (v1р1; v1р2; v1р3) = (1/3; 2/3; 0) Y = (y1, y2, y3) = (v1q1; v1q2; v1q3) = (0; 1/3; 2/3)
![]() |