Некооперативная теория игрНекооперативная игра — термин теории игр. Некооперативной игрой называется математическая модель взаимодействия нескольких сторон (игроков), в процессе которого они не могут формировать коалиции и координировать свои действия. Игры как с нулевой, так и ненулевой суммой бывают кооперативными и некооперативными. Поэтому, некооперативные игры можно разделить на игры с ненулевой суммой и игры с нулевой суммой.[1] Некооперативная игра в нормальной формеНекооперативной игрой в нормальной форме называется тройка , где — множество участников игры (сторон, игроков); — множество стратегий участника ; — функция выигрыша участника , определенная на множестве ситуаций и отображающая его во множество действительных чисел. Некооперативная игра в нормальной форме предполагает следующий порядок разыгрывания. 1. Игроки одновременно и независимо друг от друга выбирают из множеств свои стратегии. Вектор стратегий всех игроков представляет собой ситуацию в игре. 2. Каждый игрок получает выигрыш, определяемый значением функции , на этом взаимодействие между ними прекращается. Нормальная форма игры описывает статическое взаимодействие игроков, не предусматривая возможности последовательных ходов, накопления информации о действиях соперника и повторяющегося взаимодействия. Для моделирования этих аспектов используется развернутая форма игры. Некооперативная игра в развернутой формеНекооперативная игра в развернутой форме с множеством игроков представляется с использованием ориентированного дерева (дерева игры) следующим образом. Вершины дерева представляют собой состояния (позиции), в которых может оказываться игра, ребра — ходы, которые могут использовать игроки. Предполагается, что в каждой позиции может совершать ход не более одного игрока. Выделяется три вида позиций в игре:
Начальная и промежуточные позиции образуют множество нетерминальных позиций. Для каждой вершины дерева , соответствующей нетерминальной позиции, определен игрок , совершающий в ней ход и множество ходов этого игрока . Каждому ходу соответствует ребро, выходящее из вершины . Для учёта несовершенства информации, имеющейся у игроков, нетерминальные вершины могут объединяться в информационные множества. Для каждой вершины , соответствующей терминальной позиции, определены функции выигрыша всех игроков . Игра предполагает следующий порядок разыгрывания: 1. Игра начинается из начальной позиции. 2. В любой нетерминальной позиции игрок, имеющий в ней право хода, выбирает ход , в результате чего игра попадает в следующую позицию, в которую входит ребро, соответствующее ходу . Если эта позиция является нетерминальной, то повторяется п. 2. 3. Если игра попадает в терминальную позицию , то все игроки получают выигрыши , и игра завершается. Принципы оптимальностиОсновным принципом оптимальности стратегий для некооперативных игр в нормальной форме является равновесие Нэша, основанное на невозможности отклонений участников от выбранных стратегий. К настоящему времени разработано семейство принципов, основанных на равновесии Нэша, и называемых очищениями равновесия Нэша (Nash equilibrium refinements), наиболее часто используемыми среди которых являются: Менее универсальными, используемыми в отдельных классах некооперативных игр, являются следующие принципы:
Для некооперативных игр в развернутой форме также используются принципы оптимальности, основанные на равновесии Нэша, но учитывающие специфику динамического взаимодействия игроков. К основным из них относятся: ПримерыСм. такжеПримечания
Литература
|