Уважаемые пользователи Голос!
Сайт доступен в режиме «чтение» до сентября 2020 года. Операции с токенами Golos, Cyber можно проводить, используя альтернативные клиенты или через эксплорер Cyberway. Подробности здесь: https://golos.io/@goloscore/operacii-s-tokenami-golos-cyber-1594822432061
С уважением, команда “Голос”
GOLOS
RU
EN
UA
varwar
7 лет назад

Академия: "Теория игр". Блок #2

Конспект курса лекций для Академии
Конспект модуля №1. Стратегические взаимодействия
А на этой неделе мы поговорим о способах решения теоретико-игровых моделей и о концепциях доминирующих и доминируемых стратегий.



Конспект модуля №2. Доминирующие и доминируемые стратегии

1. Как решать игры?

Решить игру — это узнать профиль стратегий, который вероятнее всего выберут игроки.

Пример: мы имеем двух игроков (Tom, Cat), которые играют в условную игру. У каждого из них есть по две стратегии (b1-b2),(a1-a2)

  • Cat должна предположить, какую стратегию сыграет Tom. Допустим это будет стратегия b1
  • Тогда Cat должна сравнить и выбрать свою стратегию против его, которая принесёт ей наибольший платёж. То есть, дать свои лучший ответ
  • Этот наилучший ответ против стратегии Toma обозначается: BRt (b1) - Best Responce (наилучший ответ)
  • На практике очень редко можно точно узнать заранее стратегию другого игрока
  • Использовать ту или иную концепцию — это использовать тот или иной набор предположении о поведении игроков

2. Равновесие в доминирующих стратегиях


Игрок I имеет две стратегии (a1,a2).
Игрок II имеет четыре стратегии (b1,b2,b3,b4).
Если первый игрок сыграет стратегию b1, то второй получит больший платёж от выбора стратегии a1. (точки на рис.) BR1(b1) = a1.
Стратегия a1 первого игрока доминирует любую стратегию второго игрока — это его доминирующая стратегия.
По аналогии: лучший ответ игрока II на стратегию a2 игрока I будет b1.(звездочка на рис.) BR2(a2) = b1. Это тоже его доминирующая стратегия.


Доминирующая стратегия (строго) — если ответом одного игрока на любую из стратегий второго игрока будет выбор одинаковой стратегии. То есть, она доминирует любую другую стратегию.
Не может существовать более одной строго доминирующей стратегии. При наличии у каждого игрока такой стратегии исход игры может быть легко предрешён.
Доминирующая стратегия (слабо) — если при любых стратегиях выбранными другими игроками, она доминирует либо эквивалентна им. Если в примере выше платёж "2"(с плюсом) исправить на "7", то это как раз и будет примером такой стратегии.
Равновесие доминирующих стратегий — если стратегия каждого игрока в исходе игры является его доминирующей стратегией.

  • Профиль стратегий (a1,b1) из примера выше, является равновесием в строго доминирующих стратегиях, потому что стратегии a1 для первого игрока и b1 для второго игрока — строго доминирующие стратегии.
  • Профиль стратегий (a1,b1) из примера выше, является равновесием в слабо доминирующих стратегиях, потому что a1 для первого игрока и b1 для второго игрока — слабо доминирующие стратегии.(если в примере платёж "2"(с плюсом) исправить на "7")
3. Примеры
Дилемма заключённого

Полиция поймала двух преступников. На них есть только косвенные улики. Их допрашивают в разных помещениях. Им предлагают следующий выбор: сдать сообщника или не сдать. Если один сдаёт другого, а второй нет, то сдавший выходит на свободу, а другой садится в тюрьму на 10 лет. Если они оба сдадут друг друга, то каждый получит по 5 лет. Если же никто ничего не скажет, то оба сядут на 1 год.

Первый и второй игрок судя по матрице платежей имеют строго доминирующие стратегии (предать). Их профилем является равновесие в строго доминирующих стратегиях.

Оптимальность по Парето — состояние, при котором значение каждого частного показателя, не может быть улучшено без ухудшения других. Поэтому на нашем примере профиль предать-предать не является оптимальным. А профиль молчать-молчать парето-доминирует профиль предать-предать. В этой игре, как мы выяснили, есть равновесие (предать-предать), но парето-оптимальные являются все другие профили. Если сравнивать с платежами игроков, то здесь и заключается фундаментальная проблема.

Как мы выяснили, игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок максимизирует свой собственный выигрыш, не заботясь о других. Поступив по одиночке рационально, в итоге игроки приходят к нерациональному решению. Если игроки оба предадут друг друга, то они получат в сумме меньший выигрыш (платёж).

Олигополистическая конкуренция

На рынке существуют две фирмы. Они продают одинаковый товар по одинаковой цене. Каждая из фирм в один момент и независимо друг от друга решают поднять цену на товар. Если фирмы не повысят цены, то платеж = 0. Если обе повысят то платежи = 1000. Если только одна повышает цену, то покупатели переходят ко второй фирме. Убыток одной = 200. Прибыль второй = 1400.

Если одна фирма повысит цену, то нам выгодно не повышать. Если вторая фирма не будет повышать, то нам тоже выгодно не повышать. Следовательно стратегия "не повышать" будет строго доминирующей для каждой фирмы. А профиль стратегий (не повышать-не повышать) является равновесием.

Как и в прошлом примере, в равновесии оба игрока получат меньше, чем если бы они договорились и одновременно повысили немного цену. Контролем за этим и занимаются антимонопольные органы. Такое стратегическое взаимодействие возможно только в олигополистической конкуренции, когда на рынке представлены только несколько фирм.

4. Равновесие при исключении доминируемых стратегий

Пример игры на матрице

Рассмотрев платежи в матрице мы видим:

  • Стратегия a2 для первого игрока слабо доминирует стратегию a1 и соответственно, стратегия a1 слабо доминируется стратегией a2.
  • Стратегия b3 для второго игрока строго доминирует стратегию b2 и соответственно, стратегия b2 строго доминируется стратегией b3.

Исключение строго и слабо доминирующих стратегий важный элемент анализа поведения игроков. На нашем примере оба игрока понимают, что стратегия b2 не выгодна никому. Её можно смело вычёркивать из матрицы. После вычёркивания мы видим, что по аналогии, теперь можно вычеркнуть ещё и стратегию a1. Далее, так же по аналогии мы видим, что у второго игрока есть строго доминируемая стратегия b3. В остатке у нас получился профиль (a2,b1), то есть матрица 1x1 — это и есть равновесие, которое мы получили исключением строго доминирующих стратегий. Если нельзя прийти к виду 1x1, то равновесия нет. Порядок исключения не важен.

Важное замечание: хотя на примере мы выявили равновесие путем исключения строго доминируемых стратегий, но это ещё не значит, что будет равновесие в строго доминирующих стратегиях. (ни у кого нет таких стратегий)

Что для вас было наиболее интересным и впечатляющим в данной неделе курса?

Модели теории игр позволяют не только проанализировать поведение участников в различных ситуациях, но и выявляют возникающие в процессе их взаимодействия проблемы. Очень часто, не стоит выигрывать, за счёт вреда соперникам, но нужно сделать лучший для себя ход, независимо от того, что делают другие. Рациональность в конечном счёте (на дистанции) всегда наиболее выгодна всем участникам процесса, при условии, что остальные участники тоже будут рациональными.

84
352.421 GOLOS
На Golos с February 2017
Комментарии (14)
Сортировать по:
Сначала старые