Академия: "Теория игр". Блок #1

Данный курс Теория игр разработан Высшей Школой Экономики и расскажет нам о базовых понятиях и концепции теории игр. Покажет, как она применяется на практике и на сколько она важна. Ведь не зря за последние пару десятилетий было присуждено 4 нобелевские премии в области этой молодой науки. Курс состоит из 11 модулей. Читает доцент кафедры высшей математики Дмитрий Дагаев.

Конспект модуля №1

1. Стратегические взаимодействия

Теория игр — это наука, которая изучает принципы принятия решений в условиях стратегического взаимодействия (СВ) нескольких игроков, агентов (правительств, компаний, людей), то есть те ситуации, в которых действия агента (игрока) A зависят от действия агента B. Слово "игра" в отличии от бытового варианта, здесь означает "математическую модель".

Пример СВ из покера: при принятии решения о том или ином действии (ставка, сброс, уравнивание) вы должны учитывать какие решения могут принять оппоненты. Вы должны выбирать оптимальное решение, зная лишь вероятности тех или иных действий, которые ваши оппоненты могут совершить в будущем. Так же вы должны учитывать свои предыдущие действия и то, как их интерпретировали ваши оппоненты, чтобы они не смогли подстроиться под ваши однотипные решения.
Пример СВ из спорта: бегуны на дистанции решают, как им распределить усилия, в том числе зависимости от того, какие решения принимают и какие стратегии используют, бегущие с ними оппоненты.

СВ бывают:

Одновременные — взаимодействия, во время которых агенты принимают решение одновременно и в независимости друг от друга ( «камень, ножницы, бумага»). Не обязательно одновременно, но обязательно в независимости.
Последовательные — взаимодействия, во время которых агенты принимают решение по очереди. То есть при принятии того или иного решения оппонент может учитывать предыдущие действия другого (шахматы).

Далее идёт множество очень подробных примеров (поступления в вузы, противостояние Шерлока Холмса и Мориарти и тд) стратегических взаимодействий, описывать которые не вижу смысла, так как они скорее художественного плана.

2. Классы игр

Игра в нормальной форме

Необходимый минимум для описания любой игры для одновременных стратегических взаимодействий.

Задать всех игроков в заданной игре (2+), обозначается I = {1, . . .,n}, n>=2.
Задать все возможные стратегии для каждого игрока (i = 1, . . .,n) и Si — это единственная выбранная игроком стратегия. Сюда же относим профиль стратегий — это набор уже выбранных стратегий (s1, …, sn).
Задать платёж (награду), который получит каждый игрок. После выбора игроком стратегии нужно определить исход игры — ui(s1,. . .,sn)

Пример «Битва полов».

Муж и жена по-отдельности друг от друга решают где им провести вечер. Муж хочет на футбол, а жена на балет. Но при этом они хотят провести время вместе. Множество игроков — это муж (h) и жена (w); I = {h,w}. Множество возможных стратегий — это футбол и балет; для мужа — sh = {фут,бал}, для жены — sw = {фут,бал}.

Платёж — допустим, что за свой любимый выбор игрок получит 2 очка. Тот, кто подчинится вкусам партнера, получит 1 очко, но свидание будет. Если каждый из них пойдёт на своё мероприятие по одиночке, то оба получат 0. Тут еще стоит упомянуть, что есть классы игр, где многое зависит от очерёдности хода, выбора. В данном случае преимущество будет иметь тот, кто сделает выбор первым.

Матрица выбора

Каждое её измерение — это игрок. Строки — это стратегии игрока 1, столбцы — это стратегии игрока 2. Пересечение столбца и строки — это платежи (выигрыши), которые получат игроки.

Игры в развёрнутой форме

Для последовательных стратегических взаимодействий

На изображении выше, игра для двух игроков. Игрок 1 совершает ход первым и выбирает стратегию X или Y. Игрок 2 анализирует свою позицию и решает — выбрать стратегию A или B. Вероятно, первый игрок выберет Y, а второй — A (для каждого это самые выгодные стратегии, оптимальные); тогда они получат — 8 и 2 очка (цифры для прим).

Дерево игры

C - студент; П - преподаватель

Далее нам представляются ориентированное дерево, где каждая вершина означает выбор соответствующего игрока. В данном случае, это выбор студента на экзамене, списывать ему или нет. И выбор преподавателя, выгонять его за это или нет. И жалеть его или нет, если он не будет списывать, а будет мучатся. От каждой вершины отходят ветви(рёбра), обозначающие стратегии (действия) данного игрока. Платежи игроков записываются внизу дерева (терминальные вершины).

Что для вас было наиболее интересным и впечатляющим в данной неделе курса?

Так как я бегло знаю предмет, то интересными показалось только пару примеров. Однако для изучения с нуля, первый блок вполне хорош. Объясняется всё понятно и доходчиво. Воды почти нет. Курс читается размерено и структурировано, по крайней мере пока. Дополнительные ролики на 3 часа качественные и самые интересные из первого блока.