Уважаемые пользователи Голос!
Сайт доступен в режиме «чтение» до сентября 2020 года. Операции с токенами Golos, Cyber можно проводить, используя альтернативные клиенты или через эксплорер Cyberway. Подробности здесь: https://golos.io/@goloscore/operacii-s-tokenami-golos-cyber-1594822432061
С уважением, команда “Голос”
GOLOS
RU
EN
UA
filinpaul
7 лет назад

Академия. Теория игр. Неделя 4.


Итак, мы продолжаем изучать курс "Теория игр", представляемый на проекте Вторая академия (организатор и идейный вдохновитель @ontofractal) лекциями национального исследовательского университета ВШЭ. На данный момент нам уже известны три теоретико-игровые концепции решения игр:

1) равновесие в доминирующих стратегиях,

2) равновесие, исключающее доминируемые стратегии,

3) равновесие Нэша.

Но, чтобы можно было использовать теорию игр для изучения каких-либо реальных стратегических взаимодействий, в первую очередь необходимо формализовать эти взаимодействия, построив для них соответствующие модели. И чем проще будут эти модели, тем легче будут решения.

Сегодняшнее занятие будет посвящено искусству моделирования. Нам предстоит изучить две классические модели, описывающие самые распространённые виды конкуренций: политическую и олигополистическую.


МОДЕЛЬ ХОТЕЛЛИНГА-ДАУНСА

Начало этой модели положил американский экономист и статистик Гарольд Хотеллинг. В 1929 году он опубликовал статью "Стабильность конкуренции", в которой рассматривал примеры взаимодействия агентов различных фирм на потребительском рынке.

                                                          

А в 1957 году опять же американский экономист и политолог Энтони Даунс в книге "Экономическая теория демократии" перенёс эту модель на политическую конкуренцию, и теперь рассматриваемая модель носит имя обоих учёных.

Итак, в тридевятом царстве, в тридесятом государстве грядут выборы, в которых, для упрощения ситуации, принимают участие только две партии. И пусть исход избирательной кампании зависит лишь от позиции каждого из кандидатов по одному ключевому вопросу: степень влияния государства на экономику страны. Политическое пространство мы представим в виде отрезка от 0 до 1. Если игрок выбирает 0, значит он не допускает никакого вмешательства государства в экономику. Если выбирает 1, то считает, что государство должно полностью контролировать экономический сектор. Между крайними позициями будут находиться промежуточные, содержащие обе точки зрения в различных процентных соотношениях.

Попробуем формально описать игру, то есть указать:

1) множество игроков,

2) множество всех возможных стратегий каждого игрока,

3) платежи, получаемые игроками в каждом из возможных профилей стратегий.

Множество игроков: две партии (или кандидата от этих партий) А и В, их множество обозначим через Р={А, В}.

Игрок А может выбрать любую позицию на отрезке от 0 до 1, и это будет его стратегия. Тогда его стратегию мы обозначим через Sa={a | a - любое значение от 0 до 1}. Аналогично Sb={b | b - любое значение от 0 до 1} - стратегия игрока В. Они одновременно объявляют число с рассматриваемого отрезка.

Будем считать, что кандидатов не очень волнует доля полученных голосов. Главное для них - максимизировать вероятность своей победы. Например, игрок А выбрал стратегию а=0.2, а игрок В - стратегию b=0.8:

Кроме самих партий у нас есть ещё и избиратели, которые не являются стратегическими игроками. Их мнения по ключевому вопросу (мы их будем называть идеальными точками избирателей и обозначать через xi) располагаются также на отрезке от 0 до 1, причём располагаются равномерно. Через m мы обозначим так называемую идеальную точку медианного избирателя, то есть такого избирателя, от которого и слева и справа на отрезке будет одинаковое количество остальных избирателей. В случае равномерного распределения избирателей по отрезку m=0.5.

Платёж избирателя будем высчитывать по формуле ui(x)= - |x - xi|, где xi - идеальная точка избирателя, а x - позиция выигравшего кандидата. Проще говоря: чем дальше позиция избирателя на отрезке от позиции победителя, тем меньше платёж. Естественно, что каждый избиратель будет голосовать за того кандидата, чья позиция максимально близка к его собственной.

Например у избирателя Лёни xi=0.3, а у кандидатов a=0.2, b=0.8. Тогда вычислить возможные платежи Лёни можно следующим образом:

Видно, что Лёне идейно ближе кандидат А. Условимся, что все избиратели - честные ребята и голосуют исключительно по зову сердца - честно, нестратегически. Значит, в данной ситуации Лёня отдаст свой голос за А (хотя в реальной жизни всё гораздо сложнее, но сейчас мы максимально упрощаем модель). Если оба кандидата находятся на одинаковом расстоянии от Лёни, то он просто подбрасывает монетку.

В выборах выигрывает кандидат, поучивший наибольшее количество голосов. В случае равного количества всё решается, опять же, с помощью монетки.

Ещё раз перечислим все предпосылки исследуемой модели:

1. Политическое пространство одномерно - отрезок от 0 до 1.

2. Конкурируют два кандидата.

3. Они максимизируют вероятность победы.

4. Идеальные точки избирателей на отрезке располагаются равномерно и непрерывно.

5. Избиратели голосуют нестратегически.

Приступим к решению этой модели, используя концепцию равновесия Нэша.

Рассмотрим сначала ситуацию, когда а=0.2, а b=0.8. Тогда каждый из кандидатов побеждает с вероятностью 1/2, поскольку за них будут отданы одинаковые количества голосов:

Эта ситуация не является равновесием. Например А выгоднее отказаться от своей стратегии, поменяв её на другую, расположенную немного левее b:

Тогда он получит все голоса левее его позиции и ещё немного справа, то есть в этом случае он побеждает на выборах.

Следующий пример. Пусть а=0.1, а b=0.4, тогда на выборах побеждает В:

И здесь нет равновесия. Кандидату А выгоднее отклониться от своей стратегии и занять позицию немного правее b:

Возможно ли здесь вообще равновесие? Да, если а=b=0.5:

Тогда ни одному из кандидатов невыгодно отклоняться от выбранной позиции. Например, если В уйдёт, скажем, влево на позицию b', то он теряет голоса избирателей:

Аналогично В невыгодно уходить и вправо, и А также невыгодно менять свою позицию. Значит, профиль (0.5, 0.5) - это равновесие Нэша.

Но игра пока не решена, ведь могут быть и другие равновесия. Переберём все возможные варианты профилей стратегий.

1) один из кандидатов гарантированно проигрывает:

Эти профили не являются равновесиями, поскольку каждый из проигрывающих кандидатов может изменить свою стратегию на более выгодную, отклонившись или в точку 0.5 или в точку, где находится выигрывающий кандидат (независимо от того, где она находится):

2) оба кандидата набирают одинаковое количество голосов (не рассматриваем вариант, который уже является равновесием Нэша, то есть профиль (0.5, 0.5)):

И в этих случаях любому из кандидатов выгоднее отклониться от первоначальной стратегии, тем самым обеспечив себе победу на выборах:

Итак, мы убедились в том, что существует только одно равновесие по Нэшу - профиль (0.5, 0.5). Вот почему на выборах, каждый из кандидатов стремиться приблизить свою позицию к позиции медианного избирателя. И в этом случае - двухпартийных выборах -  бывает весьма сложно найти отличия в программах кандидатов, ведь они ориентируются на одно и тоже - медианного избирателя. Даже если изначально риторика партий была далека друг от друга, то в процессе анализа партийными экспертами статистики, направленной на поиск позиции медианного избирателя, разница становится всё меньше и меньше.

Теперь проверим устойчивость полученного результата к изменениям предпосылок нашей модели. Увеличим количество кандидатов до трёх. Тогда выигрышный профиль примет вид (0.5, 0.5, 0.5) и каждый их игроков может выиграть с равной вероятностью 1/3. 

Но этот профиль не будет равновесием, поскольку незначительное отклонение одного из них с в сторону гарантирует ему победу. Допустим А смещает свою позицию с 0.5 на 0.49, тогда за него гарантированно проголосует 49% избирателей, а за В и С вместе только 51%:

С другой стороны, если мы рассмотрим такой профиль (0.15, 0.3, 0.7), то он будет являться равновесием Нэша, поскольку:

- кандидату С нет смысла отклоняться - он и так выигрывает, 

- кандидат А может улучшить свою позицию, отклонившись ближе к С или В, но в этом случает всё равно выигрывает не он, а В или С соответственно,

- аналогичная картина с кандидатом В.

Именно поэтому при многопартийных выборах партии могут занимать весьма различные предвыборные позиции.

Теперь изменим ситуацию с равномерностью распределения избирателей на отрезке. Пусть их распределение можно описать следующим графиком:

Мы видим, что плотность избирателей смещена влево, то есть больше тех, кто считает, что вмешательство государства в экономику должно быть незначительным. Тогда положение медианного избирателя уже не будет в точке 0.5. Значит, каждому из кандидатов выгодно отклониться в сторону медианного избирателя, и профиль (0.5, 0.5) не будет равновесием:

А вот профиль (m, m) будет равновесием Нэша, поскольку никому из игроков не выгодно отклоняться к другой стратегии:

Наконец мы рассмотрим пример из реальной жизни. Речь пойдёт о президентских выборах в Колумбии в 2014 году.

Во второй тур прошли два кандидата: Оскар Сулуага (29.25% голосов в первом туре) и  Хуан Мануэль Сантос (25.69%). Ключевым вопросом было перемирии с повстанческой группировкой FARC. Политическое пространство снова представим в виде отрезка от 0 до 1, где 0 - "переговоры любой ценой", 1 - "никаких переговоров". Большинство избирателей (60-70%) поддерживали переговоры, поэтому точка медианного избирателя будет смещена в левую сторону:

Сантос был за мирные переговоры и был готов включить представителей FARC в Конгресс Колумбии. Силуага, напротив, призывал к активным военным действиям против повстанцев: 

Силуага, понимая, что он страшно далёк от медианного избирателя, начинает менять свою позицию. Он говорит, что, в принципе, можно и провести переговоры, если повстанцы обещают прекратить свои боевые действия. Сулуаге нужна победа любой ценой, поэтому он обещает то, что поможет ему выиграть. И совершенно не важно сдержит ли он свои обещания потом. 

Его оппонент Сантос, видя это перемещение, начал разъяснять избирателям ход Сулуаги. В итоге позиция Сулуаги стала более выгоднее первоначальной, но этого ему не хватило для победы: он набрал около 45% голосов, а Сантос - немного более 50%. Сулуага, видимо, не смог использовать модель Даунса в полную силу, хотя это реальный инструмент для анализа политической конкуренции.


МОДЕЛЬ КУРНО

Это, наверное, первая теоретико-игровая модель была сформулирована ещё в 1838 году французским математиков Антуаном Огюстеном Курно. 

                                         

С тех пор она применяется в анализе конкуренции фирм на олигополистическом рынке, то есть рынке с небольшим количеством игроков.

Рассмотрим следующую ситуацию. В некотором городе N есть только две фирмы, производящие, например, сок. Каким образом между ними утроена конкуренция? Чтобы ответить на этот вопрос, мы и построим модель Курно. 

Предпосылками в этой модели будут следующие утверждения:

1. Игроки стараются максимизировать свою прибыль (хотя целью максимизирования может быть и что-нибудь другое).

2. Поэтому фирмы принимают стратегические решения о том, какой объём сока выпустить на рынок. 

3. Будем считать, что фирмы делают выбор своих стратегий одновременно и независимо друг от друга. 

Как видно из изложенного, мы постарались максимально упростить модель, которая в реальности может быть гораздо сложнее.

Множеством возможный стратегий каждой фирмы будет количество выпускаемого товара, которое может изменять в диапазоне от нуля до бесконечности. Пусть q1 - стратегия первой фирмы, а q2 - стратегия второй.

Платежами фирм будут разности между доходами и расходами, то есть прибыли: п=pq - cq, где:

1) pq - это доходы, получающиеся умножением количества товара (q) на его рыночную цену (p), которая формируется в результате решений, принимаемых обеими фирмами,

2) сq - это расходы, полученные в результате умножения количества товара (q) на издержки производства его единицы (с), которые для упрощения будет считать нулевыми.

Пусть рыночная цена формируется по следующей закономерности: p=1-(q1+q2)=1-q1-q2, т.е. чем больше будет выпущено товара, тем меньше будет цена. Например, если в сумме обеими фирмами выпущено товара 0 единиц, то его цена будет максимальной и равна 1, если же выпущено товара 1/2 единиц, то его цена будет равна 1/2:

В качестве концепции решения мы будет опять использовать равновесие Нэша. Рассмотрим несколько примеров.

Пусть фирмы произвели следующие количества единиц товара: q1=0.2, q2=0.3. Тогда их прибыли будут равны:

п1=(1-q1-q2)q1=(1-0.2-0.3)*0.2=0.1,

п2=(1-q1-q2)q2=(1-0.2-0.3)*0.3=0.15.

Данная ситуация не является равновесием, так как первой фирме выгодно отклониться и произвести больше товара, например q1=0.3. Тогда её прибыль увеличится: п1=(1-0.3-0.3)*0.3=0.12. Собственно и второй фирме выгоднее увеличить производство.

Другой пример. Пусть q1=q2=0.4. Тогда их прибыли будут одинаковыми и равны:

п1=(1-q1-q2)q1=(1-0.4-0.4)*0.4=0.08,

п2=(1-q1-q2)q2=(1-0.4-0.4)*0.4=0.08.

Но здесь опять нет равновесия, поскольку любой из фирм выгодно снизить количество произведённых единиц товара. Например до 0.3, тогда прибыль фирмы возрастёт:  п1=(1-0.3-0.4)*0.3=0.09.

Рассмотрим ещё один пример. Пусть первая фирма производит гораздо больше второй: q1=0.6, q2=0.1. Их прибыли: 

п1=(1-q1-q2)q1=(1-0.6-0.1)*0.6=0.18,

п2=(1-q1-q2)q2=(1-0.1-0.6)*0.1=0.03.

И это не будет равновесием. Первой фирме выгодно немного уменьшить производство (до 0.5), а второй немного увеличить (до 0.2), и их прибыли возрастут: п1=(1-0.5-0.1)*0.5=0.2, п2=(1-0.2-0.6)*0.2=0.04.

И всякий раз, когда фирма производит мало продукции, ей выгодно немного увеличить производство, а когда много - чуть-чуть снизить. Видимо, где-то должна быть "золотая середина", которая будет выдавать равновесие.

Прибыль фирмы - это квадратичная функция (п1=рq1=(1-q1-q2)q1=q1-q1q1-q1q2= -q1q1+q1(1-q2)), графиком которой является парабола с ветвями, направленными вниз:

Видно, что при увеличении выпуска прибыль растёт, достигает своего максимума и при дальнейшем увеличении - падает. Это оптимальное количество товара обозначим q*. В этой точке  выигрыш фирмы от того, что она увеличивает производство, будет равен сокращению доходов от того, что уменьшится цена на рынке в результате этого увеличения. Это будет равновесием. Осталось найти q*. 

Надо найти абсциссу вершины параболы. Однако, прибыль первой фирмы также зависит от количества произведённого товара второй фирмой - q2:


Видно, что, чем больше производит вторая фирма, тем выгоднее снижать производство первой фирме, при увеличении q2 вершины парабол смещаются влево. Вычислим абсциссу вершины: 

q*= -(1-q2)/(2*(-1))=(1-q2)/2.

То есть q* - функция от q2. Такая зависимость получила название "кривой реакции" первой фирмы на выпуск товара второй. Если бы первая фирма знала q2, она бы стала получать оптимальную прибыль.

Кривая реакции второй фирмы аналогичная: q*=(1-q1)/2, то есть чем больше производит первая фирма, тем выгоднее второй снижать своё производство. Для получения равновесия каждая фирма должна выпускать оптимальное количество товара:

q1*=(1-q2*)/2,

q2*=(1-q1*)/2.

Получается система двух уравнений с двумя неизвестными, корнями которой будут q1=q2=1/3. То есть, если одна фирма выпускает 1/3 единиц товара, то и другой фирме выгодно выпускать 1/3. Такой профиль (1/3, 1/3) называется равновесием Курно. Вернее, это равновесие Нэша в модели Курно.

Немного изменим сюжет. Фирмы могут договориться о количестве производимой продукции. Фактически получается одна фирма с выпуском qоб.=q1+q2 единиц, который мы будем называть объединённым выпуском. Тогда прибыль такой фирмы поб.=(1-qоб.)qоб., что опять является квадратичной функцией, с графиком - параболой, ветви которой направлены вниз. Абсцисса вершины равна этой кривой равна 1/2. Значит, чтобы достичь максимальной прибыли фирмы в сумме должны производить 1/2 единиц товара (причём не важно, как эта 1/2 будет распределена между договорившимися фирмами). И этот максимум прибыли будет равен (1-1/2)*1/2=1/4, а на долю каждой из фирм придётся 1/8. 

Если же фирмы не договариваются, то в равновесии Курно на долю каждой придётся (1-1/3-1/3)*1/3=1/9. То есть меньше! Получается, что фирмам выгоднее договориться, хотя этот профиль не является устойчивым. Любая из фирм в любой момент может нарушить договорённость и получить большую прибыль, но тогда в следующий раз её не возьмут в монополию.

Теперь предположим, что одна из фирм каким-то образом узнала сколько собирается производить другая фирма. Например, вторая узнала q1*. Тогда она произведёт q2*=(1-q1*)/2. Пусть q1*=1/2, тогда q2*=(1-1/2)*1/2=1/4, а значит, что первой фирме выгоднее отклониться и произвести q1*=(1-1/4)*1/4=3/8. Получается, что всё равно равновесием в этой игре будет единственный профиль (1/3, 1/3).


ЧТО ДЛЯ МЕНЯ БЫЛО НАИБОЛЕЕ ИНТЕРЕСНЫМ ИЗ ЭТОЙ НЕДЕЛИ КУРСА

Для решения стратегических взаимодействий необходимо уметь формализовать эти ситуации с помощью построения их моделей с различными исходными предпосылками. Чем проще получается модель, тем легче понять механизм взаимодействия. Классическими примерами подобных взаимодействий являются политические и экономические конкуренции, модель которых практически была описана задолго до появления теории игр, что лишний раз демонстрирует непреходящее стремление людей к власти и богатству.

33
124.126 GOLOS
На Golos с February 2017
Комментарии (7)
Сортировать по:
Сначала старые