Читать онлайн "Камень, ножницы, теорема. Фон Нейман. Теория игр" - Коллектив авторов - RuLit

Главное здание центра РЭНД на пляже Санта-Моники, 1958 год.

ДИЛЕММА ЗАКЛЮЧЕННОГО

В период работы в РЭНД фон Нейман заинтересовался математической подоплекой на первый взгляд очень простой задачи — дилеммы заключенного. Однако она таила много сложностей и к тому же перекликалась со сценарием сдерживания ядерной гонки, над которым в то время велась интенсивная работа.

Когда Мерил Флад и Мелвин Дрешер, исследователи центра РЭНД, придумали эту простую игру, которую Альберт Вильям Такер, еще один сотрудник этой организации, назвал дилеммой заключенного, они и представить себе не могли, что создали одну из главных задач теории игр.

Дилемма заключенного состоит в следующем. Два члена преступной группировки попали в тюрьму. У полиции есть основания подозревать, что они совершили преступление, за которое следует наказание в виде шести лет заключения, но у нее недостаточно доказательств. Без главной улики их могут осудить всего на год тюрьмы за меньшее преступление. Полиция предлагает им такой уговор: если один даст показания против другого, то его освободят, а второго приговорят к десяти годам. Если они оба обвинят друг друга, им обоим дадут по четыре года тюрьмы. Бандитов держат в раздельных камерах, чтобы ни один из них не знал, какое решение принял второй. Если мы назовем заключенных A и В, то суть ситуации можно отразить в следующей платежной матрице.

В не обвиняет А

B обвиняет А

А не обвиняет В

1, 1

10, 0

А обвиняет В

0, 10

4, 4

Поскольку они не могут согласовать свои стратегии, принятие решений становится непростой задачей. Сначала кажется, что самым выигрышным поведением будет самое эгоистичное, которое учитывает интересы конкретного заключенного. Тогда в случае осуждения ему придется провести в тюрьме самое большое четыре года по сравнению с максимальным наказанием в десять лет, а если повезет и второй преступник воздержится от обвинения, то можно вообще избежать срока.

Такой ход мысли кажется довольно разумным, но надо иметь в виду, что второй заключенный рассуждает точно так же. Поэтому вполне вероятно, что в конце концов обоим дадут по четыре года. Эта стратегия может считаться доминантной. Тем не менее ясно, что это не самое лучшее решение, ведь если они оба откажутся давать показания друг против друга, то срок составит всего один год. Таким образом, лучшей стратегией будет кооперация, но это значит, что мы должны быть уверены в позиции нашего партнера, а гарантий у нас нет.

Существует целая область математики, изучающая подобные ситуации, которые считаются стратегическими играми. Игра начинается с числовой таблицы, иногда очень сложной, а стратегиями являются наилучшие из возможных ходов игроков. Если использовать холодный интеллект, теорию вероятностей, так называемое математическое ожидание и алгебру, то мы получим рациональные выводы, согласно которым для каждого игрока лучше всего не следовать эгоистическим побуждениям. То, что один игрок считает лучшим для себя вариантом, может таковым и не быть, если учитывать возможные действия остальных игроков. Очень часто идеальным решением, или оптимальной стратегией, будет кооперация. Так все получают максимальный возможный выигрыш с наименьшими потерями. Опытные данные показывают, что в дилемме заключенного игроки предпочитают обвинять, нежели доверять, и с точки зрения математики ошибаются.

Если вопрос о дилемме заключенного возникает в неформальной обстановке, например за обедом между друзьями, которые хотят немного поразмышлять за чашкой кофе, мы можем быть уверены в двух вещах: во-первых, размышлять они будут долго, а во-вторых, не придут ни к какому заключению. Дело в том, что у дилеммы заключенного нет удовлетворительного решения, так как эта ситуация больше похожа на парадокс, чем на логическую загадку. Два возможных варианта, которые кажутся правильными (оба кооперируют или оба обвиняют), очень трудно объяснить с рациональной точки зрения.

Мы знаем, что в ситуациях такого типа на принятие решения могут влиять самые разные факторы, например мораль или эмоции. Можно положиться на интуицию, довериться предсказаниям гадалки или просто кинуть кости и уповать на волю случая. Но в любом случае останется открытым вопрос: существует ли метод, позволяющий принять это решение рациональным способом? Можно ли придать этой задаче математический характер? Желание математизировать реальность, присущее фон Нейману, заставило его заинтересоваться дилеммой заключенного.

Интересно и даже в какой-то степени неизбежно отставить в сторону при рассмотрении этой задачи факторы морального толка («предавать товарища нехорошо» или «за такой выбор меня будет мучить совесть»), так как они еще больше запутывают и не помогают принять решение. Нечто похожее происходит с кооперативными стратегиями. Кооперация предпочтительней не из-за этического аспекта, который не относится к сфере математики: она просто является наилучшей стратегией для получения максимального выигрыша с минимальным риском в конкретной игре, в которой есть конфликт интересов.

Чтобы избежать такой путаницы, лучше всего представить дилемму как игру в казино, в которой можно выиграть или проиграть какое-то количество денег, а не как трагический рассказ, в котором идет речь о жизни людей. Такой метод предлагает Вильям Паундстоун в своей книге Prisoner's dilemma {«Дилемма заключенного», 1992).

Речь идет об игре с двумя участниками, которая проходит всего один раз. Чтобы повторить ее, придется поменять обоих игроков. Единственное условие, которое стоит перед участниками, — одержать победу, как и в любой другой игре. Это кажется очевидным, но на самом деле нуждается в уточнении. Если игрок в покер хочет обмануть соперника с помощью блефа, нет смысла говорить, что это противоречит моральным принципам. Это глупо, ведь участники должны придерживаться правил без обмана и, главное, играть, чтобы выиграть. Такой подход особенно важен, когда теория игр выходит за рамки простого времяпрепровождения и применяется в военном сценарии.

Вернемся к дилемме в версии с казино: в ней участники играют за столом, под которым размещен электронный аппарат, невидимый противнику. Каждый игрок должен принять решение, сотрудничает он с соперником или нет. Крупье объявляет, в какой момент игроки могут нажимать на соответствующие кнопки. После того как установлен размер заклада, платежная матрица может иметь следующий вид.

КООПЕРАТИВНЫЕ ИГРЫ

В кооперативных играх участники преследуют общую цель, например выиграть выборы, улучшить управление компанией или повысить ее прибыль. Для достижения этой цели они объединяются в корпорации. Создается ситуация, обратная так называемым некооперативным, или антагонистическим, играм, в которых решающее значение имеет индивидуальная стратегия. Яркий пример обоих понятий можно найти в военных играх. Во время холодной войны существовало нестабильное равновесие между двумя мощными мировыми державами — СССР и США. Они вели антагонистическую игру с односторонними стратегиями. Было понятно, что такая некооперативная игра может иметь фатальные последствия для участников, и, таким образом, были заключены договоренности об остановке гонки ядерных вооружений.