Википедия

Дилемма заключённого

Диле́мма заключённого (англ. Prisoner's dilemma, реже употребляется название «дилемма банди́та») — фундаментальная проблема в теории игр, согласно которой рациональные игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других.

image
Иллюстрация к дилемме заключенных

Суть проблемы была сформулирована [англ.] и [англ.] в 1950 году. Название дилемме дал математик Альберт Такер.

В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников. Проще говоря, каким бы ни было поведение другого игрока, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.

Ведя себя по отдельности рационально, вместе участники приходят к нерациональному решению: если оба предадут, они получат в сумме меньший выигрыш, чем если бы сотрудничали (единственное равновесие в этой игре не ведёт к Парето-оптимальному решению). В этом и заключается дилемма.

В повторяющейся дилемме заключённого игра происходит периодически, и каждый игрок может «наказать» другого за несотрудничество ранее. В такой игре сотрудничество может стать равновесием, а стимул предать может перевешиваться угрозой наказания (с ростом числа итераций равновесие Нэша стремится к Парето-оптимуму).

Классическая дилемма заключённого

Во всех судебных системах кара за бандитизм (совершение преступлений в составе организованной группы) намного жестче, чем за те же преступления, совершённые в одиночку (отсюда название «дилемма бандита»).

Классическая формулировка дилеммы заключённого такова:

Двое преступников — А и Б — попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). Если оба молчат, их деяние проходит по более лёгкой статье, и каждый из них приговаривается к полугоду тюрьмы. Если оба свидетельствуют друг против друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?

Игру можно представить в виде следующей таблицы:

Заключённый Б хранит молчание Заключённый Б даёт показания
Заключённый А хранит молчание Оба получают по полгода А получает 10 лет,
Б освобождается
Заключённый А даёт показания А освобождается,
Б получает 10 лет тюрьмы
Оба получают по 2 года тюрьмы
«Дилемма заключённого» в нормальной форме'

Дилемма появляется, если предположить, что оба заботятся только о минимизации собственного срока заключения.

Представим рассуждения одного из узников. Если партнёр молчит, то лучше его предать и выйти на свободу (иначе — полгода тюрьмы). Если партнёр свидетельствует, то лучше тоже свидетельствовать против него, чтобы получить 2 года (иначе — 10 лет) тюрьмы. Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». Аналогично другой узник приходит к тому же выводу.

С точки зрения группы (этих двух узников) лучше всего сотрудничать друг с другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок заключения. Любое другое решение будет менее выгодным. Это очень наглядно демонстрирует, что в игре с ненулевой суммой Парето-оптимум может быть противоположным равновесию Нэша.

Обобщённая форма

Сотрудничать Предать
Сотрудничать C, C c, D
Предать D, c d, d
Каноническая матрица выигрышей
«Дилеммы заключённого»

Можно раскрыть схему игры далее, абстрагировавшись от подтекста заключённых. Обобщённая форма игры часто используется в экспериментальной экономике. Следующие правила дают типичную реализацию игры:

  1. В игре — два игрока и банкир. Каждый игрок держит 2 карты: на одной написано «сотрудничать», на другой — «предать» (это стандартная терминология игры). Каждый игрок кладёт одну карту перед банкиром лицом вниз (то есть никто не знает чужого решения, хотя знание чужого решения не влияет на анализ доминирования). Банкир открывает карты и выдаёт выигрыш.
  2. Если оба выбрали «сотрудничать», оба получают C. Если один выбрал «предать», другой «сотрудничать» — первый получает D, второй с. Если оба выбрали «предать» — оба получают d.
  3. Значения переменных C, D, c, d могут быть любого знака (в примере выше все меньше либо равны 0). Обязательно должно соблюдаться неравенство D > C > d > c, чтобы игра представляла собой «дилемму заключённого».
  4. Если игра повторяется, то есть играется больше 1 раза подряд, общий выигрыш от сотрудничества должен быть больше суммарного выигрыша в ситуации, когда один предаёт, а другой — нет, то есть 2C > D + c. Это неравенство говорит о том, что в случае взаимного сотрудничества достигается строгий Парето-оптимум – ситуация, когда любая альтернатива приводит к снижению выигрыша хотя бы для одного игрока.

Эти правила были установлены Дугласом Хофштадтером и образуют каноническое описание типичной дилеммы заключённого.

Альтернативная формулировка

Хофштадтер предположил, что люди проще понимают такие задачи, как дилемма заключённого, если она представлена в виде отдельной игры или процесса торговли. Один из примеров — «обмен закрытыми сумками»:

Два человека встречаются и обмениваются закрытыми сумками, понимая, что одна из них содержит деньги, другая — товар. Каждый игрок может уважать сделку и положить в сумку то, о чём договорились, либо обмануть партнёра, дав пустую сумку.

В этой игре обман всегда будет решением с максимальной краткосрочной материальной выгодой.

Примеры из реальной жизни

В некоторых телевикторинах подобный принцип применяется для определения победителей или раунда, или финала. Пример дилеммы демонстрировался в 2012 году в британской телевикторине The Bank Job в финале каждого сезона: двум игрокам, вышедшим в финал, предстояло принять решение о том, как распорядиться выигрышем. По половине от суммарного разыгрываемого джекпота лежало в чемоданах с надписью CASH, в двух других были газетные обрывки с надписью TRASH (у игрока по одному чемодану каждого типа). Каждый игрок должен был взять один из своих чемоданов и отдать другому. Если оба игрока получали чемоданы CASH, то делили выигрыш пополам. Если один отдавал чемодан TRASH, то он забирал весь банк игры. Если оба отдавали TRASH — оба оставались без денег, а выигрыш доставался выбывшим на предыдущих этапах игрокам финала.

Примеры с заключёнными, карточной игрой и обменом закрытыми сумками могут показаться надуманными, но на самом деле есть множество примеров взаимодействия людей и животных, имеющие такую же матрицу выигрышей. Поэтому дилемма заключённого интересна социальным наукам, таким как экономика, политология и социология, а также разделам биологии — этологии и эволюционной биологии. Многие природные процессы были обобщены в модели, в которых живые существа участвуют в бесконечных играх типа дилеммы заключённого. Такая широкая применимость дилеммы придаёт этой игре значительную важность.

В политическом реализме, к примеру, сценарий дилеммы часто используется для иллюстрации проблемы двух государств, вовлечённых в гонку вооружений. Оба государства будут заявлять, что у них есть две возможности: либо увеличить расходы на военные нужды, либо сокращать вооружения. При этом очевидным образом выполняются постулаты дилеммы заключённого (D > C > d > c):

  • D — «мы вооружились, а противник — нет» — наилучший исход, наибольшая безопасность;
  • C — «никто не вооружился» — следующий по предпочтительности исход;
  • d — «оба вооружились» — плохо, но не катастрофично;
  • c — «мы не вооружились, а противник вооружился» — катастрофический исход.

С точки зрения стороны А, если сторона Б не вооружается, то для А выбор идёт между D и C — лучше вооружаться. Если же Б вооружается, то для А выбор идёт между d и c — опять-таки выгоднее вооружаться. Тем самым при любом выборе Б для стороны А выгоднее вооружаться. Ситуация для стороны Б совершенно аналогична и в итоге обе стороны будут стремиться к военной экспансии.

Уильям Паундстоун в книге о дилемме заключённого описывает ситуацию в Новой Зеландии, где газетные ящики оставляют открытыми. Газету можно взять, не заплатив за неё, но мало кто так делает, потому что большинство осознаёт вред, который был бы, если бы все воровали газеты. Поскольку дилемма заключённого в чистом виде одновременна для всех игроков (никто не может повлиять на решения других), эта распространённая линия рассуждений называется «магическое мышление». Будучи объяснением отсутствия мелкого воровства, магическое мышление объясняет добровольное голосование на выборах (когда неголосующий считается ). В качестве альтернативы, это поведение может объясняться ожиданием будущих действий (и не требовать связи с «магическим мышлением»). Моделирование будущих действий требует добавление измерения времени, что делается в повторяющейся дилемме.

Теоретическое заключение дилеммы — одна из причин, почему во многих странах сделка о признании вины запрещена. Часто сценарий дилеммы повторяется очень точно: в интересах обоих подозреваемых сознаться и свидетельствовать против другого подозреваемого, даже если оба невиновны. Возможно, наихудший случай — когда только один виноват, в этом случае невиновный вряд ли сознаётся в чём-либо, а виновный пойдёт на это и даст показания против невиновного.[источник не указан 2860 дней]

Многие дилеммы в реальной жизни включают множество игроков. Хотя и метафорическую, «трагедию общин» Хардина можно рассматривать как обобщение дилеммы для множества игроков. Каждый житель общины выбирает — пасти ли скот на общем пастбище и получить выгоду, истощая его , либо ограничить свой доход. Коллективный результат от всеобщего (или частого) максимального использования пастбища — низкий доход (ведущий к разрушению общины). Однако такая игра не является формальной, поскольку может быть разбита на последовательность классических игр с 2 участниками.[источник не указан 2860 дней]

Повторяющаяся дилемма заключённого

В книге «Эволюция кооперации» 1984 года Роберт Аксельрод исследовал расширение сценария дилеммы, которое он назвал повторяющаяся дилемма заключённого (ПДЗ). В ней участники делают выбор снова раз за разом и помнят предыдущие результаты. Аксельрод пригласил академических коллег со всего мира, чтобы разработать компьютерные стратегии, чтобы соревноваться в чемпионате по ПДЗ. Программы, вошедшие в него, различались по алгоритмической сложности, начальной враждебности, способности к прощению и так далее.

Аксельрод открыл, что если игра повторялась долго среди множества игроков, каждый с разными стратегиями, «жадные» стратегии давали плохие результаты в долгосрочном периоде, тогда как более «альтруистические» стратегии работали лучше, с точки зрения собственного интереса. Он использовал это, чтобы показать возможный механизм эволюции альтруистического поведения из механизмов, которые изначально чисто эгоистические, через естественный отбор.

Лучшей детерминистской стратегией оказалась «Око за око» (англ. Tit for Tat), которую разработал и выставил на чемпионат Анатолий Рапопорт. Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке Бейсик. Стратегия проста: сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт, на следующем шаге игрок иногда, вне зависимости от предыдущего шага, сотрудничает с небольшой вероятностью (1—5 %). Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится недопонимание — когда решение одного игрока сообщается другому с ошибкой.

Анализируя стратегии, набравшие лучшие результаты, Аксельрод назвал несколько условий, необходимых, чтобы стратегия получила высокий результат:

  • Добрая. Важнейшее условие — стратегия должна быть «доброй», то есть не предавать, пока этого не сделает оппонент. Почти все стратегии-лидеры были добрыми. Поэтому чисто эгоистичная стратегия по чисто эгоистическим причинам не будет первой «бить» соперника.
  • Мстительная. Успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить. Пример прощающей стратегии — всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» стратегии воспользуются этим.
  • Прощающая. Другое важное качество успешных стратегий — уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш.
  • Независтливая. Последнее качество — не быть завистливым, то есть не пытаться набрать больше очков, чем оппонент.

Таким образом, Аксельрод пришёл к утопично звучащему выводу, что эгоистичные индивиды во имя их же эгоистического блага будут стремиться быть добрыми, прощающими и независтливыми.

Рассмотрим снова модель гонки вооружений. Был дан вывод, что единственная рациональная стратегия — вооружаться, даже если обе страны хотели бы тратить ВВП на масло, а не пушки. Интересно, что попытки продемонстрировать, что вывод дилеммы работает на практике (делая анализ «высоких» и «низких» военных расходов между периодами, на основе предположений ПДЗ), часто показывают, что такого поведения не происходит (например, греческие и турецкие военные расходы меняются не в соответствии со стратегией «око за око», а, вероятнее всего, следуют внутренней политике). Это может быть примером рационального поведения, отличающегося от одноразовой и многоходовой игр.

Если в одноходовой игре в любом случае доминирует стратегия предать, то в многоходовой оптимальная стратегия зависит от поведения других участников. К примеру, если среди населения все друг друга обманывают, а один ведёт себя по принципу «око за око», он оказывается в небольшом проигрыше из-за потери на первом ходе. В такой популяции оптимальная стратегия — всегда предавать. Если же число исповедующих принцип «око за око» больше, то результат уже зависит от их доли в обществе.

Определить оптимальную стратегию можно двумя путями:

  • равновесие Байеса-Нэша: если определено статистическое распределение встречаемого поведения (например, 33 % «око за око», 33 % всегда обманывают и 33 % всегда сотрудничают), то стратегию можно вычислить математически. Этим детально занимается ;
  • по методу Монте-Карло делались симуляции популяций, где индивиды с низкими результатами вымирали, а с высокими воспроизводились (использовался генетический алгоритм поиска оптимальной эволюционно стабильной стратегии). Структура поведения в конечной популяции зависит от структуры в начале.

Хотя стратегия «око за око» считалась самой удачной простой стратегией, команда университета Саутгемптона под руководством профессора Николаса Дженнингса представила новую стратегию на 20-ю годовщину Чемпионата по ПДЗ. Эта стратегия оказалась более успешной, чем «око за око». Она основывалась на взаимодействии между программами, чтобы получить максимальный счёт для одной из них. Университет выставил на чемпионат 60 программ, которые распознавали друг друга по ряду действий на первых 5—10 ходах. Узнав другую, одна программа всегда сотрудничала, а другая предавала, что давало максимум очков предателю. Если программа понимала, что оппонент — не саутгемптонский, она дальше всё время предавала его, чтобы минимизировать результат соперника. В результате эта стратегия заняла первые три места в соревновании, как и несколько мест подряд ниже.

Хотя эта эволюционно стабильная стратегия оказалась более эффективной в соревновании, это было достигнуто за счёт того, что в этом конкретном соревновании команда могла участвовать несколькими агентами. Если игрок может контролировать только одного агента, «око за око» оказывается лучшей. Она также соблюдает правило запрета на коммуникации между игроками. То, что саутгемптонские программы исполняли «ритуальный танец» в первые 10 ходов, чтобы узнать друг друга, только подтверждает, насколько важна коммуникация в сдвиге баланса игры.

Если ПДЗ играется ровно N раз (некая известная константа N), есть ещё один интересный факт. Равновесие Нэша — всегда предавать. Доказываем по индукции: если оба сотрудничают, на последнем ходу выгодно предать, тогда у соперника не будет возможности отомстить. Поэтому оба предадут друг друга на последнем ходу. Раз соперник предаст на последнем ходу в любом случае, любой игрок захочет предать на предпоследнем ходу, и так далее. Чтобы сотрудничество оставалось выгодным, необходимо, чтобы будущее было неопределённым для обоих игроков. Одно из решений — делать число N случайным и подсчитывать результаты по среднему выигрышу за ход.

Дилемма заключённого — фундаментальная для некоторых теорий о взаимодействии людей и доверии. Из предположения модели дилеммы, что транзакция между двумя людьми требует доверия, доверительное поведение в популяциях может быть смоделировано при помощи многоигроковой повторяющейся версии игры. Это годами вдохновляло многих учёных. В 1975 году Грофман и Пул оценивали число работ, посвящённых этой теме, в количестве около 2000.

Психология обучения и теория игр

Если игроки могут оценивать возможность предательства со стороны других игроков, на их поведение влияет опыт. Простая статистика показывает, что неопытные игроки обычно ведут себя чрезмерно хорошо или плохо. Если они всё время будут действовать так, то проиграют из-за своей излишней агрессивности или излишней доброты. С получением большего опыта они реальнее оценивают вероятность предательства и добиваются лучших результатов. Ранние розыгрыши сильнее влияют на неопытных игроков, чем более поздние на опытных. Это пример, почему ранний опыт имеет такое влияние на молодых, и почему они особенно уязвимы для немотивированной агрессии, иногда сами становясь такими же.

Можно уменьшить вероятность предательства в популяции при помощи сотрудничества в ранних играх, позволив укрепить доверие. Следовательно, самопожертвование может в некоторых ситуациях усилить моральный дух группы. Если группа маленькая, на позитивное поведение с большей вероятностью ответят взаимностью, что поощрит индивидов на дальнейшее сотрудничество. Это связано с ещё одной дилеммой, что хорошее отношение без причины — это потакание, которое может ухудшить моральные качества.

Эти процессы — главное поле интереса взаимного альтруизма, группового отбора, и этики.

Влияние религии

Религиозные представления существенно повышают степень сотрудничества между игроками. В проведенных исследованиях, даже неявное упоминание религиозных слов в предварительном задании перед игрой приводило к существенному повышению просоциального поведения.

См. также

  • Доверие
  • Парадокс неожиданной казни
  • Парадокс сатанинской бутылки Стивенсона
  • Охота на оленя
  • Задача трёх узников
  • Социальные дилеммы

Примечания

  1. Подсказка, что, например, красный игрок собирается играть картой «сотрудничать» не меняет того факта, что «предать» является строго доминирующей стратегией. Если рассматривать только игру, возможность коммуникации не играет какой-либо роли. Однако если игра играется в реальной жизни, рассуждения, лежащие вне самой игры, могут привести к тому, что сотрудничество произойдёт. Это очень важный момент в выводах игры, что если нам не нужно принимать во внимание посторонние факторы, одноразовая «дилемма заключённого» не меняется от коммуникации.
  2. Хофштадтер, Дуглас. Глава 29 // Метамагические вопросы: в поиске сущности сознания и шаблона = Metamagical Themas: questing for the essence of mind and pattern. — Bantam Dell Pub Group, 1985. — ISBN 0-465-04566-9.
  3. Genie Baker. The Harmony of Interests Revisited Архивная копия от 12 июня 2010 на Wayback Machine. // Market Realism: Differentially Risky Currencies and the Gains from Trade under the Liberal Economic Order. (англ.)
  4. В экономических учебниках кривая производственных возможностей иллюстрируется выбором между всего двумя товарами: маслом и пушками.
  5. «Равновесие Байеса-Нэша; статистический тест гипотезы» Архивировано 2 октября 2005 года.
  6. Professor Nick Jennings Архивная копия от 10 апреля 2006 на Wayback Machine (англ.)
  7. Результаты турнира по Дилемме заключённого 2004 Архивная копия от 29 августа 2006 на Wayback Machine (англ.) показывают, что команда университета Саутгемптона заняла первые три места, хотя имела меньше выигрышей, чем стратегия GRIM (в турнире нужно было выигрывать не отдельные матчи; это достижимо и простым частым предательством). И без подразумеваемого сговора между стратегиями, которым злоупотребила саутгемптонская команда, «око за око» не всегда является абсолютным победителем любого соревнования. Иными словами, в долгосрочном периоде в ряде разных чемпионатов она покажет лучшие результаты, чем соперники, а в отдельно взятом чемпионате стратегию можно немного лучше подстроить к соревнованию, чем «око за око». То же самое относится и к ОЗО с прощением: в отдельно взятом соревновании она может проиграть специально заточенным стратегиям. Альтернативой является использование симуляции эволюции. В ней ОЗО придёт к доминированию, а злые стратегии будут от случая к случаю появляться и исчезать из популяции. Ричард Докинз показал, что нет статической комбинации стратегий, которая была бы стабильным равновесием, и система будет колебаться между границами.
  8. Аргумент о развитии сотрудничества через доверие приводится в книге «Мудрость толп» , где утверждается, что в долгосрочном периоде капитализм смог организоваться вокруг ядра квакеров, которые всегда работали честно со своими партнёрами (вместо того, чтобы обманывать и нарушать обещания — явление, которое останавливало более ранние заключения долгосрочных добровольных международных контактов).[уточнить] Утверждается, что сделки с надёжными купцами позволили культуре честного поведения (сотрудничества) распространиться среди других торговцев, которые распространяли её дальше, пока не стало выгодно вообще быть честным.
  9. Ali M. Ahmed, Osvaldo Salas. Implicit influences of Christian religious representations on dictator and prisoner's dilemma game decisions // The Journal of Socio-Economics. — 2011-05-01. — Т. 40, вып. 3. — С. 242–246. — doi:10.1016/j.socec.2010.12.013. Архивировано 25 августа 2011 года.

Литература

  • Axelrod, Robert and Hamilton, William D. (1981). «The Evolution of Cooperation». Science, 211 : 1390—1396.
  • , Роберт Аксельрод, Basic Books, ISBN 0-465-02121-2
  • Axelrod, Robert (1997). The Complexity of Cooperation. Princeton University Press. ISBN 0-691-01567-8.
  • Эгоистичный ген, Ричард Докинз (1990), ISBN 0-19-286092-5
  • Grofman and Pool (1975). «Bayesian Models for Iterated Prisoner’s Dilemma Games». General Systems 20 : 185—94.
  • Hardin, Garrett (1968). «The Tragedy of the Commons». Science, 162 : 1243—1248.
  • Kreps, David, Robert Wilson, Paul Milgrom, and John Roberts (1982). «Rational Cooperation in the Finitely Repeated Prisoners' Dilemma.» Journal of Economic Theory 27(2) : 245—52.
  • Milgrom, Paul (1984). «Axelrod’s The Evolution of Cooperation.» Rand Journal of Economics 15(2) : 30—59.
  • Poundstone, William (1992). Prisoner’s Dilemma: John von Neumann, Game Theory, and the Puzzle of the Bomb. Doubleday. ISBN 0-385-41567-2.
  • Rapoport, Anatol and Chammah, Albert M. (1965). Prisoner’s Dilemma. University of Michigan Press.
  • Verhoeff, Tom (1998). «The Trader’s Dilemma: A Continuous Version of the Prisoner’s Dilemma». Computing Science Notes 93/02
  • New Tack Wins Prisoner’s Dilemma

Ссылки

  • Repeated Prisoner’s Dilemma Applet (англ.)
  • Play the prisoner’s dilemma game (англ.)
  • The Prisoner’s Dilemma (англ.)

Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер, Информация о Дилемма заключённого, Что такое Дилемма заключённого? Что означает Дилемма заключённого?

Dile mma zaklyuchyonnogo angl Prisoner s dilemma rezhe upotreblyaetsya nazvanie dilemma bandi ta fundamentalnaya problema v teorii igr soglasno kotoroj racionalnye igroki ne vsegda budut sotrudnichat drug s drugom dazhe esli eto v ih interesah Predpolagaetsya chto igrok zaklyuchyonnyj maksimiziruet svoj sobstvennyj vyigrysh ne zabotyas o vygode drugih Illyustraciya k dilemme zaklyuchennyh Sut problemy byla sformulirovana angl i angl v 1950 godu Nazvanie dilemme dal matematik Albert Taker V dilemme zaklyuchyonnogo predatelstvo strogo dominiruet nad sotrudnichestvom poetomu edinstvennoe vozmozhnoe ravnovesie predatelstvo oboih uchastnikov Proshe govorya kakim by ni bylo povedenie drugogo igroka kazhdyj vyigraet bolshe esli predast Poskolku v lyuboj situacii predat vygodnee chem sotrudnichat vse racionalnye igroki vyberut predatelstvo Vedya sebya po otdelnosti racionalno vmeste uchastniki prihodyat k neracionalnomu resheniyu esli oba predadut oni poluchat v summe menshij vyigrysh chem esli by sotrudnichali edinstvennoe ravnovesie v etoj igre ne vedyot k Pareto optimalnomu resheniyu V etom i zaklyuchaetsya dilemma V povtoryayushejsya dilemme zaklyuchyonnogo igra proishodit periodicheski i kazhdyj igrok mozhet nakazat drugogo za nesotrudnichestvo ranee V takoj igre sotrudnichestvo mozhet stat ravnovesiem a stimul predat mozhet pereveshivatsya ugrozoj nakazaniya s rostom chisla iteracij ravnovesie Nesha stremitsya k Pareto optimumu Klassicheskaya dilemma zaklyuchyonnogoVo vseh sudebnyh sistemah kara za banditizm sovershenie prestuplenij v sostave organizovannoj gruppy namnogo zhestche chem za te zhe prestupleniya sovershyonnye v odinochku otsyuda nazvanie dilemma bandita Klassicheskaya formulirovka dilemmy zaklyuchyonnogo takova Dvoe prestupnikov A i B popalis primerno v odno i to zhe vremya na shodnyh prestupleniyah Est osnovaniya polagat chto oni dejstvovali po sgovoru i policiya izolirovav ih drug ot druga predlagaet im odnu i tu zhe sdelku esli odin svidetelstvuet protiv drugogo a tot hranit molchanie to pervyj osvobozhdaetsya za pomosh sledstviyu a vtoroj poluchaet maksimalnyj srok lisheniya svobody 10 let Esli oba molchat ih deyanie prohodit po bolee lyogkoj state i kazhdyj iz nih prigovarivaetsya k polugodu tyurmy Esli oba svidetelstvuyut drug protiv druga oni poluchayut minimalnyj srok po 2 goda Kazhdyj zaklyuchyonnyj vybiraet molchat ili svidetelstvovat protiv drugogo Odnako ni odin iz nih ne znaet tochno chto sdelaet drugoj Chto proizojdyot Igru mozhno predstavit v vide sleduyushej tablicy Zaklyuchyonnyj B hranit molchanie Zaklyuchyonnyj B dayot pokazaniyaZaklyuchyonnyj A hranit molchanie Oba poluchayut po polgoda A poluchaet 10 let B osvobozhdaetsyaZaklyuchyonnyj A dayot pokazaniya A osvobozhdaetsya B poluchaet 10 let tyurmy Oba poluchayut po 2 goda tyurmy Dilemma zaklyuchyonnogo vnormalnoj forme Dilemma poyavlyaetsya esli predpolozhit chto oba zabotyatsya tolko o minimizacii sobstvennogo sroka zaklyucheniya Predstavim rassuzhdeniya odnogo iz uznikov Esli partnyor molchit to luchshe ego predat i vyjti na svobodu inache polgoda tyurmy Esli partnyor svidetelstvuet to luchshe tozhe svidetelstvovat protiv nego chtoby poluchit 2 goda inache 10 let tyurmy Strategiya svidetelstvovat strogo dominiruet nad strategiej molchat Analogichno drugoj uznik prihodit k tomu zhe vyvodu S tochki zreniya gruppy etih dvuh uznikov luchshe vsego sotrudnichat drug s drugom hranit molchanie i poluchit po polgoda tak kak eto umenshit summarnyj srok zaklyucheniya Lyuboe drugoe reshenie budet menee vygodnym Eto ochen naglyadno demonstriruet chto v igre s nenulevoj summoj Pareto optimum mozhet byt protivopolozhnym ravnovesiyu Nesha Obobshyonnaya formaSotrudnichat PredatSotrudnichat C C c DPredat D c d dKanonicheskaya matrica vyigryshej Dilemmy zaklyuchyonnogo Mozhno raskryt shemu igry dalee abstragirovavshis ot podteksta zaklyuchyonnyh Obobshyonnaya forma igry chasto ispolzuetsya v eksperimentalnoj ekonomike Sleduyushie pravila dayut tipichnuyu realizaciyu igry V igre dva igroka i bankir Kazhdyj igrok derzhit 2 karty na odnoj napisano sotrudnichat na drugoj predat eto standartnaya terminologiya igry Kazhdyj igrok kladyot odnu kartu pered bankirom licom vniz to est nikto ne znaet chuzhogo resheniya hotya znanie chuzhogo resheniya ne vliyaet na analiz dominirovaniya Bankir otkryvaet karty i vydayot vyigrysh Esli oba vybrali sotrudnichat oba poluchayut C Esli odin vybral predat drugoj sotrudnichat pervyj poluchaet D vtoroj s Esli oba vybrali predat oba poluchayut d Znacheniya peremennyh C D c d mogut byt lyubogo znaka v primere vyshe vse menshe libo ravny 0 Obyazatelno dolzhno soblyudatsya neravenstvo D gt C gt d gt c chtoby igra predstavlyala soboj dilemmu zaklyuchyonnogo Esli igra povtoryaetsya to est igraetsya bolshe 1 raza podryad obshij vyigrysh ot sotrudnichestva dolzhen byt bolshe summarnogo vyigrysha v situacii kogda odin predayot a drugoj net to est 2C gt D c Eto neravenstvo govorit o tom chto v sluchae vzaimnogo sotrudnichestva dostigaetsya strogij Pareto optimum situaciya kogda lyubaya alternativa privodit k snizheniyu vyigrysha hotya by dlya odnogo igroka Eti pravila byli ustanovleny Duglasom Hofshtadterom i obrazuyut kanonicheskoe opisanie tipichnoj dilemmy zaklyuchyonnogo Alternativnaya formulirovkaHofshtadter predpolozhil chto lyudi proshe ponimayut takie zadachi kak dilemma zaklyuchyonnogo esli ona predstavlena v vide otdelnoj igry ili processa torgovli Odin iz primerov obmen zakrytymi sumkami Dva cheloveka vstrechayutsya i obmenivayutsya zakrytymi sumkami ponimaya chto odna iz nih soderzhit dengi drugaya tovar Kazhdyj igrok mozhet uvazhat sdelku i polozhit v sumku to o chyom dogovorilis libo obmanut partnyora dav pustuyu sumku V etoj igre obman vsegda budet resheniem s maksimalnoj kratkosrochnoj materialnoj vygodoj Primery iz realnoj zhizniV nekotoryh televiktorinah podobnyj princip primenyaetsya dlya opredeleniya pobeditelej ili raunda ili finala Primer dilemmy demonstrirovalsya v 2012 godu v britanskoj televiktorine The Bank Job v finale kazhdogo sezona dvum igrokam vyshedshim v final predstoyalo prinyat reshenie o tom kak rasporyaditsya vyigryshem Po polovine ot summarnogo razygryvaemogo dzhekpota lezhalo v chemodanah s nadpisyu CASH v dvuh drugih byli gazetnye obryvki s nadpisyu TRASH u igroka po odnomu chemodanu kazhdogo tipa Kazhdyj igrok dolzhen byl vzyat odin iz svoih chemodanov i otdat drugomu Esli oba igroka poluchali chemodany CASH to delili vyigrysh popolam Esli odin otdaval chemodan TRASH to on zabiral ves bank igry Esli oba otdavali TRASH oba ostavalis bez deneg a vyigrysh dostavalsya vybyvshim na predydushih etapah igrokam finala Primery s zaklyuchyonnymi kartochnoj igroj i obmenom zakrytymi sumkami mogut pokazatsya nadumannymi no na samom dele est mnozhestvo primerov vzaimodejstviya lyudej i zhivotnyh imeyushie takuyu zhe matricu vyigryshej Poetomu dilemma zaklyuchyonnogo interesna socialnym naukam takim kak ekonomika politologiya i sociologiya a takzhe razdelam biologii etologii i evolyucionnoj biologii Mnogie prirodnye processy byli obobsheny v modeli v kotoryh zhivye sushestva uchastvuyut v beskonechnyh igrah tipa dilemmy zaklyuchyonnogo Takaya shirokaya primenimost dilemmy pridayot etoj igre znachitelnuyu vazhnost V politicheskom realizme k primeru scenarij dilemmy chasto ispolzuetsya dlya illyustracii problemy dvuh gosudarstv vovlechyonnyh v gonku vooruzhenij Oba gosudarstva budut zayavlyat chto u nih est dve vozmozhnosti libo uvelichit rashody na voennye nuzhdy libo sokrashat vooruzheniya Pri etom ochevidnym obrazom vypolnyayutsya postulaty dilemmy zaklyuchyonnogo D gt C gt d gt c D my vooruzhilis a protivnik net nailuchshij ishod naibolshaya bezopasnost C nikto ne vooruzhilsya sleduyushij po predpochtitelnosti ishod d oba vooruzhilis ploho no ne katastrofichno c my ne vooruzhilis a protivnik vooruzhilsya katastroficheskij ishod S tochki zreniya storony A esli storona B ne vooruzhaetsya to dlya A vybor idyot mezhdu D i C luchshe vooruzhatsya Esli zhe B vooruzhaetsya to dlya A vybor idyot mezhdu d i c opyat taki vygodnee vooruzhatsya Tem samym pri lyubom vybore B dlya storony A vygodnee vooruzhatsya Situaciya dlya storony B sovershenno analogichna i v itoge obe storony budut stremitsya k voennoj ekspansii Uilyam Paundstoun v knige o dilemme zaklyuchyonnogo opisyvaet situaciyu v Novoj Zelandii gde gazetnye yashiki ostavlyayut otkrytymi Gazetu mozhno vzyat ne zaplativ za neyo no malo kto tak delaet potomu chto bolshinstvo osoznayot vred kotoryj byl by esli by vse vorovali gazety Poskolku dilemma zaklyuchyonnogo v chistom vide odnovremenna dlya vseh igrokov nikto ne mozhet povliyat na resheniya drugih eta rasprostranyonnaya liniya rassuzhdenij nazyvaetsya magicheskoe myshlenie Buduchi obyasneniem otsutstviya melkogo vorovstva magicheskoe myshlenie obyasnyaet dobrovolnoe golosovanie na vyborah kogda negolosuyushij schitaetsya V kachestve alternativy eto povedenie mozhet obyasnyatsya ozhidaniem budushih dejstvij i ne trebovat svyazi s magicheskim myshleniem Modelirovanie budushih dejstvij trebuet dobavlenie izmereniya vremeni chto delaetsya v povtoryayushejsya dilemme Teoreticheskoe zaklyuchenie dilemmy odna iz prichin pochemu vo mnogih stranah sdelka o priznanii viny zapreshena Chasto scenarij dilemmy povtoryaetsya ochen tochno v interesah oboih podozrevaemyh soznatsya i svidetelstvovat protiv drugogo podozrevaemogo dazhe esli oba nevinovny Vozmozhno naihudshij sluchaj kogda tolko odin vinovat v etom sluchae nevinovnyj vryad li soznayotsya v chyom libo a vinovnyj pojdyot na eto i dast pokazaniya protiv nevinovnogo istochnik ne ukazan 2860 dnej Mnogie dilemmy v realnoj zhizni vklyuchayut mnozhestvo igrokov Hotya i metaforicheskuyu tragediyu obshin Hardina mozhno rassmatrivat kak obobshenie dilemmy dlya mnozhestva igrokov Kazhdyj zhitel obshiny vybiraet pasti li skot na obshem pastbishe i poluchit vygodu istoshaya ego libo ogranichit svoj dohod Kollektivnyj rezultat ot vseobshego ili chastogo maksimalnogo ispolzovaniya pastbisha nizkij dohod vedushij k razrusheniyu obshiny Odnako takaya igra ne yavlyaetsya formalnoj poskolku mozhet byt razbita na posledovatelnost klassicheskih igr s 2 uchastnikami istochnik ne ukazan 2860 dnej Povtoryayushayasya dilemma zaklyuchyonnogoV knige Evolyuciya kooperacii 1984 goda Robert Akselrod issledoval rasshirenie scenariya dilemmy kotoroe on nazval povtoryayushayasya dilemma zaklyuchyonnogo PDZ V nej uchastniki delayut vybor snova raz za razom i pomnyat predydushie rezultaty Akselrod priglasil akademicheskih kolleg so vsego mira chtoby razrabotat kompyuternye strategii chtoby sorevnovatsya v chempionate po PDZ Programmy voshedshie v nego razlichalis po algoritmicheskoj slozhnosti nachalnoj vrazhdebnosti sposobnosti k prosheniyu i tak dalee Akselrod otkryl chto esli igra povtoryalas dolgo sredi mnozhestva igrokov kazhdyj s raznymi strategiyami zhadnye strategii davali plohie rezultaty v dolgosrochnom periode togda kak bolee altruisticheskie strategii rabotali luchshe s tochki zreniya sobstvennogo interesa On ispolzoval eto chtoby pokazat vozmozhnyj mehanizm evolyucii altruisticheskogo povedeniya iz mehanizmov kotorye iznachalno chisto egoisticheskie cherez estestvennyj otbor Luchshej deterministskoj strategiej okazalas Oko za oko angl Tit for Tat kotoruyu razrabotal i vystavil na chempionat Anatolij Rapoport Ona byla prostejshej iz vseh uchastvovavshih programm sostoyala vsego iz 4 strok koda na yazyke Bejsik Strategiya prosta sotrudnichat na pervoj iteracii igry posle etogo igrok delaet to zhe samoe chto delal opponent na predydushem shage Chut luchshe rabotaet strategiya Oko za oko s prosheniem Kogda opponent predayot na sleduyushem shage igrok inogda vne zavisimosti ot predydushego shaga sotrudnichaet s nebolshoj veroyatnostyu 1 5 Eto pozvolyaet sluchajnym obrazom vyjti iz cikla vzaimnogo predatelstva Ona luchshe vsego rabotaet kogda v igru vvoditsya nedoponimanie kogda reshenie odnogo igroka soobshaetsya drugomu s oshibkoj Analiziruya strategii nabravshie luchshie rezultaty Akselrod nazval neskolko uslovij neobhodimyh chtoby strategiya poluchila vysokij rezultat Dobraya Vazhnejshee uslovie strategiya dolzhna byt dobroj to est ne predavat poka etogo ne sdelaet opponent Pochti vse strategii lidery byli dobrymi Poetomu chisto egoistichnaya strategiya po chisto egoisticheskim prichinam ne budet pervoj bit sopernika Mstitelnaya Uspeshnaya strategiya ne dolzhna byt slepym optimistom Ona dolzhna vsegda mstit Primer proshayushej strategii vsegda sotrudnichat Eto ochen plohoj vybor poskolku podlye strategii vospolzuyutsya etim Proshayushaya Drugoe vazhnoe kachestvo uspeshnyh strategij umet proshat Otomstiv oni dolzhny vernutsya k sotrudnichestvu esli opponent ne prodolzhaet predavat Eto predotvrashaet beskonechnoe mshenie drug drugu i maksimiziruet vyigrysh Nezavistlivaya Poslednee kachestvo ne byt zavistlivym to est ne pytatsya nabrat bolshe ochkov chem opponent Takim obrazom Akselrod prishyol k utopichno zvuchashemu vyvodu chto egoistichnye individy vo imya ih zhe egoisticheskogo blaga budut stremitsya byt dobrymi proshayushimi i nezavistlivymi Rassmotrim snova model gonki vooruzhenij Byl dan vyvod chto edinstvennaya racionalnaya strategiya vooruzhatsya dazhe esli obe strany hoteli by tratit VVP na maslo a ne pushki Interesno chto popytki prodemonstrirovat chto vyvod dilemmy rabotaet na praktike delaya analiz vysokih i nizkih voennyh rashodov mezhdu periodami na osnove predpolozhenij PDZ chasto pokazyvayut chto takogo povedeniya ne proishodit naprimer grecheskie i tureckie voennye rashody menyayutsya ne v sootvetstvii so strategiej oko za oko a veroyatnee vsego sleduyut vnutrennej politike Eto mozhet byt primerom racionalnogo povedeniya otlichayushegosya ot odnorazovoj i mnogohodovoj igr Esli v odnohodovoj igre v lyubom sluchae dominiruet strategiya predat to v mnogohodovoj optimalnaya strategiya zavisit ot povedeniya drugih uchastnikov K primeru esli sredi naseleniya vse drug druga obmanyvayut a odin vedyot sebya po principu oko za oko on okazyvaetsya v nebolshom proigryshe iz za poteri na pervom hode V takoj populyacii optimalnaya strategiya vsegda predavat Esli zhe chislo ispoveduyushih princip oko za oko bolshe to rezultat uzhe zavisit ot ih doli v obshestve Opredelit optimalnuyu strategiyu mozhno dvumya putyami ravnovesie Bajesa Nesha esli opredeleno statisticheskoe raspredelenie vstrechaemogo povedeniya naprimer 33 oko za oko 33 vsegda obmanyvayut i 33 vsegda sotrudnichayut to strategiyu mozhno vychislit matematicheski Etim detalno zanimaetsya po metodu Monte Karlo delalis simulyacii populyacij gde individy s nizkimi rezultatami vymirali a s vysokimi vosproizvodilis ispolzovalsya geneticheskij algoritm poiska optimalnoj evolyucionno stabilnoj strategii Struktura povedeniya v konechnoj populyacii zavisit ot struktury v nachale Hotya strategiya oko za oko schitalas samoj udachnoj prostoj strategiej komanda universiteta Sautgemptona pod rukovodstvom professora Nikolasa Dzhenningsa predstavila novuyu strategiyu na 20 yu godovshinu Chempionata po PDZ Eta strategiya okazalas bolee uspeshnoj chem oko za oko Ona osnovyvalas na vzaimodejstvii mezhdu programmami chtoby poluchit maksimalnyj schyot dlya odnoj iz nih Universitet vystavil na chempionat 60 programm kotorye raspoznavali drug druga po ryadu dejstvij na pervyh 5 10 hodah Uznav druguyu odna programma vsegda sotrudnichala a drugaya predavala chto davalo maksimum ochkov predatelyu Esli programma ponimala chto opponent ne sautgemptonskij ona dalshe vsyo vremya predavala ego chtoby minimizirovat rezultat sopernika V rezultate eta strategiya zanyala pervye tri mesta v sorevnovanii kak i neskolko mest podryad nizhe Hotya eta evolyucionno stabilnaya strategiya okazalas bolee effektivnoj v sorevnovanii eto bylo dostignuto za schyot togo chto v etom konkretnom sorevnovanii komanda mogla uchastvovat neskolkimi agentami Esli igrok mozhet kontrolirovat tolko odnogo agenta oko za oko okazyvaetsya luchshej Ona takzhe soblyudaet pravilo zapreta na kommunikacii mezhdu igrokami To chto sautgemptonskie programmy ispolnyali ritualnyj tanec v pervye 10 hodov chtoby uznat drug druga tolko podtverzhdaet naskolko vazhna kommunikaciya v sdvige balansa igry Esli PDZ igraetsya rovno N raz nekaya izvestnaya konstanta N est eshyo odin interesnyj fakt Ravnovesie Nesha vsegda predavat Dokazyvaem po indukcii esli oba sotrudnichayut na poslednem hodu vygodno predat togda u sopernika ne budet vozmozhnosti otomstit Poetomu oba predadut drug druga na poslednem hodu Raz sopernik predast na poslednem hodu v lyubom sluchae lyuboj igrok zahochet predat na predposlednem hodu i tak dalee Chtoby sotrudnichestvo ostavalos vygodnym neobhodimo chtoby budushee bylo neopredelyonnym dlya oboih igrokov Odno iz reshenij delat chislo N sluchajnym i podschityvat rezultaty po srednemu vyigryshu za hod Dilemma zaklyuchyonnogo fundamentalnaya dlya nekotoryh teorij o vzaimodejstvii lyudej i doverii Iz predpolozheniya modeli dilemmy chto tranzakciya mezhdu dvumya lyudmi trebuet doveriya doveritelnoe povedenie v populyaciyah mozhet byt smodelirovano pri pomoshi mnogoigrokovoj povtoryayushejsya versii igry Eto godami vdohnovlyalo mnogih uchyonyh V 1975 godu Grofman i Pul ocenivali chislo rabot posvyashyonnyh etoj teme v kolichestve okolo 2000 Psihologiya obucheniya i teoriya igr Esli igroki mogut ocenivat vozmozhnost predatelstva so storony drugih igrokov na ih povedenie vliyaet opyt Prostaya statistika pokazyvaet chto neopytnye igroki obychno vedut sebya chrezmerno horosho ili ploho Esli oni vsyo vremya budut dejstvovat tak to proigrayut iz za svoej izlishnej agressivnosti ili izlishnej dobroty S polucheniem bolshego opyta oni realnee ocenivayut veroyatnost predatelstva i dobivayutsya luchshih rezultatov Rannie rozygryshi silnee vliyayut na neopytnyh igrokov chem bolee pozdnie na opytnyh Eto primer pochemu rannij opyt imeet takoe vliyanie na molodyh i pochemu oni osobenno uyazvimy dlya nemotivirovannoj agressii inogda sami stanovyas takimi zhe Mozhno umenshit veroyatnost predatelstva v populyacii pri pomoshi sotrudnichestva v rannih igrah pozvoliv ukrepit doverie Sledovatelno samopozhertvovanie mozhet v nekotoryh situaciyah usilit moralnyj duh gruppy Esli gruppa malenkaya na pozitivnoe povedenie s bolshej veroyatnostyu otvetyat vzaimnostyu chto pooshrit individov na dalnejshee sotrudnichestvo Eto svyazano s eshyo odnoj dilemmoj chto horoshee otnoshenie bez prichiny eto potakanie kotoroe mozhet uhudshit moralnye kachestva Eti processy glavnoe pole interesa vzaimnogo altruizma gruppovogo otbora i etiki Vliyanie religiiReligioznye predstavleniya sushestvenno povyshayut stepen sotrudnichestva mezhdu igrokami V provedennyh issledovaniyah dazhe neyavnoe upominanie religioznyh slov v predvaritelnom zadanii pered igroj privodilo k sushestvennomu povysheniyu prosocialnogo povedeniya Sm takzheDoverie Paradoks neozhidannoj kazni Paradoks sataninskoj butylki Stivensona Ohota na olenya Zadacha tryoh uznikov Socialnye dilemmyPrimechaniyaPodskazka chto naprimer krasnyj igrok sobiraetsya igrat kartoj sotrudnichat ne menyaet togo fakta chto predat yavlyaetsya strogo dominiruyushej strategiej Esli rassmatrivat tolko igru vozmozhnost kommunikacii ne igraet kakoj libo roli Odnako esli igra igraetsya v realnoj zhizni rassuzhdeniya lezhashie vne samoj igry mogut privesti k tomu chto sotrudnichestvo proizojdyot Eto ochen vazhnyj moment v vyvodah igry chto esli nam ne nuzhno prinimat vo vnimanie postoronnie faktory odnorazovaya dilemma zaklyuchyonnogo ne menyaetsya ot kommunikacii Hofshtadter Duglas Glava 29 Metamagicheskie voprosy v poiske sushnosti soznaniya i shablona Metamagical Themas questing for the essence of mind and pattern Bantam Dell Pub Group 1985 ISBN 0 465 04566 9 Genie Baker The Harmony of Interests Revisited Arhivnaya kopiya ot 12 iyunya 2010 na Wayback Machine Market Realism Differentially Risky Currencies and the Gains from Trade under the Liberal Economic Order angl V ekonomicheskih uchebnikah krivaya proizvodstvennyh vozmozhnostej illyustriruetsya vyborom mezhdu vsego dvumya tovarami maslom i pushkami Ravnovesie Bajesa Nesha statisticheskij test gipotezy Arhivirovano 2 oktyabrya 2005 goda Professor Nick Jennings Arhivnaya kopiya ot 10 aprelya 2006 na Wayback Machine angl Rezultaty turnira po Dilemme zaklyuchyonnogo 2004 Arhivnaya kopiya ot 29 avgusta 2006 na Wayback Machine angl pokazyvayut chto komanda universiteta Sautgemptona zanyala pervye tri mesta hotya imela menshe vyigryshej chem strategiya GRIM v turnire nuzhno bylo vyigryvat ne otdelnye matchi eto dostizhimo i prostym chastym predatelstvom I bez podrazumevaemogo sgovora mezhdu strategiyami kotorym zloupotrebila sautgemptonskaya komanda oko za oko ne vsegda yavlyaetsya absolyutnym pobeditelem lyubogo sorevnovaniya Inymi slovami v dolgosrochnom periode v ryade raznyh chempionatov ona pokazhet luchshie rezultaty chem soperniki a v otdelno vzyatom chempionate strategiyu mozhno nemnogo luchshe podstroit k sorevnovaniyu chem oko za oko To zhe samoe otnositsya i k OZO s prosheniem v otdelno vzyatom sorevnovanii ona mozhet proigrat specialno zatochennym strategiyam Alternativoj yavlyaetsya ispolzovanie simulyacii evolyucii V nej OZO pridyot k dominirovaniyu a zlye strategii budut ot sluchaya k sluchayu poyavlyatsya i ischezat iz populyacii Richard Dokinz pokazal chto net staticheskoj kombinacii strategij kotoraya byla by stabilnym ravnovesiem i sistema budet kolebatsya mezhdu granicami Argument o razvitii sotrudnichestva cherez doverie privoditsya v knige Mudrost tolp gde utverzhdaetsya chto v dolgosrochnom periode kapitalizm smog organizovatsya vokrug yadra kvakerov kotorye vsegda rabotali chestno so svoimi partnyorami vmesto togo chtoby obmanyvat i narushat obeshaniya yavlenie kotoroe ostanavlivalo bolee rannie zaklyucheniya dolgosrochnyh dobrovolnyh mezhdunarodnyh kontaktov utochnit Utverzhdaetsya chto sdelki s nadyozhnymi kupcami pozvolili kulture chestnogo povedeniya sotrudnichestva rasprostranitsya sredi drugih torgovcev kotorye rasprostranyali eyo dalshe poka ne stalo vygodno voobshe byt chestnym Ali M Ahmed Osvaldo Salas Implicit influences of Christian religious representations on dictator and prisoner s dilemma game decisions The Journal of Socio Economics 2011 05 01 T 40 vyp 3 S 242 246 doi 10 1016 j socec 2010 12 013 Arhivirovano 25 avgusta 2011 goda LiteraturaAxelrod Robert and Hamilton William D 1981 The Evolution of Cooperation Science 211 1390 1396 Robert Akselrod Basic Books ISBN 0 465 02121 2 Axelrod Robert 1997 The Complexity of Cooperation Princeton University Press ISBN 0 691 01567 8 Egoistichnyj gen Richard Dokinz 1990 ISBN 0 19 286092 5 Grofman and Pool 1975 Bayesian Models for Iterated Prisoner s Dilemma Games General Systems 20 185 94 Hardin Garrett 1968 The Tragedy of the Commons Science 162 1243 1248 Kreps David Robert Wilson Paul Milgrom and John Roberts 1982 Rational Cooperation in the Finitely Repeated Prisoners Dilemma Journal of Economic Theory 27 2 245 52 Milgrom Paul 1984 Axelrod s The Evolution of Cooperation Rand Journal of Economics 15 2 30 59 Poundstone William 1992 Prisoner s Dilemma John von Neumann Game Theory and the Puzzle of the Bomb Doubleday ISBN 0 385 41567 2 Rapoport Anatol and Chammah Albert M 1965 Prisoner s Dilemma University of Michigan Press Verhoeff Tom 1998 The Trader s Dilemma A Continuous Version of the Prisoner s Dilemma Computing Science Notes 93 02 New Tack Wins Prisoner s DilemmaSsylkiRepeated Prisoner s Dilemma Applet angl Play the prisoner s dilemma game angl The Prisoner s Dilemma angl

NiNa.Az

NiNa.Az - Абсолютно бесплатная система, которая делится для вас информацией и контентом 24 часа в сутки.
Взгляните
Закрыто