Нечасто можно построить простую математическую игру, позволяющую анализировать глубокие философские вопросы. Тем не менее, такое бывает: Prisoner's dilemma (англ. Википедия, via NeXT).
Суть математического эксперимента: полиция арестовывает двух подозреваемых. Доказательств для суда недостаточно, поэтому их разделяют (так, чтобы они не могли общаться) и каждому предлагают дать показания против другого. Условия следующие: если оба дадут показания, то каждого осудят на 5 лет. Если даст показания только один, то его сразу отпустят, а второго осудят на 10 лет. Если же не даст показаний ни один, то оба отсидят по полгода и выйдут.
В отличие от других игр, здесь оптимальный ход игрока не зависит от возможного хода другого и состоит в даче показаний («предать»). Действительно, рассмотрим первого игрока: если второй предаст, то и первому нужно предать (чтобы снизить срок с 10 до 5 лет); если второй не предаст, то первому опять же лучше предать (чтобы выйти сразу, а не через полгода).
Интересные эффекты можно наблюдать, если несколько игроков разыгрывают данную ситуацию много раз подряд. Показано, что рациональные игроки могут постоянно поддерживать «хороший» исход игры (при котором ни один участник не предает).
В турнире, проведенным между компьютерными стратегиями, самой успешной стала стратегия, на первом ходе не дающая показания, а далее повторяющая ходы соперника. При введении в игру «шума» (небольшой доли дезинформации) еще более успешной становится «прощающая» стратегия, которая на хороший (без предательства) ход соперника отвечает хорошим ходом, а на плохой всё равно с небольшой вероятностью может ответить хорошим.
Анализ показал, что выигрывающая стратегия должна обладать следующими свойствами:
1. Хорошая. Самая важное условие заключается в том, что стратегия не должна предавать соперника, пока он не предаст первым.
2. Небезответная. Успешная стратегия должна мстить.
3. Прощающая. Хотя стратегия должна мстить, она должна возвращаться к хорошему поведению, если оппонент начал вести себя хорошо.
4. Независтливая. Стратегия не должна пытаться набрать больше очков, чем ее оппонент.
Поскольку это необходимые условия для победы в игре, можно считать, что эгоистичные стратегии из эгоистичного стремления к победе должны быть хорошими, прощающими и независтливыми.
Чтобы получить лучшие результаты, чем стратегия «око за око, зуб за зуб», какие-то стратегии должны пожертвовать собой (иначе говоря, более высоких результатов можно добиться, только если группу стратегий интересует победа хотя бы некоторых из них).
Если игра продолжается некоторое известное число раундов N, то оптимальной стратегией снова становится «всегда предавать». Для поддержания «добра» в «игровом мире» необходимо, чтобы продолжительность игры была заранее неизвестной (случайной для игроков).
Эти результаты можно интерпретировать как доказательство того, что «хорошее» поведение может быть эволюционным преимуществом и являться результатом естественного отбора.
(Подробнее см. в оригинальной статье на Wikipedia, ссылка на которую приведена в начале.)