Обсуждение:Дилемма заключённого

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Терминология?[править код]

"Рациональный агент" - это устоявшийся термин? Если нет, то лучше выразиться по-другому. Например, "рациональный игрок". (Здесь обыгрывается такое значение английского слова "agent", как "объект воздействия.) 85.141.230.42 09:51, 15 апреля 2009 (UTC)[ответить]

Вообще-то, это устоявшийся термин. 178.120.28.91 21:05, 5 августа 2012 (UTC)[ответить]

Снова о терминологии[править код]

"Каждый игрок держит 2 карты: на одной написано «сотрудничать», на другой — «предать»". "Предать" значит "свидетельствовать", но ведь и "сотрудничать" имеет очевидно то же значение, тк иначе это сговор и игра не имеет смысла.--Totalserg 15:59, 14 июня 2009 (UTC)[ответить]

D > d > C > c

По-моему, должно быть D > C > d > c: иначе обеим предать выгоднее, чем обеим сотрудничать.--89.105.238.253 23:19, 26 июля 2009 (UTC)[ответить]

хе хе, самая выигрышная стратегия было правильно замечено мщение, только вот делать его надо превентивно. Если агенты анонимны полностью то игра теряет смысл(можно выбрать чисто математическую максимальную составляющую и на протяжениии 1000 игр результат примерно будет у всех одинаков). Если агенты известны то агент образно умеющий приставлять нож к горлу или вставлять паяльник в анальное отвестие будет в выигрыше всегда.

Ссылка на источник даосской поговорки?[править код]

В переводе книги Лао Цзы "Дао дэ Цзин": Ян Хин-шун, "Древнекитайский философ Лао-Цзы и его учение", Москва, 1950 - в стихе 49 сказано:

Совершенномудрый не имеет постоянного сердца. Его сердце состоит из сердец народа. Добрым я делаю добро и недобрым также делаю добро. Таким образом и воспитывается добродетель. Искренним я верен и неискренним также верен. Таким образом и воспитывается искренность.
Совершенномудрый живет в мире спокойно и в своем сердце собирает мнения народа. Он смотрит на народ, как на своих детей.

Что в сути расходится с указанной в тексте статьи поговоркой. Хочется увидеть ссылку на источник (автора) поговорки.

92.126.65.254 14:23, 2 сентября 2010 (UTC) Сергей[ответить]

Удалил спорный параграф[править код]

В вариации, популярной у программистов и хакеров, каждый агент этой игры помнит предыдущие результаты (или имеет доступ к общественному мнению, «коллективной памяти»), и множество обменов повторяются длительное время.

Как отмечено выше, без памяти эта игра имеет мало смысла, она мало что объясняет в поведении систем и групп людей, кроме описания взаимодействий, которые не будут происходить. Сложностей вводится больше, чем можно ожидать. Программист (особенно специализирующийся на функциональном программировании) сразу поймёт значимость времени и состояния (памяти). Но и без написания программ можно предположить, как поведут себя агенты. Насколько велика память каждого агента? Какова стратегия каждого из них? Как агенты с разными стратегиями распределены и что определяет, кто с кем взаимодействует и в каком порядке?

Сложность создания какой-то многозначной модели может обескураживать, но она поднимает некоторые интересные и ценные технические и философские вопросы.

Проделана некоторая работа по моделированию этого. Разные программисты и математики утверждают, что стратегия «око за око» (см. ниже) — наилучшая общая стратегия, однако не было сделано серьёзных академических усилий, чтобы классифицировать разные типы и распределения обучающихся агентов с разными стратегиями.

О потенциале этой задачи свидетельствует тот факт, что в этой дискуссии ещё не упоминались возможность формировать коалиции и рядиться коллективно. А как насчёт агентов, которые бы за плату организовывали переговоры? Или агентов, которые бы накапливали информацию о самих сделках?

--Hazzik 16:21, 27 мая 2011 (UTC)[ответить]

Общее с Эффектом безбилетника?[править код]

Есть такая штука, Эффект безбилетника — тоже про закономерность человеческого выбора в какой-то ситуации. Есть здесь категория, адекватная для сбора статей про подобные наблюдения? Может, создать? Как бы она могла называться? --Nashev 15:35, 25 апреля 2012 (UTC)[ответить]

Может создать раздел "Отражение в культуре"?[править код]

У Горького например есть такая фраза:

Всякий человек хочет, чтобы сосед его совесть имел, да никому не выгодно иметь-то ее.

Может еще найдутся подобные высказывания классиков?--Михаил Ягих 12:48, 7 августа 2012 (UTC)[ответить]

"Доказываем по индукции. Если оба сотрудничают на последнем ходу - выгодно предать"[править код]

Вроде по условию задачи было написано, что если оба сотрудничают, то это выгоднее, чем предать. Зачем же предавать тогда на последнем ходу ? 109.108.238.217 11:15, 28 октября 2012 (UTC)[ответить]

Просто попытка получить выгоду, обманув соперника. И проигнорировав то, что в результате сопернику станет выгодно обмануть его на N-1 ходу.

Пояснение: вне зависимости от такой модификации стратегии, соперник, предавший на N-1 ходу получит D+d. Но, если этого не делать, а играть «око за око», то соперник, НЕ предавший на N-1 ходу получит C+C=2C>=D+d (в сумме за ходы N-1 и N). А если предавать на N ходу, то тот же соперник, НЕ предавший на N-1 ходу получит C+c<D+d.

Возможно, автор просто не понимает, что повторение хода соперника нужно, чтобы у него не было интереса предать ходом ранее.

Если можно, добавьте это к основному тексту статьи. 86.100.164.224 05:56, 16 января 2017 (UTC)[ответить]

Повторяющаяся дилемма[править код]

Статья Око за око на Хабре каким-то боком может помочь этой статье здесь? --Nashev 18:41, 22 января 2013 (UTC)[ответить]

Неверно назначенные наказания[править код]

Я считаю, что хотя и нет ошибок в задаче, но имеются явные ошибки в действия судьи (прокурора?), который назначал наказания явно из своей прихоти, а не руководствуясь правилами Уголовного кодекса. 1) Во-первых, если оба пленника: и A, и B — дают показания, то это скорее всего означает, что они соучастники. Соучастие является более тяжким преступлением, чем одиночное. Поэтому если оба дают показания, то срок должен быть увеличен: не 10 лет, а, скажем, 15. 2) Во-вторых, наказание в 6 месяцев, если оба узника хранят молчание — по сути высосано из пальца. На мой взгляд, в случае, если оба узника молчат, то при отсутствии иных доказательств вины они оба должны быть выпущены на волю. 89.149.96.128 23:57, 31 марта 2014 (UTC) 89.149.96.128 23:58, 31 марта 2014 (UTC)[ответить]

Что за дикая отсебятина написана в разделе "Классическая дилемма заключённого"[править код]

Во-первых, что за странное вступление про "наказание за преступление в составе группы"? Нигде в классической формулировке Дилеммы Заключенного (в том числе здесь) ничего подобного не фигурирует, никакого отношения к Дилемме Заключенного не имеет и никогда не имело. Кто это сюда приплел и зачем?

Во-вторых, что за чушь про "лучше [...] получить по полгода, так как это уменьшит суммарный срок заключения". "Суммарный срок заключения"??? Для формирования Дилеммы Заключенного условие уменьшения "суммарного срока" не рассматривается - это нигде и никак не нужно. Более того, для формирования дилеммы критически необходимо, чтобы каждый игрок предпочитал действовать в личных целях, т.е. "суммарный срок заключения" никого из них не интересует по определению.

В-третьих, в английской версии страницы в качестве максимального срока наказания указано "3 года". Обратите внимание, что 3 меньше чем 4 (то есть суммарное 2+2). Это сделано специально (!) для того, чтобы подчеркнуть, что факт того, что "3 меньше чем 4" не играет никакой роли в Дилемме Заключенного. Здесь же какой-то "умник" наплел какой-то чуши, а затем, чтобы натянуть постановку Дилеммы на глобус своей чуши, еще и увеличил максимальный срок до 10 лет, т.е. кто-то упорно добивался, чтобы максимальный срок был больше 4. Сразу видно, что тот, кто корежил русскую страницу в соответствии со своими домыслами, совершенно не понимал сути Дилеммы Заключенного.

Calligrapher (обс.) 21:33, 4 марта 2024 (UTC)[ответить]

Критика[править код]

В статье не хватает критики дилеммы как с точки зрения взятых с потолка чисел наград которые и приводят к нужным авторам дилеммы выводам, так и критики самой ситуации выбора, распиаренной и не имеющей применения в реальной жизни. Часть информации можете взять отсюда http://philsci-archive.pitt.edu/15389/1/PD2014-bookfinal.pdf или поискать в других источниках. С уважением, Пётр. 217.107.106.12 16:47, 16 марта 2024 (UTC)[ответить]