Просмотреть всю тему "Скупой платит дважды, тупой платит трижды, лох платит постоянно! – Или, снова о Шкатулках" »»
Re: Скупой платит дважды, тупой платит трижды, лох платит постоянно! – Или, снова о Шкатулках   ID:31837   ответ на 31791 Сб, 11 августа 2007 14:07 [#]
SunnyRay Закрыть блок (иконки IM) Форумы CasinoGames
Виталий КВИНСТАР, всё это очень хорошо, но пока неправильно!

Виталий КВИНСТАР писал сб, 11 августа 2007 09:34
I) ------------
Сейчас уже всем стало понятным и очевидным, что если известны "профили" противников и они остаются неизменными, то появляется шанс усилить свою стратегию, чтобы показывать более-лучший результат. О том, как определять и скрывать "профили" поговорим ниже.
...
б) "профиль" вида БЧ - "больше - чаще"
выплаты 2-4 4-8 8-16
доли 1/16 4/16 11/16
---------------------------------------
Здесь наилучшая стратегия: ВСЕГДА открывать вторую шкатулку, если выпадает от 8-и и ниже.
...
2) Учередитель знает "профиль" Игрока (на каких уровнях он открывает вторую шкатулку)
а) "профиль" вида БС - (больше [выплаты] - с[тоим], иначе - м[еняем])
выплаты 2-4 4-8 8-16
м м м с с с
---------------------------------------
Здесь наилучшая стратегия Учередителя: сделать свой профиль вида БЧ. Тогда игрок будет явно не добирать за счёт "стэя"!
Что значит игрок будет недобирать? Абсолютное значение МО выигрыша игрока в случае БЧ больше, чем в случае БР, и даже неоптимальность профиля игрока этого не изменит. То есть если у нас антагонистическая игра с нулевой суммой, и выигрыш игрока - это сумма, полученная игроком, то смена БР на БЧ Учредителю невыгодна! Более того, при таком определении выигрыша равновесие Нэша достигается на профиле Учредителя "класть в шкатулки НОЛЬ", или если это запрещено, то "всегда класть 1 цент и 2 цента", и равновесный профиль игрока - менять 1 цент и стоять на 2 центах.

Может, я ошибаюсь, но мне кажется, что сейчас ты используешь НЕВЕРНОЕ определение равновесия, а именно такое: "равновесие Нэша - это такие профили игрока и Учредителя, что никакая смена профиля любым из них не позволит второму сменить свой профиль так, что его выигрыш увеличится" . С таким определением равновесие просто не существует!

Для того, чтобы можно было использовать правильное равновесие Нэша, следует задать функцию выигрыша по-другому.

Введём обозначения:
Pу - профиль Учредителя
Pи - профиль игрока
T(Pу) - математическое ожидание суммы денег в первой открытой шкатулке (совпадает с МО игры по тупой стратегии)
W(Ру, Ри) - математическое ожидание выигрыша игрока, играющего по профилю Ри

Выше я написал эквилибриум для случая антагонистической игры с Fи0 = W(Ру, Ри), и он, очевидно, неадекватен исходной задаче, а следовательно, нужно искать другой критерий выигрыша. И пункт "VI)" от этого не спасёт.

Теперь я могу предолжить два способа определения функции выигрыша игрока, не знаю, есть ли среди них удовлетворительный:

Fи1 = W(Ру, Ри) / T(Pу)
Fи2 = W(Ру, Ри) - T(Pу)

Игра антагонистическая, то есть Fу1 = -Fи1, Fу2 = -Fи2.

Вот теперь, выбрав один из вариантов, можно искать эквилибриум и надеяться, что он окажется осмысленным.

Пункты II, III и IV нужно каким-то образом видоизменить в соответствии с этим. О пункте V предлагаю забыть до тех пор, как будет решена задача нахождения равновесия Нэша.

Выводы в этих пунктах неверны, они просто не могут быть верными, это доказано существованием стратегии Коровина. Среди равновесных профилей Учредителя и игрока не может быть стратегии Грамазеки или стратегии "в трети случаев брать вторую шкатулку", так как из доказательства стратегии Коровина следует, что для любого постоянного профиля Учредителя существует стратегия Коровина, дающая лучший результат, нежели любая стратегия "менять с вероятностью р, стоять с вероятностью 1-р".

Неверные выводы были предопределены использованием неправильного определения равновесия Нэша.