Re: Скупой платит дважды, тупой платит трижды, лох платит постоянно! – Или, снова о Шкатулках ID:31828 ответ на 31791 |
Сб, 11 августа 2007 08:34 [#] |
|
|
Korovin писал сб, 11 августа 2007 02:12 | ...ТЫ САМ можеш предложить универсальную стратегию, которая в этом частном случае может дать лучшее МО??? | ДА!
I) ------------
Сейчас уже всем стало понятным и очевидным, что если известны "профили" противников и они остаются неизменными, то появляется шанс усилить свою стратегию, чтобы показывать более-лучший результат. О том, как определять и скрывать "профили" поговорим ниже.
Примеры:
1) Игрок знает "профиль" Учредителя (распределение частот парных сумм в шкатулках)
а) "профиль" вида БР - "больше [выплаты] - реже [встречаются]"
выплаты 2-4 4-8 8-16
доли 11/16 4/16 1/16
---------------------------------------
Здесь наилучшая стратегия: НИКОГДА не открывать вторую шкатулку, если выпадает от 4-х и выше.
б) "профиль" вида БЧ - "больше - чаще"
выплаты 2-4 4-8 8-16
доли 1/16 4/16 1/16
---------------------------------------
Здесь наилучшая стратегия: ВСЕГДА открывать вторую шкатулку, если выпадает от 8-и и ниже.
2) Учередитель знает "профиль" Игрока (на каких уровнях он открывает вторую шкатулку)
а) "профиль" вида БС - (больше [выплаты] - с[тоим], иначе - м[еняем])
выплаты 2-4 4-8 8-16
м м м с с с
---------------------------------------
Здесь наилучшая стратегия Учередителя: сделать свой профиль вида БЧ. Тогда игрок будет явно не добирать за счёт "стэя"!
б) "профиль" вида БМ - (больше [выплаты] - м[еняем], иначе - с[тоим])
выплаты 2-4 4-8 8-16
м с с м м с
------ концевые действия сделали осмысленными!
Здесь наилучшая стратегия Учредителя: сделать свой профиль вида БР. Тогда игрок будет явно не добирать за счёт "обмена" на больших суммах!
II) -----------------------
Возникает естественный вопрос: а есть ли "профили" противников, когда безразлично - "открывать вторую шкатулку или нет?" (для Игрока) и "открывает ли вторую шкатулку игрок или нет?" (для Учредителя).
Ответ утвердительный: ЕСТЬ.
1) Запишем локальное МО для какой-нибудь суммы S_i. P_k - вероятность выпадения k-ой суммы после выпадения i!!
"k-1", "k+1" - индексы кратных сумм.
стоим: МО_с = S_i;
меняем: МО_м = (P_i-1)*(S_i-1) + (P_i+1)*(S_i+1) = (P_i-1)*S_i/2 + (P_i+1)*S_i*2.
--------------------------------
Сокращаем общий сомножитель и получаем:
(P_i-1)/2 + (P_i+1)*2 = 1.
Это индексное уравнение имеет очевидное решение: P_i-1 = 2/3; P_i+1 = 1/3. То есть, увеличение выигрыша во второй шкатулке (в 2 раза) должно встречаться в ДВА реже, чем уменьшение!!
Пример:
парные_суммы: 1-2 2-4 4-8 8-16 16-32 32-64 64-128
доли: 1/2+1/128 1/4 1/8 1/16 1/32 1/64 1/128
P.S. Наименьшую пару мы вынуждены задавать чуть чаще для соблюдения баланса!
2) Аналогичная картина и для "профиля" Игрока (только не путать с методикой Коровина).
Игрок ОБЯЗАН на любой первоначальной сумме в ТРЕТИ СЛУЧАЕВ ОТКРЫВАТЬ ВТОРУЮ ШКАТУЛКУ!! Иначе, Устроитель может видоизменить свой "профиль" так, что Игрок станет выигрывать меньше.
III) -------------------
Итак, мы нашли РАВНОВЕСНЫЕ/ОПТИМАЛЬНЫЕ СТРАТЕГИИ ПРОТИВНИКОВ. Т.е. в этой позе НИКТО (Игрок/Учредитель) не может улучшить свой результат. Если кто-то отступает от оптимальности - противник за счёт изменения своего "профиля" может показывать лучше результат, но если первый среагировал вовремя на этот манёвр, то Второй - вляпается!! Тут цель выбирает каждый под себя: "больше выиграть" или "меньше проиграть".
Понятно, что МО для равновесных стратегий совпадает с результатом Грамазеки = 1.5*сумма_в_обеих_шкатулках.
IV) -----------
По большому счёту, решениЯ Грамазеки (всегда_стоять и всегда_менять) одновременно верны при равномерных парных выплатах. Грамотный Учредитель в состоянии чуть-чуть ухудшить его результат за счёт "сгущения" (снизу или сверху) парных_сумм. Оптимальной стратегией будет "шаг вперёд, два шага назад": один раз из трёх открывать вторую шкатулку, два раза - стоять!!
V) ----------
Поиск оптимальной стратегии против КОНКРЕТНОГО противника следующий
1) Для Игрока:
а) Разбиваем диапазон выплат на дискретные величины выплат (или интервалы).
б) Отслеживаем пары локальных МО (для всех интервалов) только для тех испытаний, когда открывали вторую шкатулку - МО_с и МО_м (когда "стояли БЫ"! и когда меняли шкатулки).
в) После накопления статистики мы можем скорректировать свою первоначальную стратегию (где-то чаще делать С вместо М и наоборот) с учётом "профиля" противника! При обязательном условии, что мы "готовы и хуже сыграть, при хороших шансах больше выиграть"!
1) Для Учредителя:
Отслеживаются доли обмена шкатулок в зависимости от сумм в первой шкатулке. Те суммы выплат, где С-М отличается от 2:1 позволяют улучшить "профиль"!
VI) ---------
Халява со шкатулками может превратиться в полноценную игру, если
1) Второй возвращает Первому полусумму в шкатулках;
2) Они поочерёдно меняются местами.
----------------------------------------------------
Здесь уже надо или обманывать противника с риском вляпаться самому, или играть по Нэшу, что и было изложено выше!
|
|
|