Сравнение 2-х методик расчета критических значений индекса ID:45083 |
Ср, 20 марта 2002 01:00 [#] |
|
|
Привет, участникам форума!
Ниже по форуму размещено послание мистера Joop. Видимо, поклонник одноименного (Wolfgang Joop) немецкого дизайнера. Дай Бог, чтобы у мистера Joop всегда были наличные на такие расчудесные одеяния. Ну да ладно.
Мистер Joop подкинул идею о том, что можно рассчитывать индексы корректировок игровых решений не симуляцией, а прямым расчетом. В этом случае для каждого значения индекса мы точно задаем распределение карт. Исходя из этого распределения мы и рассчитываем стратегию для каждого индекса, попутно отмечая на каких значениях индекса происходят преломления стратегии.
Мне кажется, что с теоретической точки зрения этот метод достаточно безгрешен. Да, в реальной игре при фиксированном значении индекса распределения карт будут “скакать” раз от разу, не будут совпадать с тем распределением, из которого мы исходили при расчете игровой стратегии для данного значения индекса. Но в том, то и фокус, что “скакать” распределения будут вокруг того распределения, из которого мы исходили. Больше того, математическое ожидание всякой относительной частоты этого распределения, которая (относительная частота) встретится нам в реальной игре, будет совпадать с теоретической вероятностью, содержащейся в нашем “расчетном” распределении. Поясню на примере.
Считаем карты по системе HiOpt2. Значение истинного индекса –11. Можно рассчитать, что вероятность появления двойки 8,75%. Предположим, что всякий раз, когда в игре счет опускается до –11, мы берем еще неразыгранные к этому моменту карты, считаем количество двоек и делим его на общее число несыгранных карт. Безусловно, наш результат только случайно может оказаться равен 8,75%. Но если мы будем проделывать такую процедуру достаточно долго, то из теоремы Бернулли (относительная частота стремится по вероятности к теоретической вероятности) следует, что “в среднем” мы будем иметь все те же 8,75%.
Идем дальше. Когда мы для фиксированной игровой ситуации (к примеру, 16 жестких очков против 10 у дилера) ищем значения индекса, при котором надо менять принимаемое игровое решение, то мы, по сути, ищем такое значение индекса, при котором “играть по-прежнему” перестает быть выгодно. До этого значения выгоднее всего было брать карту, а вот теперь лучше отказаться от дополнительной карты. С формальной точки зрения математики произошло следующее. До того как индекс принял это критическое значение, среди альтернатив (к примеру, stand и hit), доступных игроку, наивысшее математическое ожидание было у одной из альтернатив (к примеру, hit), а теперь наивысшее математическое ожидание у другой альтернативы (к примеру, stand).
Метод сопоставления каждому значению индекса фиксированного распределения, “озвученный” мистером Joop, позволяет сравнительно просто осуществить поиск критических значений индекса для разных игровых ситуаций. Происходить это будет в точности так, как описано выше.
Будут ли совпадать результаты такого расчета с результатами, полученными симулированием? Мне кажется, что будут. Единственное отличие в том, что дисперсия всех “расчетных” математических ожиданий игровых альтернатив будет строго меньше дисперсий (выборочных дисперсий) "просимулированных” математических ожиданий тех же альтернатив. Причины понятны. Причем в реальной игре дисперсия математических ожиданий альтернатив, влияющая на “раскачку” траектории бюджета и, следовательно, на вероятность разорения, будет совпадать с дисперсией “просимулированных” математических ожиданий, а не с дисперсией “расчетных” математических ожиданий.
Но это все с теоретической точки зрения. А что же на практике? Я изрядно заинтересовался соображениями, которые изложил мистер Joop, и на скорую руку сделал программу, реализующую данные идеи по расчету критических значений индекса для корректировки игровых решений.
С результатами можно ознакомиться в прикрепленном файле. Расчеты производил для системы HiOpt1. Диапазон изменения истинного индекса от –6 до +6. Эти самые результаты расходятся (несмотря на все вышеизложенные мысли) с результатами Гарри Бальди, которые присутствуют ниже по форуму. Во всех случаях, где наблюдается расхождение, я вписал в скобки рядом со своим индексом то значение индекса, которое получил Гарри, и для пущей наглядности выделил эти ячейки оранжевым цветом. У Гарри Бальди диапазон изменения индекса больше, но я для сравнения брал лишь те его индексы, которые лежат внутри диапазона (-6,+6).
Нельзя сказать, что в расхождениях абсолютно не проглядывается никакой системы. Так на жестких комбинациях при принятии решения брать/стоять из 20 индексов расхождения наблюдаются в 9, причем у меня в этих 9 случаях всегда на единицу меньше. То есть я получил некую более сдержанную стратегию относительно жестких брать/небрать.
Мягкие брать/небрать совпадают (еще бы, совпадать-то нечему)!
В жестких даблах из 15 индексов расходятся 6. Там, где есть расхождение, мои результаты “сдернуты” к нулю. Отрицательные индексы у меня выше, чем у Гарри, а положительные меньше.
В мягком дабле не сходятся 14 индексов из 27. И в данном случае уже не проглядывается какой-либо системы в расхождениях.
В сплитах вообще бардак, совпадают лишь 6 индексов из 20(!). Некоторые отличаются серьезно.
В стратегии саренды расходятся 2 индекса из 10.
Но в то же время страховка должна производится со счета +3 (это совпадает), так как при счете +2 вероятность появления 10 – 32,(692307)%, а при счете +3 та же вероятность становится равна 33,6(538461)%, что больше, чем критические 33,(3)%.
Но в то же время базовую стратегию ( для нулевого значения индекса) моя программа выдает правильно. У мистеров Лесного и Натансона в книге “Блекджек” есть таблица “Вероятности различных исходов при наборе карт дилером” (это у них для счета 0). Моя программа выдают аналогичную таблицу, цифры совпадают абсолютно (а ведь в книге приведены сотые доли процента!). Далее, в той же книге есть таблица “Средний выигрыш на жестких двухкарточных комбинациях” и “Средний выигрыш на мягких двухкарточных комбинациях”, мои цифры совпадают вплоть до сотых долей процента, исключение составляют ожидаемые доходности по сплитам – расхождение в десятые доли процента. Но опять же, речь идет о истинном счете 0.
К сожалению, пока нет больше времени на это, как только появится, я сравню ожидаемые доходности альтернатив, оцененные Гарри, и свои (их еще надо визуализовать из программы), может быть найду ошибку у себя.
Буду исключительно рад всем высказываниям, пробужденным моим посланием.
Удачи.
Бадди.
|
|
|