Просмотреть всю тему "Забавная задачка, близкая к гэмблингу" »»
Два подхода   ID:44004   ответ на 44003 Вт, 13 августа 2002 22:22 [#]
Миша Daily-форум
ПВ. Я же не спорю, что Р = 10 является наиболее приемлемым с точки зрения максимизации МО решением. Просто математически оно не строгое ( не является глобальным максимумом). Это же вероятностная задача, а не психологическая.

> от 0 до бесконечности.
В том то и дело, что не до бесконечности, а до 10. То есть не для всего спектра, а лишь для той категории ответчиков, которые правильно оценили диапазон J (см. пример 2)  и при этом приняли правильное решение (см. пример 1).

> не понял “полета  мыслей”.
Почему? Подсмотрел Р и, как тот таксист, который заявляет сумму вдвое больше названной, тупо ее уполовинил. Знаем мы о его алгоритме или нет — это другой вопрос, но вероятность этого (не попасть в глобальный максимум при P = 10) существует даже при D меньше 10.
Пример 1 демонстрирует возможность зависимости решения от “подсматривания” и ограниченность применимости частного  дифференцирования с ПОСЛЕДУЮЩЕЙ проверкой на попадание в ОДЗ.

> P и D у нас независимые переменные.
Только до подсматривания. После может возникнуть функциональная или алгоритмическая связь.


Имеет смысл разделить оба подхода к решению : говорить либо о логическом решении с учетом психологии ответчика, тогда нужно знать алгоритм его действий или степень умственного развития (для оценки вероятности применения им тех или иных алгоритмов) (действительно клубный покер), либо о математическом, когда мы предусматриваем любые D, но учитываем вероятности выпадения тех или иных значений, тогда они должны быть заданы (это уже BJ).

ПРИМЕР 3. Диапазон D = [ 0..15], без подсматривания, распределение равномерное ( жизненнее было бы убывающее, но лень возиться с пропорциями, а для нелинейного случая с интегралами ).
Для интервала [0..10] решение — 10, для [10-15] — 15. Ищем в этом диапазоне.

mo = P, if D больше P
       = D, if 10 меньше равно D меньше равно P
       = mo2, if D меньше 10

mo = P * ( 15 — P ) / 15 + D * ( P — 10 ) / 15 + mo2 * 10 / 15
Производная (по P) = ( 15 — 2 * P ) / 15 + D / 15 + 10 / 15 * ( L — P ) / 7 = 0
при P = 205 / 24 + D * 7 / 24 = 12,915
Кстати любое распределение D с интервалом,  верхний диапазон которого больше 10, сместит максимум МО за счет первых двух составляющих   mo.

Всем удачи.

Миша.