Базар вокруг игры / Игра вообще / Забавная задачка, близкая к гэмблингу
Перейти вниз
Забавная задачка, близкая к гэмблингу   ID:43983 Ср, 17 июля 2002 07:32 [#] [»)
PV Daily-форум
Судья с математическими наклонностями придумал новый метод разрешения денежных споров. Перед тем, как вынести решение, он просит, чтобы истец и ответчик принесли ему в закрытых конвертах — нет не взятку — свои соображения о сумме компенсации. Назовем сумму, определенную истцом P, а от ответчиком — D. После этого судья выслушивает доводы обеих сторон и определяет свою сумму вознаграждения — J. Реальное значение компенсации определяется сравнением J с P и D. Если J ближе к P, ответчик платит P, если J ближе к D, ответчик платит D.
Судья намекнул истцу, что собирается назначить компенсацию в диапазоне от $3 млн до $10 млн, причем вероятность каждого значения в интервале одинакова. Сколько денег должен запросить истец, чтобы максимизировать ожидаемую компенсацию? Должен ли он изменить свое решение, если он подозревает, что ответчик смог подсмотреть его запрос?
—-
От себя добавлю еще пару вопросов:
1) рассмотреть действия истца, если диапазон судьи от $3 млн до $10 млн;
2) как должен поступить истец, если он точно уверен: «Ответчик не только подсмотрел ответ на запрос, но и знает, что я — истец — знаю про это».

Удачи!
  ПВ
        
 
Чувствую подвох, но...   ID:43984   ответ на 43983 Сб, 20 июля 2002 17:40 («] [#] [»)
Удивленный Daily-форум
Я думаю, что в любом случае, истец должен говорить 4 миллиона, так как эта сумма будет максимально приближена к минимальному числу судьи (3 лимона). Разве что, может быть патовая ситуация, когда ответчик определит сумму, как 2 лимона. Тут до цифры судьи, если таковая — 3, будет равный интервал...

С уважением,
        
 
Re: Чувствую подвох, но...   ID:43985   ответ на 43984 Сб, 20 июля 2002 20:28 («] [#] [»)
PV Daily-форум
Уди... Не судись!   Smile
        
 
Подвоха не чувствую, но ...   ID:43991   ответ на 43983 Пн, 29 июля 2002 06:18 («] [#] [»)
Миша Daily-форум
ПВ, здравствуй.

По-моему, задача не имеет точного численного решения из-за отсутствия данных о допустимом интервале и законе распределения D. Можно предположить, учитывая психологию ответчика, что вероятность убывает с ростом D (обратно пропорциональна, или как-то иначе), но этого делать не хочется.

Ну да ладно. Попробуем как есть. Имеем целевую функцию F:

F =  P,   if mod(P-J) < mod(D-J)
   =  0,    if mod(P-J) = mod(D-J)
   =  D,   if  mod(P-J) > mod(D-J), где mod – модуль.
Область допустимых решений – [0..М], где М – максимально возможная сумма иска.
Строго говоря, для mod(P-J) = mod(D-J)   F не определена, но в условии не сказано о  каких либо выплатах, поэтому понимаем буквально – никто никому не платит.

Это линейная функция с двумя (в общем случае) или одной точкой разрыва. Ее график следующий :
на интервале ]J-mod(D-J)..J+mod(D-J)[ это линейно возрастающая (F=P) функция,
на интервалах [0.. J-mod(D-J)[ и ]J+mod(D-J).. M] – четыре горизонтальных отрезка (F=J-mod(D-J) для D < J и F=J+mod(D-J) для D >=J).

Точное решение таково :
- для D < J, Fmax = P = J + mod(D-J) – m, где m – минимально возможная денежная сумма.
- для D > = J, Fmax = D, при этом P принадлежит интервалу [D+m..M].
Учитывая случайный характер переменных, неразумно говорить о поиске глобального максимума, необходимо учитывать вероятность его достижения. Таким образом нас интересует  максимум произведения  значения  F на вероятность этого значения.
Повторюсь, не зная ничего о D, его (максимум) не найти. Для D < J (т.е допустим, что ответчик не будет назначать астрономических сумм компенсации) получаются следующие оценки вероятностей получения различных доходов: для P=МО (J) = (10+3)/2 = 6.5 млн. – более 50%, т.к. когда J>=6.5 млн. – 6.5 гарантированы, когда меньше – не факт, что D ,будет ближе к J чем 6.5 млн. Аналогично для P=3+(10-3)*(2/3)=7,6(6) млн. вероятность более 33,3(3)%. В общем случае доход умноженный на вероятность больше чем Х*(10-Х)/7. Перевернутая парабола. Далее – по букварю. Производная равна 10/7-(2*Х)/7. Приравниваем к нулю. Х=5 ! (не факториал). Smile . Да, забыл, все – в миллионах.

Дополнительные вопросы (“я знаю, что он знает”) предполагают оценку мыслительных способностей ответчика и, как следствие, получение данных о МО(D). При ответе на этот вопрос особенно настораживает факт невыплаты компенсации в случае равенства D и  P. Это из области психологии. Подумаю на досуге.

Итак, с учетом оговорок ответ $5 000 000.  Исправляйте, если что не так.

Всем удачи.

Миша.

        
 
Сорри!  -  Второй диапазон от     $7 млн до $10 млн!!!   ID:43992   ответ на 43983 Пн, 29 июля 2002 10:59 («] [#] [»)
PV Daily-форум
> От себя добавлю еще пару вопросов:
> 1) рассмотреть действия истца, если диапазон
> судьи от $3 млн до $10 млн;
Блинн...
Конечно же опечатка, правильно: от СЕМИ до ДЕСЯТИ ($7 млн — $10 млн)

ПВ
        
 
> Исправляйте, если что не так.    ID:43993   ответ на 43991 Пн, 29 июля 2002 11:03 («] [#] [»)
PV Daily-форум
Пусть границы диапазона сумм Судьи — l и L.
Матожидание — mo — определяется в зависимости от соотношений величин l, L и R=(P+D)/2.
mo1(R<l) = P;
mo3(R>L) = D;
mo2(l<=R<=L) = [(L*P-P*P/2) — (l*D-D*D/2)].

В последнем случае, для mo2 могут существовать ИСТИННЫЕ экстренумы для частных производных по P и D, которые достигаются в точках L и l, соответственно.
ВАЖНЫЙ нюанс: необходима проверка на непротиворечивость сделанным ранее передположениям (ОДЗ!). Так для P (при фиксированном D!) получаем P=L. Проверяем на ОДЗ. Из требования l<=R<=L; имеем
l<=(L+D)/2<=L.
Преобразуем:
(2*l-L)<=D<=2*L.
Т.к. по смыслу задачи D<=L, то второе неравенство выполняется автоматически, а первое — лишь при условии D>=(2*l-L)!
При  l=$3, L=$10 имеем D>=[(2*3-10)=-4], что с очевидностью выполняется, т.к. по смыслу задачи D>=0 (ответчик НЕ выставляет сам встречный иск!).

Ответ:  
1) Истец претендует на P=L (=10$), а ответчик соглашается на D=l(=3$).
2) Обстоятельства «Ответчик не только подсмотрел ответ на запрос, но и знает, что я — истец — знаю про это» не изменяют ответа!  


P.S.  А вот случай L=10, l=7 — ГОРАЗДО БОГАЧЕ по содержанию... (самостоятельно, плз — не пожалеешь!)
        
 
Уди, глючат скрипты!   ID:43994   ответ на 43993 Пн, 29 июля 2002 11:08 («] [#] [»)
PV Daily-форум
> mo1(R
Здесь не по моей вине исчезла КОНЦОВКА строки!   Smile
Следует читать так:
mo1(при R меньше l) = P;

ПВ
        
 
Re: > Исправляйте, если что не так.    ID:43996   ответ на 43993 Ср, 31 июля 2002 12:18 («] [#] [»)
Cardinal Daily-форум
Сам я задачку не решил,но постарался внимательно разобрать ответ.
В двух местах то ли опечатки, то ли я не до конца понял мысль.

>>mo2(l<=R<=L) = [(L*P-P*P/2) — (l*D-D*D/2)].  

Мне показалось, надо писать так:
mo2(l<=R<=L) = [(L*P-P*P/2) — (l*D-D*D/2)]/(L-l).  

и

>>l<=(L+D)/2<=L.  
>>Преобразуем:  
>>(2*l-L)<=D<=2*L

Вроде преобразуется в (2*l-L)<=D<=L
И еще. Из решения вытекает, что ответчик тоже знает интервал l-L, а из условия задачи это не очевидно.
Вот.

Если будет время,силы и желание — попробую разобраться с интервалом 7-10 $ ))))

И вот вспомнилась мне еще одна любопытная задачка

«Мы даем рекламное объявление, в котором обещаем обыграть казино, и приглашаем под это дело инвесторов. В назначенный день перед нашим офисом собралась толпа людей (ну, очень много... может 5 тыс. человек, может и 10 миллионов человек), предлагающих свои деньги.Разговор происходит короткий. Инвесторы заходят по одному и называют сумму, которую они готовы предложить. Мы либо соглашаемся , либо нет, после чего зовем следующего.Инвесторы очень разные, и могут предложить как 1000$, так и 10 000 000$. Так же инвесторы очень обидчивы. Если мы кому отказали, больше он с нами разговаривать не будет. Если мы с кем согласились, все остальные разворачиваются и уходят.  Наша цель — получить в управление побольше денег. Какой будет оптимальная тактика выбора ? »

Предупреждаю, точного ответа я не помню. Остался в голове сам подход к решению. Но, уверен, сообща мы с задачей справимся.

Удачи
        
 
Re: > Исправляйте, если что не так.    ID:43997   ответ на 43996 Чт, 1 августа 2002 03:22 («] [#] [»)
Миша Daily-форум
Для Cardinal.

Вариант а) взять деньги у всех. Smile
Вариант б) если инвестор должен быть один, то подходит «Метод капризной невесты». Только она выбирала жениха. Не помню цифр (они приводились), но общая идея в том, что если имеется N испытаний и N+1 испытание на P процентов лучше, чем лучшее из N, то такого жениха нужно хватать, потому что вероятность того, что найдется еще более хороший — V.

Удачи. Миша.

P.S. ПВ, не со всем согласен, отвечу чуть позже.
        
 
Re: > Исправляйте, если что не так.    ID:43998   ответ на 43993 Пн, 12 августа 2002 20:03 («] [#] [»)
Миша Daily-форум
ПВ. Извини за длительное отсутствие.

Во-первых, признаю, что задачу я не решил. Так как пытался решить ее в самом общем виде (допущение D < J  - не нужно), в каком она численного решения НЕ ИМЕЕТ. Оба наших решения – локальные максимумы. Твое, безусловно, ближе к истине, ввиду полной адекватности математической модели. Но решение справедливо лишь для частного случая (выбранные ограничения для D и равенство нулю частных производных в mo2 P по D и D по P). В общем случае при нахождении частных производных целевой функции (ЦФ) глобальный максимум не достигается. Не всегда при поиске экстремума можно сначала дифференцировать, а потом проверять на попадание в ОДЗ. Тем более, что ЦФ в данном случае — седлообразная. При несовпадении области определения (l <= R <= L) и ОДЗ искать нужно сразу в ОДЗ с использованием методов теории оптимизации. Кстати, строго говоря, еще нужно учитывать дискретность переменных. (Этого я тоже не делал).

Cardinal обратил внимание на важный для выбора метода решения момент :  ответчик ничего не знает об интервале J. ( > Судья намекнул истцу ...). Соответственно мы ничего не знаем о D. Это существенно ограничивает применение методов матанализа.

ПРИМЕР 1 :  D = P/2.   ОДЗ вырождается в отрезок, а ЦФ – в кривую на поверхности «седла». Максимум mo2 достигается при :
mo2 = ((L*P-P*P/2) — (l*P/2-P*P/ Smile /(L – l)
Производная = L – P – l/2 + P/4 = 0
P = 4*(L – l/2)/3 = 34/3 = 11,3(3)        (1 — везде «эль малое», кроме 11,3(3)).
Решение  = 11,3(3), если 11,3(3)<M<=13,3(3), = М, в ином случае.

ПРИМЕР 2 :  D = [$10 000 000 ..$20 000 000] и равномерно распределено.
mo3=min(P,D).
mo3= D*(P-10)/10 + P*(20-P)/10
Учитывая независимость D от P, и отсутствие системы ограничений
частная производная mo3(по P) = D + 20 — 2*P = 0 при P= 10 + D/2 = 20

P.S. Не в качестве «отмазки». Пытаясь найти решение в условиях неопределенности, я решил несколько другую задачу — одновременной максимизации  компенсации и минимизации вероятности потерь (при J > P доход не меньше P). ЦФ это произведение оценки снизу компенсации  на (1 — оценка сверху риска потерь).
(10-P)/7=1-(P-3)/7
(P-3)/7 — это вероятность того, что J<P, т.е вероятность того что компенсация будет меньше или равна P.

Здесь достаточно интересен вопрос дисперсии и риска. Суммы — огромные, а испытание  только ОДНО. Получение статистически ожидаемых (P=10, D=3) 6.5 млн. невозможно в принципе. При D = 0 вероятность ничего не получить – 2/7 = 0.29. Будучи человеком осторожным,  и учитывая значимость приведенных сумм, я в положении истца не гнался бы за максимумом МО. Хотя это, конечно,  вопрос критерия и прямого отношения к поставленной задаче не имеет.

Всем удачи. ПВ — спасибо за задачу. Класс !

Миша.


        
 
Пропали две строки   ID:43999   ответ на 43998 Пн, 12 августа 2002 20:11 («] [#] [»)
Миша Daily-форум
В «ПРИМЕР 1» :
Решение  = 11,3(3), если 11,3(3)<M<=13,3(3), = М, в ином случае.

В «P.S.» :
(P-3)/7 — это вероятность того, что J<P, т.е вероятность того что компенсация будет меньше или равна P.

        
 
Еще глюк   ID:44000   ответ на 43999 Пн, 12 августа 2002 20:17 («] [#] [»)
Миша Daily-форум
В «ПРИМЕР 1» :

mo2 = ((L*P-P*P/2) — (l*P/2-P*P/ Smile /(L – l)
        
 
Вместо "рожица" — цифра восемь и двойные закрывающие скобки (NT)   ID:44001   ответ на 44000 Пн, 12 августа 2002 20:22 («] [#] [»)
Миша Daily-форум
Нет текста сообщения
        
 
Re: Пропали две строки   ID:44002   ответ на 43999 Пн, 12 августа 2002 20:32 («] [#] [»)
Миша Daily-форум
В «ПРИМЕР 1» :
Решение  = 11,3(3), если 11,3(3) меньше M меньше равно 13,3(3), = М, в ином случае.

В «P.S.» :
(P-3)/7 — это вероятность того, что J меньше P, т.е вероятность того что компенсация будет меньше или равна P.
        
 
The end.   ID:44003   ответ на 43998 Вт, 13 августа 2002 10:49 («] [#] [»)
PV Daily-форум
Миша, долго ли — коротко ли, но задачка похоже себя исчерпала...

Во-первых, ты сам заметил — как тяжело постить на форум мат-выкладки; во-вторых, пара замечаний Кардинала правильна (непринципиальна с точки зрения ответа, но все же):
>> mo2(l<=R<=L) = [(L*P-P*P/2) — (l*D-D*D/2)]/(L-l).  
и
>> Из l<=(L+D)/2<=L следует  (2*l-L)<=D<=L.

Теперь «твои-мои» рассуждения.
1)
> Cardinal обратил внимание на важный для выбора метода
> решения момент:  ответчик ничего не знает об интервале J.
> (Судья намекнул истцу ...). Соответственно мы ничего не
> знаем о D. Это существенно ограничивает применение методов
> матанализа.
Так-то оно так... Но представь себя на место ответчика. Чтобы стал делать? — ЗАНИЖАЛ бы сумму насколько возможно, НО держал бы в уме тот факт, что у судьи ЕСТЬ НЕКОТОРЫЙ РАЗУМНЫЙ интервал цифр и сильно промахнуться — себе дороже выйдет!
Поэтому мои слова:
>> Истец претендует на P=L (=10$), а ответчик соглашается на D=l(=3$)
можешь понимать так: ОТВЕТЧИКУ СИЛЬНО ПОВЕЗЕТ, если он назовет
сумму D=l(=3$)!! В противном случае, он занижает свое МО (в самом
широком смысле — для различных умственных способностей истцов!)
Истец же своим ответом P=L(=10$) максимизирует МО для всего спектра
ответчиков (J — от l до L, а D — от 0 до бесконечности)...

2)
> ПРИМЕР 1 :  D = P/2.   ОДЗ вырождается в отрезок,
> а ЦФ — в кривую на поверхности <седла>. Максимум mo2
> достигается при :
> mo2 = ((L*P-P*P/2) — (l*P/2-P*P/J/(L — l)  
> Производная = L — P — l/2 + P/4 = 0
Миша, не понял «полета мыслей». Smile
Как так!?  P и D у нас НЕЗАВИСИМЫЕ переменные и о их функциональной связи — D = P/2; — речи не шло.
Поэтому, дальнейшая «эвилибристика» маненько не из той оперы (имхо).

============================
============================
А вот в ДОПОЛНИТЕЛЬНОМ варианте задачи, когда l=$7, L=$10 имеем D>=[(2*7-10)=+4]. Т.е. ЕСЛИ ОТВЕТЧИК желает платить менее $4-х, то найденная ранее формула для экстренума становятся НЕПРИГОДНА и max-min для mo расположены уже НА ГРАНИЦЕ диапазона [l,L]!
В качестве иллюстрации: для l=$7, L=$10; и D=0 (алчный ответчик!) прогноз истца — P=10 НЕ ЯВЛЯЕТСЯ оптимальным значением, т.к. для mo имеем mo1=10.
В то же время, при СОЗНАТЕЛЬНОМ УВЕЛИЧЕНИИ СУММЫ ИСКА истцом, mo1 возрастает. Предельное значение получается при R=l, т.е.:
R=(P+D)/2=l; —> P=2*l-D.
Подставляя значения l, D (для алчного ответчика D=0!), получаем:
P=2*7-0=14.—> Выплата поднимется до $14!... :=)))

Если ответчик «трезвомыслящий», то он ВСЕГДА назовет оптимальную для
себя цифру — D=l; в данном случае — $7. Учет ЭТОГО обстоятельства заставляет и истца поступать грамотно — «заказывать 6 пик» — $10!
===
Последний вариант задачи ЕЩЕ имеет и прикладные приложения к гэмблингу, а именно к клубному покеру; перепевы типа: «я оглянулся на нее, чтоб посмотреть не оглянулась ли она ...»!  
Как нашли ранее, в случае, когда истец предполагает об алчности ответчика, его заявленная цифра P=$14 является наилучшей.
—-
А теперь следующая ситуация: истец считает ответчика алчным, а тот учитывает это обстоятельство и заявляет ОПТИМАЛЬНУЮ сумму, а именно — $3!! Все. Истец вместо предполагаемых 14-и имеет только $3.
—-
Очередной шаг: истец знает «ход мыслей» своего оппонента, — что тот заявит $3. Его ответные действия очевидны — следует заявка не $14, а... конечно $11!!
—-
........(Далее идет вечное — «кто кого насколько просчитал»)
—-
В конце концов, грамотные И и О остановятся на своих оптимальных цифрах — l и L.

УДАЧИ!
  ПВ
        
 
Два подхода   ID:44004   ответ на 44003 Вт, 13 августа 2002 22:22 («] [#] [»)
Миша Daily-форум
ПВ. Я же не спорю, что Р = 10 является наиболее приемлемым с точки зрения максимизации МО решением. Просто математически оно не строгое ( не является глобальным максимумом). Это же вероятностная задача, а не психологическая.

> от 0 до бесконечности.
В том то и дело, что не до бесконечности, а до 10. То есть не для всего спектра, а лишь для той категории ответчиков, которые правильно оценили диапазон J (см. пример 2)  и при этом приняли правильное решение (см. пример 1).

> не понял “полета  мыслей”.
Почему? Подсмотрел Р и, как тот таксист, который заявляет сумму вдвое больше названной, тупо ее уполовинил. Знаем мы о его алгоритме или нет — это другой вопрос, но вероятность этого (не попасть в глобальный максимум при P = 10) существует даже при D меньше 10.
Пример 1 демонстрирует возможность зависимости решения от “подсматривания” и ограниченность применимости частного  дифференцирования с ПОСЛЕДУЮЩЕЙ проверкой на попадание в ОДЗ.

> P и D у нас независимые переменные.
Только до подсматривания. После может возникнуть функциональная или алгоритмическая связь.


Имеет смысл разделить оба подхода к решению : говорить либо о логическом решении с учетом психологии ответчика, тогда нужно знать алгоритм его действий или степень умственного развития (для оценки вероятности применения им тех или иных алгоритмов) (действительно клубный покер), либо о математическом, когда мы предусматриваем любые D, но учитываем вероятности выпадения тех или иных значений, тогда они должны быть заданы (это уже BJ).

ПРИМЕР 3. Диапазон D = [ 0..15], без подсматривания, распределение равномерное ( жизненнее было бы убывающее, но лень возиться с пропорциями, а для нелинейного случая с интегралами ).
Для интервала [0..10] решение — 10, для [10-15] — 15. Ищем в этом диапазоне.

mo = P, if D больше P
       = D, if 10 меньше равно D меньше равно P
       = mo2, if D меньше 10

mo = P * ( 15 — P ) / 15 + D * ( P — 10 ) / 15 + mo2 * 10 / 15
Производная (по P) = ( 15 — 2 * P ) / 15 + D / 15 + 10 / 15 * ( L — P ) / 7 = 0
при P = 205 / 24 + D * 7 / 24 = 12,915
Кстати любое распределение D с интервалом,  верхний диапазон которого больше 10, сместит максимум МО за счет первых двух составляющих   mo.

Всем удачи.

Миша.

        
 
Ошибка   ID:44005   ответ на 44004 Ср, 14 августа 2002 06:34 («] [#]
Миша Daily-форум
Извините, поторопился. В Примере 3 :

mo = P, if D больше P
       = D, if 20 – P меньше равно D меньше равно P
       = mo2, if  D меньше 20 – P

mo = P * ( 15 – P ) / 15 + D * ( 2 * P – 20 ) / 15 + mo2 * ( 20 – P ) / 15
Производная (по Р) = 1 – 2 * P / 15 + 2 * D / 15 + 1 / 105 * ( 200 – 40 * P + 3 * P * P / 2 – D * D / 2 + 3 * D ) = 1 / 210 * ( 3 * P * P – 108 * P + 610 – D * D + 34 * D ) = 0
Квадратное уравнение, один корень вне диапазона, другой – 12,93


        
 
 
Предыдущая тема:Ничего ли не упустил?
Следующая тема:во что лучше играть что бы голову себе не слишком ломать
Быстрый переход к форуму
  
Текстовая версия  RSS лента
Вернуться вверх

Текущее время: Пн, 18 ноября 22:38:14 2024
Время, затраченное на генерацию страницы: 0.01285 секунд