Забавная задачка, близкая к гэмблингу ID:43983 |
Ср, 17 июля 2002 07:32 [#] [») |
|
|
Судья с математическими наклонностями придумал новый метод разрешения денежных споров. Перед тем, как вынести решение, он просит, чтобы истец и ответчик принесли ему в закрытых конвертах — нет не взятку — свои соображения о сумме компенсации. Назовем сумму, определенную истцом P, а от ответчиком — D. После этого судья выслушивает доводы обеих сторон и определяет свою сумму вознаграждения — J. Реальное значение компенсации определяется сравнением J с P и D. Если J ближе к P, ответчик платит P, если J ближе к D, ответчик платит D.
Судья намекнул истцу, что собирается назначить компенсацию в диапазоне от $3 млн до $10 млн, причем вероятность каждого значения в интервале одинакова. Сколько денег должен запросить истец, чтобы максимизировать ожидаемую компенсацию? Должен ли он изменить свое решение, если он подозревает, что ответчик смог подсмотреть его запрос?
—-
От себя добавлю еще пару вопросов:
1) рассмотреть действия истца, если диапазон судьи от $3 млн до $10 млн;
2) как должен поступить истец, если он точно уверен: «Ответчик не только подсмотрел ответ на запрос, но и знает, что я — истец — знаю про это».
Удачи!
ПВ
|
|
|
Чувствую подвох, но... ID:43984 ответ на 43983 |
Сб, 20 июля 2002 17:40 («] [#] [») |
|
|
Я думаю, что в любом случае, истец должен говорить 4 миллиона, так как эта сумма будет максимально приближена к минимальному числу судьи (3 лимона). Разве что, может быть патовая ситуация, когда ответчик определит сумму, как 2 лимона. Тут до цифры судьи, если таковая — 3, будет равный интервал...
С уважением,
|
|
|
Re: Чувствую подвох, но... ID:43985 ответ на 43984 |
Сб, 20 июля 2002 20:28 («] [#] [») |
|
|
Уди... Не судись!
|
|
|
Подвоха не чувствую, но ... ID:43991 ответ на 43983 |
Пн, 29 июля 2002 06:18 («] [#] [») |
|
|
ПВ, здравствуй.
По-моему, задача не имеет точного численного решения из-за отсутствия данных о допустимом интервале и законе распределения D. Можно предположить, учитывая психологию ответчика, что вероятность убывает с ростом D (обратно пропорциональна, или как-то иначе), но этого делать не хочется.
Ну да ладно. Попробуем как есть. Имеем целевую функцию F:
F = P, if mod(P-J) < mod(D-J)
= 0, if mod(P-J) = mod(D-J)
= D, if mod(P-J) > mod(D-J), где mod – модуль.
Область допустимых решений – [0..М], где М – максимально возможная сумма иска.
Строго говоря, для mod(P-J) = mod(D-J) F не определена, но в условии не сказано о каких либо выплатах, поэтому понимаем буквально – никто никому не платит.
Это линейная функция с двумя (в общем случае) или одной точкой разрыва. Ее график следующий :
на интервале ]J-mod(D-J)..J+mod(D-J)[ это линейно возрастающая (F=P) функция,
на интервалах [0.. J-mod(D-J)[ и ]J+mod(D-J).. M] – четыре горизонтальных отрезка (F=J-mod(D-J) для D < J и F=J+mod(D-J) для D >=J).
Точное решение таково :
- для D < J, Fmax = P = J + mod(D-J) – m, где m – минимально возможная денежная сумма.
- для D > = J, Fmax = D, при этом P принадлежит интервалу [D+m..M].
Учитывая случайный характер переменных, неразумно говорить о поиске глобального максимума, необходимо учитывать вероятность его достижения. Таким образом нас интересует максимум произведения значения F на вероятность этого значения.
Повторюсь, не зная ничего о D, его (максимум) не найти. Для D < J (т.е допустим, что ответчик не будет назначать астрономических сумм компенсации) получаются следующие оценки вероятностей получения различных доходов: для P=МО (J) = (10+3)/2 = 6.5 млн. – более 50%, т.к. когда J>=6.5 млн. – 6.5 гарантированы, когда меньше – не факт, что D ,будет ближе к J чем 6.5 млн. Аналогично для P=3+(10-3)*(2/3)=7,6(6) млн. вероятность более 33,3(3)%. В общем случае доход умноженный на вероятность больше чем Х*(10-Х)/7. Перевернутая парабола. Далее – по букварю. Производная равна 10/7-(2*Х)/7. Приравниваем к нулю. Х=5 ! (не факториал). . Да, забыл, все – в миллионах.
Дополнительные вопросы (“я знаю, что он знает”) предполагают оценку мыслительных способностей ответчика и, как следствие, получение данных о МО(D). При ответе на этот вопрос особенно настораживает факт невыплаты компенсации в случае равенства D и P. Это из области психологии. Подумаю на досуге.
Итак, с учетом оговорок ответ $5 000 000. Исправляйте, если что не так.
Всем удачи.
Миша.
|
|
|
Сорри! - Второй диапазон от $7 млн до $10 млн!!! ID:43992 ответ на 43983 |
Пн, 29 июля 2002 10:59 («] [#] [») |
|
|
> От себя добавлю еще пару вопросов:
> 1) рассмотреть действия истца, если диапазон
> судьи от $3 млн до $10 млн;
Блинн...
Конечно же опечатка, правильно: от СЕМИ до ДЕСЯТИ ($7 млн — $10 млн)
ПВ
|
|
|
> Исправляйте, если что не так. ID:43993 ответ на 43991 |
Пн, 29 июля 2002 11:03 («] [#] [») |
|
|
Пусть границы диапазона сумм Судьи — l и L.
Матожидание — mo — определяется в зависимости от соотношений величин l, L и R=(P+D)/2.
mo1(R<l) = P;
mo3(R>L) = D;
mo2(l<=R<=L) = [(L*P-P*P/2) — (l*D-D*D/2)].
В последнем случае, для mo2 могут существовать ИСТИННЫЕ экстренумы для частных производных по P и D, которые достигаются в точках L и l, соответственно.
ВАЖНЫЙ нюанс: необходима проверка на непротиворечивость сделанным ранее передположениям (ОДЗ!). Так для P (при фиксированном D!) получаем P=L. Проверяем на ОДЗ. Из требования l<=R<=L; имеем
l<=(L+D)/2<=L.
Преобразуем:
(2*l-L)<=D<=2*L.
Т.к. по смыслу задачи D<=L, то второе неравенство выполняется автоматически, а первое — лишь при условии D>=(2*l-L)!
При l=$3, L=$10 имеем D>=[(2*3-10)=-4], что с очевидностью выполняется, т.к. по смыслу задачи D>=0 (ответчик НЕ выставляет сам встречный иск!).
Ответ:
1) Истец претендует на P=L (=10$), а ответчик соглашается на D=l(=3$).
2) Обстоятельства «Ответчик не только подсмотрел ответ на запрос, но и знает, что я — истец — знаю про это» не изменяют ответа!
P.S. А вот случай L=10, l=7 — ГОРАЗДО БОГАЧЕ по содержанию... (самостоятельно, плз — не пожалеешь!)
|
|
|
Уди, глючат скрипты! ID:43994 ответ на 43993 |
Пн, 29 июля 2002 11:08 («] [#] [») |
|
|
> mo1(R
Здесь не по моей вине исчезла КОНЦОВКА строки!
Следует читать так:
mo1(при R меньше l) = P;
ПВ
|
|
|
Re: > Исправляйте, если что не так. ID:43996 ответ на 43993 |
Ср, 31 июля 2002 12:18 («] [#] [») |
|
|
Сам я задачку не решил,но постарался внимательно разобрать ответ.
В двух местах то ли опечатки, то ли я не до конца понял мысль.
>>mo2(l<=R<=L) = [(L*P-P*P/2) — (l*D-D*D/2)].
Мне показалось, надо писать так:
mo2(l<=R<=L) = [(L*P-P*P/2) — (l*D-D*D/2)]/(L-l).
и
>>l<=(L+D)/2<=L.
>>Преобразуем:
>>(2*l-L)<=D<=2*L
Вроде преобразуется в (2*l-L)<=D<=L
И еще. Из решения вытекает, что ответчик тоже знает интервал l-L, а из условия задачи это не очевидно.
Вот.
Если будет время,силы и желание — попробую разобраться с интервалом 7-10 $ ))))
И вот вспомнилась мне еще одна любопытная задачка
«Мы даем рекламное объявление, в котором обещаем обыграть казино, и приглашаем под это дело инвесторов. В назначенный день перед нашим офисом собралась толпа людей (ну, очень много... может 5 тыс. человек, может и 10 миллионов человек), предлагающих свои деньги.Разговор происходит короткий. Инвесторы заходят по одному и называют сумму, которую они готовы предложить. Мы либо соглашаемся , либо нет, после чего зовем следующего.Инвесторы очень разные, и могут предложить как 1000$, так и 10 000 000$. Так же инвесторы очень обидчивы. Если мы кому отказали, больше он с нами разговаривать не будет. Если мы с кем согласились, все остальные разворачиваются и уходят. Наша цель — получить в управление побольше денег. Какой будет оптимальная тактика выбора ? »
Предупреждаю, точного ответа я не помню. Остался в голове сам подход к решению. Но, уверен, сообща мы с задачей справимся.
Удачи
|
|
|
Re: > Исправляйте, если что не так. ID:43997 ответ на 43996 |
Чт, 1 августа 2002 03:22 («] [#] [») |
|
|
Для Cardinal.
Вариант а) взять деньги у всех.
Вариант б) если инвестор должен быть один, то подходит «Метод капризной невесты». Только она выбирала жениха. Не помню цифр (они приводились), но общая идея в том, что если имеется N испытаний и N+1 испытание на P процентов лучше, чем лучшее из N, то такого жениха нужно хватать, потому что вероятность того, что найдется еще более хороший — V.
Удачи. Миша.
P.S. ПВ, не со всем согласен, отвечу чуть позже.
|
|
|
Re: > Исправляйте, если что не так. ID:43998 ответ на 43993 |
Пн, 12 августа 2002 20:03 («] [#] [») |
|
|
ПВ. Извини за длительное отсутствие.
Во-первых, признаю, что задачу я не решил. Так как пытался решить ее в самом общем виде (допущение D < J - не нужно), в каком она численного решения НЕ ИМЕЕТ. Оба наших решения – локальные максимумы. Твое, безусловно, ближе к истине, ввиду полной адекватности математической модели. Но решение справедливо лишь для частного случая (выбранные ограничения для D и равенство нулю частных производных в mo2 P по D и D по P). В общем случае при нахождении частных производных целевой функции (ЦФ) глобальный максимум не достигается. Не всегда при поиске экстремума можно сначала дифференцировать, а потом проверять на попадание в ОДЗ. Тем более, что ЦФ в данном случае — седлообразная. При несовпадении области определения (l <= R <= L) и ОДЗ искать нужно сразу в ОДЗ с использованием методов теории оптимизации. Кстати, строго говоря, еще нужно учитывать дискретность переменных. (Этого я тоже не делал).
Cardinal обратил внимание на важный для выбора метода решения момент : ответчик ничего не знает об интервале J. ( > Судья намекнул истцу ...). Соответственно мы ничего не знаем о D. Это существенно ограничивает применение методов матанализа.
ПРИМЕР 1 : D = P/2. ОДЗ вырождается в отрезок, а ЦФ – в кривую на поверхности «седла». Максимум mo2 достигается при :
mo2 = ((L*P-P*P/2) — (l*P/2-P*P/ /(L – l)
Производная = L – P – l/2 + P/4 = 0
P = 4*(L – l/2)/3 = 34/3 = 11,3(3) (1 — везде «эль малое», кроме 11,3(3)).
Решение = 11,3(3), если 11,3(3)<M<=13,3(3), = М, в ином случае.
ПРИМЕР 2 : D = [$10 000 000 ..$20 000 000] и равномерно распределено.
mo3=min(P,D).
mo3= D*(P-10)/10 + P*(20-P)/10
Учитывая независимость D от P, и отсутствие системы ограничений
частная производная mo3(по P) = D + 20 — 2*P = 0 при P= 10 + D/2 = 20
P.S. Не в качестве «отмазки». Пытаясь найти решение в условиях неопределенности, я решил несколько другую задачу — одновременной максимизации компенсации и минимизации вероятности потерь (при J > P доход не меньше P). ЦФ это произведение оценки снизу компенсации на (1 — оценка сверху риска потерь).
(10-P)/7=1-(P-3)/7
(P-3)/7 — это вероятность того, что J<P, т.е вероятность того что компенсация будет меньше или равна P.
Здесь достаточно интересен вопрос дисперсии и риска. Суммы — огромные, а испытание только ОДНО. Получение статистически ожидаемых (P=10, D=3) 6.5 млн. невозможно в принципе. При D = 0 вероятность ничего не получить – 2/7 = 0.29. Будучи человеком осторожным, и учитывая значимость приведенных сумм, я в положении истца не гнался бы за максимумом МО. Хотя это, конечно, вопрос критерия и прямого отношения к поставленной задаче не имеет.
Всем удачи. ПВ — спасибо за задачу. Класс !
Миша.
|
|
|
Пропали две строки ID:43999 ответ на 43998 |
Пн, 12 августа 2002 20:11 («] [#] [») |
|
|
В «ПРИМЕР 1» :
Решение = 11,3(3), если 11,3(3)<M<=13,3(3), = М, в ином случае.
В «P.S.» :
(P-3)/7 — это вероятность того, что J<P, т.е вероятность того что компенсация будет меньше или равна P.
|
|
|
Еще глюк ID:44000 ответ на 43999 |
Пн, 12 августа 2002 20:17 («] [#] [») |
|
|
В «ПРИМЕР 1» :
mo2 = ((L*P-P*P/2) — (l*P/2-P*P/ /(L – l)
|
|
|
Вместо "рожица" — цифра восемь и двойные закрывающие скобки (NT) ID:44001 ответ на 44000 |
Пн, 12 августа 2002 20:22 («] [#] [») |
|
|
Нет текста сообщения
|
|
|
Re: Пропали две строки ID:44002 ответ на 43999 |
Пн, 12 августа 2002 20:32 («] [#] [») |
|
|
В «ПРИМЕР 1» :
Решение = 11,3(3), если 11,3(3) меньше M меньше равно 13,3(3), = М, в ином случае.
В «P.S.» :
(P-3)/7 — это вероятность того, что J меньше P, т.е вероятность того что компенсация будет меньше или равна P.
|
|
|
The end. ID:44003 ответ на 43998 |
Вт, 13 августа 2002 10:49 («] [#] [») |
|
|
Миша, долго ли — коротко ли, но задачка похоже себя исчерпала...
Во-первых, ты сам заметил — как тяжело постить на форум мат-выкладки; во-вторых, пара замечаний Кардинала правильна (непринципиальна с точки зрения ответа, но все же):
>> mo2(l<=R<=L) = [(L*P-P*P/2) — (l*D-D*D/2)]/(L-l).
и
>> Из l<=(L+D)/2<=L следует (2*l-L)<=D<=L.
Теперь «твои-мои» рассуждения.
1)
> Cardinal обратил внимание на важный для выбора метода
> решения момент: ответчик ничего не знает об интервале J.
> (Судья намекнул истцу ...). Соответственно мы ничего не
> знаем о D. Это существенно ограничивает применение методов
> матанализа.
Так-то оно так... Но представь себя на место ответчика. Чтобы стал делать? — ЗАНИЖАЛ бы сумму насколько возможно, НО держал бы в уме тот факт, что у судьи ЕСТЬ НЕКОТОРЫЙ РАЗУМНЫЙ интервал цифр и сильно промахнуться — себе дороже выйдет!
Поэтому мои слова:
>> Истец претендует на P=L (=10$), а ответчик соглашается на D=l(=3$)
можешь понимать так: ОТВЕТЧИКУ СИЛЬНО ПОВЕЗЕТ, если он назовет
сумму D=l(=3$)!! В противном случае, он занижает свое МО (в самом
широком смысле — для различных умственных способностей истцов!)
Истец же своим ответом P=L(=10$) максимизирует МО для всего спектра
ответчиков (J — от l до L, а D — от 0 до бесконечности)...
2)
> ПРИМЕР 1 : D = P/2. ОДЗ вырождается в отрезок,
> а ЦФ — в кривую на поверхности <седла>. Максимум mo2
> достигается при :
> mo2 = ((L*P-P*P/2) — (l*P/2-P*P/J/(L — l)
> Производная = L — P — l/2 + P/4 = 0
Миша, не понял «полета мыслей».
Как так!? P и D у нас НЕЗАВИСИМЫЕ переменные и о их функциональной связи — D = P/2; — речи не шло.
Поэтому, дальнейшая «эвилибристика» маненько не из той оперы (имхо).
============================
============================
А вот в ДОПОЛНИТЕЛЬНОМ варианте задачи, когда l=$7, L=$10 имеем D>=[(2*7-10)=+4]. Т.е. ЕСЛИ ОТВЕТЧИК желает платить менее $4-х, то найденная ранее формула для экстренума становятся НЕПРИГОДНА и max-min для mo расположены уже НА ГРАНИЦЕ диапазона [l,L]!
В качестве иллюстрации: для l=$7, L=$10; и D=0 (алчный ответчик!) прогноз истца — P=10 НЕ ЯВЛЯЕТСЯ оптимальным значением, т.к. для mo имеем mo1=10.
В то же время, при СОЗНАТЕЛЬНОМ УВЕЛИЧЕНИИ СУММЫ ИСКА истцом, mo1 возрастает. Предельное значение получается при R=l, т.е.:
R=(P+D)/2=l; —> P=2*l-D.
Подставляя значения l, D (для алчного ответчика D=0!), получаем:
P=2*7-0=14.—> Выплата поднимется до $14!... :=)))
Если ответчик «трезвомыслящий», то он ВСЕГДА назовет оптимальную для
себя цифру — D=l; в данном случае — $7. Учет ЭТОГО обстоятельства заставляет и истца поступать грамотно — «заказывать 6 пик» — $10!
===
Последний вариант задачи ЕЩЕ имеет и прикладные приложения к гэмблингу, а именно к клубному покеру; перепевы типа: «я оглянулся на нее, чтоб посмотреть не оглянулась ли она ...»!
Как нашли ранее, в случае, когда истец предполагает об алчности ответчика, его заявленная цифра P=$14 является наилучшей.
—-
А теперь следующая ситуация: истец считает ответчика алчным, а тот учитывает это обстоятельство и заявляет ОПТИМАЛЬНУЮ сумму, а именно — $3!! Все. Истец вместо предполагаемых 14-и имеет только $3.
—-
Очередной шаг: истец знает «ход мыслей» своего оппонента, — что тот заявит $3. Его ответные действия очевидны — следует заявка не $14, а... конечно $11!!
—-
........(Далее идет вечное — «кто кого насколько просчитал»)
—-
В конце концов, грамотные И и О остановятся на своих оптимальных цифрах — l и L.
УДАЧИ!
ПВ
|
|
|
Два подхода ID:44004 ответ на 44003 |
Вт, 13 августа 2002 22:22 («] [#] [») |
|
|
ПВ. Я же не спорю, что Р = 10 является наиболее приемлемым с точки зрения максимизации МО решением. Просто математически оно не строгое ( не является глобальным максимумом). Это же вероятностная задача, а не психологическая.
> от 0 до бесконечности.
В том то и дело, что не до бесконечности, а до 10. То есть не для всего спектра, а лишь для той категории ответчиков, которые правильно оценили диапазон J (см. пример 2) и при этом приняли правильное решение (см. пример 1).
> не понял “полета мыслей”.
Почему? Подсмотрел Р и, как тот таксист, который заявляет сумму вдвое больше названной, тупо ее уполовинил. Знаем мы о его алгоритме или нет — это другой вопрос, но вероятность этого (не попасть в глобальный максимум при P = 10) существует даже при D меньше 10.
Пример 1 демонстрирует возможность зависимости решения от “подсматривания” и ограниченность применимости частного дифференцирования с ПОСЛЕДУЮЩЕЙ проверкой на попадание в ОДЗ.
> P и D у нас независимые переменные.
Только до подсматривания. После может возникнуть функциональная или алгоритмическая связь.
Имеет смысл разделить оба подхода к решению : говорить либо о логическом решении с учетом психологии ответчика, тогда нужно знать алгоритм его действий или степень умственного развития (для оценки вероятности применения им тех или иных алгоритмов) (действительно клубный покер), либо о математическом, когда мы предусматриваем любые D, но учитываем вероятности выпадения тех или иных значений, тогда они должны быть заданы (это уже BJ).
ПРИМЕР 3. Диапазон D = [ 0..15], без подсматривания, распределение равномерное ( жизненнее было бы убывающее, но лень возиться с пропорциями, а для нелинейного случая с интегралами ).
Для интервала [0..10] решение — 10, для [10-15] — 15. Ищем в этом диапазоне.
mo = P, if D больше P
= D, if 10 меньше равно D меньше равно P
= mo2, if D меньше 10
mo = P * ( 15 — P ) / 15 + D * ( P — 10 ) / 15 + mo2 * 10 / 15
Производная (по P) = ( 15 — 2 * P ) / 15 + D / 15 + 10 / 15 * ( L — P ) / 7 = 0
при P = 205 / 24 + D * 7 / 24 = 12,915
Кстати любое распределение D с интервалом, верхний диапазон которого больше 10, сместит максимум МО за счет первых двух составляющих mo.
Всем удачи.
Миша.
|
|
|
Ошибка ID:44005 ответ на 44004 |
Ср, 14 августа 2002 06:34 («] [#] |
|
|
Извините, поторопился. В Примере 3 :
mo = P, if D больше P
= D, if 20 – P меньше равно D меньше равно P
= mo2, if D меньше 20 – P
mo = P * ( 15 – P ) / 15 + D * ( 2 * P – 20 ) / 15 + mo2 * ( 20 – P ) / 15
Производная (по Р) = 1 – 2 * P / 15 + 2 * D / 15 + 1 / 105 * ( 200 – 40 * P + 3 * P * P / 2 – D * D / 2 + 3 * D ) = 1 / 210 * ( 3 * P * P – 108 * P + 610 – D * D + 34 * D ) = 0
Квадратное уравнение, один корень вне диапазона, другой – 12,93
|
|
|