Re: Скупой платит дважды, тупой платит трижды, лох платит постоянно! – Или, снова о Шкатулках ID:31838 ответ на 31791 |
Сб, 11 августа 2007 14:49 [#] |
|
|
Korovin писал сб, 11 августа 2007 14:43 | Давай пока перекурим и трезво посмотрим назад. Была исходная задача Нукера от 10 мая, вот она http://forum.cgm.ru/msg?th=15558&start=0 Ее мы все (кроме тебя?) все это время обсуждали. | Я её увидел только в конце большой темы, когда анализировал применимость к данной задаче теории игр...
Korovin писал сб, 11 августа 2007 14:43 | Давай определимся что мы обсуждаем дальше с этой точки. Я за исходную задачу Нукера. Ты против? Можем обсудить примение моей теории к обоим задачам. С какой начнем? | Я, в принципе, не против исходной задачи Нюкера, так как твоя формулировка в прошлой ветке излишне упрощает задачу - всю логику её решения я расписал выше и твоя стратегия туда вообще никаким боком не подходит.
Ок, теперь займемся задачей Нюкера.
SunnyRay писал пт, 10 августа 2007 23:26 | Всё, что доказано к этому моменту - это факт того, что стратегия Коровина лучше тупых стратегий "всегда менять", "никогда не менять", и "менять с некоторой вероятностью". | Начнем с приятных новостей - стратегия Коровина отлично работает! А теперь плохие новости - работает она не всегда и не везде, в частности для нашей задачи она не рабоатет
Но давайте все по порядку.
Для начала <font color="red">ЖУТКО ОТКЛОНИМСЯ</font> от нашей исходной задачи и рассмотрим как работает "парадокс значимых сумм" при равномерном распределении Х, если <font color="red">ДОПУСТИТЬ</font>, что этот самый Х является СВ с равномерным распределением, да ещё и с конечной верхней границей для Х.
Пишем небольшую программу, в которой будем вычислять численным методом МО игры при ДАННОМ ЖУТКОМ ДОПУЩЕНИИ. Для этого возьмем диапзон допустимых значений для Х=[1...Xmax], проведем кучу серий по куче испытаний в каждом, определим распределение средней суммы выигрыша как СВ (очевидно, что распределение будет нормальным) и определим МОигры - только в пределах данных допущений оно будет вполне определенной величиной, доступной для поиска эффективных стратегий.
Итак, запускаем программу для Хмах=10000 и разных К. Получаем (с учетом погрешности):
K=0 MO=7502
K=1000 MO=7520
K=2000 MO=7577
K=3000 MO=7670
K=4000 MO=7801
K=5000 MO=7970
K=6000 MO=8177
K=7000 MO=8420
K=8000 MO=8702
K=9000 MO=9020
K=10000 MO=9375
K=11000 MO=9246
K=12000 MO=9101
K=13000 MO=8946
K=14000 MO=8776
K=15000 MO=8595
K=16000 MO=8401
K=17000 MO=8195
K=18000 MO=7977
K=19000 MO=7745
K=20000 MO=7501
Действительно, в результате мы получили существенное увеличение МОигры, которое при К=0 и при равномерном распределении Х МОигры=0,75Хмах.
Какие выводы следуют из данной симуляции:
1) Самый главный вывод: максимальное увеличение МОигры (25% от рассчетного при тупых стратегиях) достигается при К=Хmax. Запомним это!
2) Жадность лучше чем скупость Лучше не угадать Х в бОльшую сторону, чем в меньшую. Например, для увеличения МО чуть больше чем на 6%, нужно попасть в диапазон от 0,5Х до 1,8Х, то есть правая граница существенно дальше левой.
3) Увеличение МО происходит, если К попадает в интервал от 0 до 2Хmax (что тоже очевидно)
4) Интересно выглядит график относительного увеличения МО в % при различных К из допустимого диапазона.
А ведь нам НИЧЕГО не известно про Хмах, поэтому жадные люди тоже ничего не получат, если назначат К равном 1 млн, а окажется, что игра имеет Хмах=10000.
В итоге получаем, что даже НЕ для нашей ИСХОДНОЙ задачи, а для задачи, приближенной к исходной, назначеие К превращается в гадание на кофейной гуще. Можем угадать, а можем и нет - как это относится к математике?
А вот для того, чтобы НЕМНОГО БОЛЬШЕ приблизиться к нашей ИСХОДНОЙ задаче, К нужно брать (в соответствии с главным выводом) равным бесконечности (так как Х не имеет верхней границы), что является АБСОЛЮТНОЙ БЕССМЫСЛИЦЕЙ.
Таким образом, несмотря на то, что мы изначально отступили от нашей задачи, допустив что Х является СВ с равномерным распределением, мы все-равно получили вывод о фактической бессмысленности данной стратегии для нашей КОНКРЕТНОЙ задачи. Если же Х имеет хитрое распределение, то всегда можно подобрать такие варианты, когда стратегия Коровина не работает, а может быть и ухудшает ситуацию.
Ну и самое главное заключается в том, что Х в ИСХОДНОЙ задаче вообще не является случайной величиной, и стратегия Коровина вообще ничего не даёт, так как является просто бессмысленной затеей.
Надеюсь все отметили, что потеря даже одного слова из формулировки Нюкера совершенно изменило задачу. Чего же говорить о том, что исходя из условия задачи мы просто НЕ ИМЕЕМ ПРАВА считать Х случайной величиной!!!
Вовод: стратегия Коровина не применима к задаче и в формулировке Нюкера, и в формулировке самого Коровина.
А вот для конечного (и жизненно-реального) Хмах и при равномерном распределении Х, придерживаться данной стратегиии более чем целесообразно. Однако это будет ДРУГАЯ задача, и решаться аналитически она будет ПО-ДРУГОМУ.
|
|
|