Re: Предел доверия. ID:32597 ответ на 32585 |
Чт, 4 сентября 2008 23:57 [#] |
|
|
Не знаю, ху из роза Парацельса.
Долго не отвечал, потому что хотел подтвердить мысли расчетами, но видимо руки до этого не дойдут. Поэтому хотя бы мысли.
0.0027 - да, в обе стороны, более правильно использовать 0.00135
23.7% не опечатка, а (1 - (1 - 0.0027)^100) = 0.2369
"Размер выборки для того чтобы ее можно было оценить с помощью закона нормального распределения" - принято, что достаточно 50-100. Чем больше выборка, тем ближе итоговое распределение к нормальному, при 100 обычно бывает достаточно близко. Насколько близко, надо считать или симулировать конкретную игру. Общая оценка по какому-то там неравенству из статистики очень грубая.
Количество выборок с отклонениями можно оценить через те же 3 СКО
Но так как в данном случае событие простое с известной вероятностью 0.00135, лучше оценивать точно, можно использовать функцию excel БИНОМРАСП (в английском тоже что-то вроде этого). Ответ на твой вопрос "как это оценить" - использовать эту функцию.
Например, с ее помощью можно вычислить, что из 100 экспериментов событие с вероятностью 0.00135 произойдет 1 или более раз с вероятностью 0.12643638, 2 или более раз с вероятностью 0.0082634, 3 или более раз с вероятностью 0.0003607 и так далее. 2 раза уже вызовут серьезные подозрения, 3 - почти гарантия мошенничества. Важно считать вероятность именно "2 или более", а не просто "2". Определяется последним параметром БИНОМРАСПа.
Теперь почему мне кажется, что такие оценки не имеют смысла, и достаточно оценки по 3 СКО общего результата.
Если вдруг так оказалось, что 3 раза из 100 был вылет за 3 СКО, то есть неплохие шансы, что и в суммарном результате будет заметно отклонение. Если предположить, что мошенничество имеет место, то с большой вероятностью оно будет замечено в суммарной выборке. Грубо говоря, если оно есть и обнаруживается оценками кусков, то чтобы не обнаружилось в целом, должны произойти близкие к невероятным события, порядки вероятностей те же, что и сама оцененная вероятность типа 0.0003607 из предыдущего абзаца. Так как вероятность разницы проверок обычной и предлагаемой тобой мала, то не имеет смысла заморачиваться. Думаю, что так, но не гарантирую, так как для этого надо вычислять. Это для случая, когда предполагается, что игра не меняется, и либо заряжают всегда, либо никогда.
Еще один аргумент против поиска хитрых способов оценки - если навыдумывать слишком много способов, то вероятность того, что какой-нибудь из них покажет отклонение, будет высока и для "правильной" игры. Поделил по 1000 сдач - не нашел отклонений, по 500 не нашел, а по 250 нашел - что это значит? А хрен его знает.
|
|
|