Уровни понимания теории вероятностей
Apr. 16th, 2017 08:45 amМы бросаем монету. Десять раз подряд выпал орёл. Какова вероятность того, что в одиннадцатый раз тоже выпадет орёл? Варианты ответа: меньше 0,5; ровно 0,5; больше 0,5.
Уровень понимания 1 (детский). Такая серия орлов очень маловероятна. Везение должно кончиться, наверняка следующий раз выпадет решка. Ответ: меньше 0,5.
Уровень 2 (школьный). Броски монеты независимы, на вероятность выпадения орла не влияют результаты предыдущих испытаний, поэтому ровно 0,5.
Уровень 3 (студенческий). Следует учесть возможность того, что монета нечестная, т. е. вероятность однократного выпадения орла выше 0,5. При условии нулевой гипотезы (что монета честная) вероятность получить 10 орлов подряд = 1/1024, что значительно меньше общепризнанного порога значимости 0,05. Поэтому нулевую гипотезу следует отвергнуть. Скорее всего, монета нечестная. Вероятность 11-го орла больше 0,5.
Уровень 4 (профессиональный). Нечестных монет, скорее всего, гораздо меньше, чем честных. (Наверняка меньше, чем 1 из 1000. Это же не рулетка, ни у кого нет интереса их подделывать, а случайно отчеканить сильно неуравновешенную монету не так-то просто). Поэтому мы скорее получим серию из 10 орлов, бросая честную монету, чем случайно обнаружим в своём кошельке нечестную. На языке теоремы Байеса: Р(10 орлов|честная монета) = 1/1024 < Р(10 орлов|нечестная монета), но в силу того, что априорная вероятность Р(честная монета) >> Р(нечестная монета), получаем Р(честная монета|10 орлов) > Р(нечестная монета|10 орлов). А раз монета честная, то и вероятность 11-го орла равна 0,5.
И даже если не делать априорных предположений о доле нечестных монет, нужно учесть вот что: наша монета наверняка не только что отчеканена, у неё есть история, а значит, вполне возможно, что её бросали и раньше. Значит, наши 10 орлов - лишь эпизод в серии орлов и решек, возможно, очень длинной. А это сильно повышает вероятность получить 10 орлов подряд при условии честности монеты: где-нибудь внутри серии, например, из 10 000 бросков она равна 1 - (1-1/1024)**1000 ≈ 0,62. Итак, учёт предыстории ещё больше повышает вероятность того, что монета честная, а значит, и вероятность выпадения 11-го орла, скорее всего, равна точно 0,5.
Вот оно как непросто-то.
Уровень понимания 1 (детский). Такая серия орлов очень маловероятна. Везение должно кончиться, наверняка следующий раз выпадет решка. Ответ: меньше 0,5.
Уровень 2 (школьный). Броски монеты независимы, на вероятность выпадения орла не влияют результаты предыдущих испытаний, поэтому ровно 0,5.
Уровень 3 (студенческий). Следует учесть возможность того, что монета нечестная, т. е. вероятность однократного выпадения орла выше 0,5. При условии нулевой гипотезы (что монета честная) вероятность получить 10 орлов подряд = 1/1024, что значительно меньше общепризнанного порога значимости 0,05. Поэтому нулевую гипотезу следует отвергнуть. Скорее всего, монета нечестная. Вероятность 11-го орла больше 0,5.
Уровень 4 (профессиональный). Нечестных монет, скорее всего, гораздо меньше, чем честных. (Наверняка меньше, чем 1 из 1000. Это же не рулетка, ни у кого нет интереса их подделывать, а случайно отчеканить сильно неуравновешенную монету не так-то просто). Поэтому мы скорее получим серию из 10 орлов, бросая честную монету, чем случайно обнаружим в своём кошельке нечестную. На языке теоремы Байеса: Р(10 орлов|честная монета) = 1/1024 < Р(10 орлов|нечестная монета), но в силу того, что априорная вероятность Р(честная монета) >> Р(нечестная монета), получаем Р(честная монета|10 орлов) > Р(нечестная монета|10 орлов). А раз монета честная, то и вероятность 11-го орла равна 0,5.
И даже если не делать априорных предположений о доле нечестных монет, нужно учесть вот что: наша монета наверняка не только что отчеканена, у неё есть история, а значит, вполне возможно, что её бросали и раньше. Значит, наши 10 орлов - лишь эпизод в серии орлов и решек, возможно, очень длинной. А это сильно повышает вероятность получить 10 орлов подряд при условии честности монеты: где-нибудь внутри серии, например, из 10 000 бросков она равна 1 - (1-1/1024)**1000 ≈ 0,62. Итак, учёт предыстории ещё больше повышает вероятность того, что монета честная, а значит, и вероятность выпадения 11-го орла, скорее всего, равна точно 0,5.
Вот оно как непросто-то.
no subject
Date: 2017-04-16 09:02 am (UTC)no subject
Date: 2017-04-16 03:25 pm (UTC)И да, на тот момент я теорию вероятности знал на уровне 1.
no subject
Date: 2017-04-18 07:36 am (UTC)Это не уровни понимания, а уровни использования
Date: 2017-04-21 10:16 am (UTC)Первый уровень не детский, скорее бытовой. Теории вероятностей человек не знает, руководствуется наблюдениями. А в реальной жизни нет независимых событий. И всё охвачено обратными связями. Отрицательными, если объект стабилен, или положительными, если бурно развивается. И если есть основания считать, что состояние не меняется - есть основание ждать отрицательных связей. Если перворазрядники Петя и Вася играют в одну силу, но Петя десять раз выиграл у Васи (но по другим турнирам видно, что силы равны), то можно ожидать, что на одиннадцатый раз Вася поймёт хитрый Петин гамбит и научится отвечать на него, а то - Петя расслабится, ожидая очередного триумфа, и зевнёт.
Второй уровень - теоретико-вероятностный. А теория вводит какие-то абстракции. В данном случае "независимые равновероятные события". Реальность может соответствовать абстракциям, может не соответствовать, но в чисто теоретическом рассмотрении они постулируются. И студент должен отвечать сообразно постулатам. Но и более высокий уровень понимания может оперировать "независимыми равновероятными", только предварительно доказав, что эта гипотеза согласуется с реальностью.
На третьем уровне появляется статистика, вероятности в ней не постулируются, а получаются из наблюдений. И десять подряд "орлов" сильный аргумент в пользу ошибочности гипотезы "НР". Есть основания то ли ловить "двухорловый пятак", то ли магнит и железную половину монеты, то ли ошибку регистрации "орлов".
Четвёртый уровень предполагает источник априорных сведений о монетах. И наши наблюдения не дают нам знание вероятности, а уточняют его, если у нас "двухорловый" один из тысячи пятаков, то 10 орлов подряд будут менее чем один раз из тысячи для честной, и всегда для шулерской монеты, и вероятность того, что монета шулерская, возрастает до примерно 1/2.
Пятый, не перечисленный тут уровень вовлекает ещё и функцию потерь. И мы принимаем решение не по максимуму вероятности, а по минимуму потерь. Если продолжение общения с шулером обойдётся нам в тысячу, а отказ от игры с честным человеком в сто рублей, то даже если вероятность того, что это шулер, немногим более 0.1, лучше отказаться.
Что до "учёта предыстории" - то, как бы древня ни была монета, сколько бы бросаний она ни пережила, эти 10 бросаний сейчас и от прошлых никак не зависят. Вот если мы рассматриваем все 10000 бросков, то серия из 10 подряд ничего о фальшивости монеты не говорит. Вообще, человек склонен преувеличивать важность совпадений, считая их слишком маловероятными для случайности. Это не только вероятностный факт, см. "теория Рамсея".
Re: Это не уровни понимания, а уровни использования
Date: 2017-04-21 10:45 am (UTC)Единственное, с чем не соглашусь: "Что до "учёта предыстории" - то, как бы древня ни была монета, сколько бы бросаний она ни пережила, эти 10 бросаний сейчас и от прошлых никак не зависят."
Броски не зависят, но вероятности наших гипотез зависят. На два вопроса: 1) "монету бросили десять раз, все десять выпал орёл - какова вероятность того, что монета честная?" и 2) "монету бросили N раз, из них десять раз подряд выпал орёл, про остальные мы ничего не знаем - какова вероятность того, что монета честная?" - ответы разные.
Это разные вопросы.
Date: 2017-04-21 12:41 pm (UTC)no subject
Date: 2017-10-29 06:47 pm (UTC)no subject
Date: 2017-10-29 09:26 pm (UTC)