CLT — это статистическое предположение о том, что при достаточно большом размере выборки из совокупности с конечным уровнем дисперсии среднее значение всех переменных, выбранных из одной и той же совокупности, будет примерно равно среднему значению всей совокупности. Согласно центральной предельной теореме, среднее значение выборки данных станет ближе к среднему значению всей рассматриваемой совокупности по мере увеличения размера выборки, независимо от фактического распределения данных. Давайте разберемся, что такое центральная предельная теорема, для чего она нужна и ее ключевые компоненты.
Что такое центральная предельная теорема (ЦПТ)?
В теории вероятностей центральная предельная теорема (ЦПТ) утверждает, что распределение выборочной переменной приближается к нормальному распределению (т.е. к «колокольчатой кривой») по мере увеличения размера выборки, при условии, что все выборки одинаковы по размеру и независимо от размера. фактическая форма размещения населения. Другими словами, CLT — это статистическое предположение о том, что при достаточно большом размере выборки совокупности с конечным уровнем дисперсии среднее значение всех переменных, выбранных из одной и той же совокупности, будет примерно равно среднему значению всей совокупности. Более того, эти выборки приближаются к нормальному распределению, и их дисперсия примерно равна дисперсии генеральной совокупности по мере увеличения размера выборки в соответствии с законом больших чисел. Хотя эта концепция была впервые разработана Абрахамом де Муавром в 1733 году, она не была формализована до 1920 года, когда знаменитый венгерский математик Джордж Полиа назвал ее центральной предельной теоремой.
Для чего нужна центральная предельная теорема (ЦПТ)?
Согласно центральной предельной теореме, среднее значение выборки данных станет ближе к среднему значению всей рассматриваемой совокупности по мере увеличения размера выборки, независимо от фактического распределения данных. Другими словами, данные точны независимо от того, является ли распределение нормальным или аберрантным. Как правило, размер выборки от 30 до 50 считается достаточным для соблюдения CLT, а это означает, что распределение средних выборочных значений является вполне нормальным. Следовательно, чем больше выборок будет взято, тем больше результаты будут напоминать нормальное распределение. Однако обратите внимание, что центральная предельная теорема по-прежнему будет аппроксимироваться во многих случаях для гораздо меньших размеров выборки, например, n=8 on=5.3.
Ключевые компоненты центральной предельной теоремы
Центральная предельная теорема состоит из нескольких ключевых особенностей. Эти характеристики в значительной степени связаны с выборками, размером выборки и совокупностью данных.
- Выборка последовательная. Это означает, что некоторые единицы выборки являются общими с единицами выборки, отобранными ранее.
- Выборка случайная. Все образцы должны отбираться случайным образом, чтобы они имели одинаковую статистическую вероятность быть отобранными.
- Выборки должны быть независимыми. Выборки или результаты одной пробы не должны влиять на будущие пробы или результаты других проб.
- Образцы должны быть ограничены. Часто говорят, что выборка не должна превышать 10% генеральной совокупности, если выборка производится без замены. В целом, больший размер популяции оправдывает использование выборки большего размера.
- Размер выборки увеличивается. Центральная предельная теорема становится актуальной по мере того, как отбирается больше выборок.