Центральная предельная теорема (ЦПТ): что это такое и как она работает

CLT — это статистическое предположение о том, что при достаточно большом размере выборки из совокупности с конечным уровнем дисперсии среднее значение всех переменных, выбранных из одной и той же совокупности, будет примерно равно среднему значению всей совокупности. Согласно центральной предельной теореме, среднее значение выборки данных станет ближе к среднему значению всей рассматриваемой совокупности по мере увеличения размера выборки, независимо от фактического распределения данных. Давайте разберемся, что такое центральная предельная теорема, для чего она нужна и ее ключевые компоненты. 

Что такое центральная предельная теорема (ЦПТ)?

В теории вероятностей центральная предельная теорема (ЦПТ) утверждает, что распределение выборочной переменной приближается к нормальному распределению (т.е. к «колокольчатой ​​кривой») по мере увеличения размера выборки, при условии, что все выборки одинаковы по размеру и независимо от размера. фактическая форма размещения населения. Другими словами, CLT — это статистическое предположение о том, что при достаточно большом размере выборки совокупности с конечным уровнем дисперсии среднее значение всех переменных, выбранных из одной и той же совокупности, будет примерно равно среднему значению всей совокупности. Более того, эти выборки приближаются к нормальному распределению, и их дисперсия примерно равна дисперсии генеральной совокупности по мере увеличения размера выборки в соответствии с законом больших чисел. Хотя эта концепция была впервые разработана Абрахамом де Муавром в 1733 году, она не была формализована до 1920 года, когда знаменитый венгерский математик Джордж Полиа назвал ее центральной предельной теоремой.

формулы

Формула центральной предельной теоремы. Источник: Inchcalculator.com.

Для чего нужна центральная предельная теорема (ЦПТ)?

Согласно центральной предельной теореме, среднее значение выборки данных станет ближе к среднему значению всей рассматриваемой совокупности по мере увеличения размера выборки, независимо от фактического распределения данных. Другими словами, данные точны независимо от того, является ли распределение нормальным или аберрантным. Как правило, размер выборки от 30 до 50 считается достаточным для соблюдения CLT, а это означает, что распределение средних выборочных значений является вполне нормальным. Следовательно, чем больше выборок будет взято, тем больше результаты будут напоминать нормальное распределение. Однако обратите внимание, что центральная предельная теорема по-прежнему будет аппроксимироваться во многих случаях для гораздо меньших размеров выборки, например, n=8 on=5.3.

графика

Иллюстрация центральной предельной теоремы для предвзятой совокупности значений. Источник: ResearchGate

Ключевые компоненты центральной предельной теоремы

Центральная предельная теорема состоит из нескольких ключевых особенностей. Эти характеристики в значительной степени связаны с выборками, размером выборки и совокупностью данных.

  1. Выборка последовательная. Это означает, что некоторые единицы выборки являются общими с единицами выборки, отобранными ранее.
  2. Выборка случайная. Все образцы должны отбираться случайным образом, чтобы они имели одинаковую статистическую вероятность быть отобранными.
  3. Выборки должны быть независимыми. Выборки или результаты одной пробы не должны влиять на будущие пробы или результаты других проб.
  4. Образцы должны быть ограничены. Часто говорят, что выборка не должна превышать 10% генеральной совокупности, если выборка производится без замены. В целом, больший размер популяции оправдывает использование выборки большего размера.
  5. Размер выборки увеличивается. Центральная предельная теорема становится актуальной по мере того, как отбирается больше выборок.

Оставьте свой комментарий

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

*

*

  1. Ответственный за данные: Мигель Анхель Гатон
  2. Назначение данных: контроль спама, управление комментариями.
  3. Легитимация: ваше согласие
  4. Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
  5. Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
  6. Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.