Виды дисперсии, правило сложения дисперсий


Виды дисперсии и правило их сложения

Изучение вариации (колеблемости, рассеивания) (см. Показатели вариации) признака по всей совокупности в целом, предусматривает изучение вариации для каждой из составляющих ее групп, а также  между этими группами. В простейшем случае, когда совокупность разбита на группы по одному фактору, изучение вариации достигается посредством исчисления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой.

Общая дисперсия D(x) измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака i) от общей средней величины и может быть вычислена как: 1. простая дисперсия   2. взвешенная дисперсия

Межгрупповая дисперсия (факторная) характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних  от общей средней:

Внутригрупповая дисперсия (частная, остаточная, случайная)  отражает случайную вариацию неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы i) от средней арифметической этой группы (xср) (групповой средней) и может быть исчислена как:

1. простая дисперсия  2. взвешенная дисперсия

На основании внутригрупповой дисперсии по каждой группе  можно определить общую среднюю из внутригрупповых дисперсий:

Дисперсия и среднее значение доли альтернативного признака

Среди варьирующих признаков, которые изучает статистика, встречаются признаки, которые проявляются в том, что у одних единиц совокупности эти признаки наблюдаются, у других нет. Иными словами: альтернативный признак - это такой единственный признак, который может принимать единица совокупности из всех возможных вариантов. Если рассматривать продукцию по категориям (сортам), то она может быть либо   только  I  категории (сорта),  либо только II категории (сорта) — в данном контексте следует рассматривать эти признаки как два противоположных события.  Признаки, которыми обладают одни единицы и не обладают другие, называются альтернативными. Количественно вариация альтернативного признака в численности всей совокупности обозначается p,  а доля единиц, не обладающих этим признаком, обозначается q  и принимает значения: p=1, q=0 

(смотри  Ошибка выборки  для доли альтернативного признака)

  1. Среднее значение для доли альтернативного признака
  2. Дисперсия альтернативного признака

Подставив в формулу дисперсии q = 1 – p, получим:

Таким образом, дисперсия альтернативного признака равна произведению доли на дополняющее эту долю до единицы число. Т.к. p+q=1, то средний квадрат отклонений не может быть больше 0,25. Среднеквадратическое отклонение доли альтернативного признака:

Правило сложения дисперсий

Согласно правилу сложения дисперсий, общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий.

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью – неизвестную. Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака на изучаемый признак. Поэтому в статистическом анализе широко используется эмпирический коэффициент детерминации - показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:

При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной связи – единицеЭмпирическое корреляционное отношение (см. пример) – это корень квадратный из эмпирического коэффициента детерминации:

Он показывает тесноту связи между группировочным и результативным признаками. Эмпирическое корреляционное отношение может принимать значения от 0 до 1. Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации. Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака. Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.

Смотри схему дисперсионного анализа:  Проверка адекватности регрессионной модели

Примечание: приведены так же формулы расчета коэффициента детерминации и корреляционного отношения, которые используются при анализе рядов динамики.

Пример расчета дисперсии

Условие:

Объем дневной выручки в 5 торговых точках составил: 16, 21, 26, 23, X(у.е.). Учитывая, что Хср.= 22, найти выборочную дисперсию S2

Решение: Опр. среднюю

\bar{X}=\frac{\sum{}^{}X{i}}{{n}}=\frac{16+21+26+23+{X}{5}}{5}=22\Rightarrow

X {5}{}=110-86=24\Rightarrow

S {}^{2}=\sum{}^{}\left(X{i}{}-\bar{X} \right){}^{2}=\left(16-22 \right){}^{2}+\left(21-22 \right){}^{2}+\left(26-22 \right){}^{2}+\left(23-22 \right){}^{2}+ \left(24-22 \right){}^{2}=58

Смотри также