Формы распределения: асимметрия, эксцесс

Формы распределения. Коэффициенты  асимметрии и эксцесса.

Любое реальное распределение можно изобразить схематически в виде кривой, воспроизводящей основные особенности данного распределения. Под кривой распределения понимается графическое изображение в виде непрерывной линии изменения частот, функционально связанных с изменением вариант. 

Элементами распределения являются:

  • варианта
  • частота

В зависимости от вида кривых, изображающих распределение, выделяют несколько основных типов распределения:

  • одновершинные
  • многовершинные

К одновершинным относятся те, в которых один, обычно центральный вариант, имеет наибольшую частоту (плотность распределения). Частоты же остальных вариантов убывают по мере удаления от центрального. 

Если частоты убывают слева и справа от центрального значения одинаково, то такие распределения называются симметричными. 

Если частоты убывают слева и справа от центра распределения с разной скоростью, то такие распределения называют асимметричными. 

Многовершинные распределения — это распределения, в которых несколько центров, т. е. такие, у которых несколько максимумов  частот.

Для однородных совокупностей, как правило, характерны одновершинные распределения.

Многовершинность распределения свидетельствует о неоднородности изучаемого явления. В этом случае необходимо произвести перегруппировку данных с целью выделения более однородных групп.

Выяснение общего характера распределения предполагает, наряду с оценкой его однородности, вычисление показателей асимметрии и эксцесса.

Кривые распределения бывают:

  1. симметричными
  2. асимметричными.

В зависимости от того, какая ветвь кривой распределения вытянута, различают:

  1. правостороннюю асимметрию
  2. левостороннюю асимметрию.

Для характеристики степени асимметрии двух или нескольких рядов пользуются коэффициентом асимметрии.

Для одновершинных распределений:

    \[{A_s} = \frac{{\bar X - {M_o}}}{\sigma }\quad \quad {A_s} = \frac{{\bar X - {M_e}}}{\sigma }\]

Более точным является коэффициент асимметрии, рассчитанный как отношение центрального момента третьего порядка (μ3) к среднеквадратическому отклонению в 3-й степени (Ϭ3):

    \[{A_s} = \frac{{{\mu ^3}}}{{{\sigma ^3}}}\; \to {\mu ^3} = \frac{{\sum\limits_{i = 1}^n {{{({X_i} - \bar X)}^3}}  \cdot {f_i}}}{{\sum\limits_{i = 1}^n {{f_i}} }}\]

1. Для симметричного распределения: 

    \[{A_s} = 0\; \to \quad \bar X = {M_e} = {M_o}\]

Соответственно, в симметричном распределении центральный момент 3-го порядка равен нулю (μ3=0), т. е. алгебраическая сумма отклонений отдельных значений признака (вариант), расположенных слева и справа от средней, равна нулю. График симметричного распределения симметричен относительно точки максимума.

Для несимметричных распределений центральные моменты нечетного порядка отличны от нуля:

2. Асимметрия положительна (As>0), если длинная часть кривой распределения расположена справа от модыо). В этом случае соотношение между средней, медианой и модой нарушено:

    \[{M_o} < \,{M_e} < \,\bar X\; \to \;\bar X - {M_o} = '' + ''\]

 3. Асимметрия отрицательна (As<0), если длинная часть кривой распределения расположена слева от модыо).

    \[{M_o} > \,{M_e} > \bar X\; \to \;\bar X - {M_o} = '' - ''\]

 As< 0.25 – слабая асимметрия

As= 0.25-0.5 – умеренная асимметрия

As> 0.5 – крайне асимметричное распределение

Для оценки «крутизны» (островершинности) распределения пользуются характеристикой – эксцессом.

Коэффициент эксцесса:

    \[{E_X} = \frac{{{\mu ^4}}}{{{\sigma ^4}}} - 3\; \to {\mu ^4} = \frac{{\sum\limits_{i = 1}^n {{{({X_i} - \bar X)}^4}}  \cdot {f_i}}}{{\sum\limits_{i = 1}^n {{f_i}} }}\]

1. Для нормального распределения:

    \[{E_X} = 0\,\, \to \;\,\frac{{{\mu ^4}}}{{{\sigma ^4}}} = 3\]

2. Выше нормального (островершинное распределение):

    \[{E_X} = \frac{{{\mu ^4}}}{{{\sigma ^4}}} - 3 > 0\; \to \frac{{{\mu ^4}}}{{{\sigma ^4}}} > 3\]

3. Ниже нормального (плосковершинное распределение):

    \[{E_X} = \frac{{{\mu ^4}}}{{{\sigma ^4}}} - 3 < 0\; \to \frac{{{\mu ^4}}}{{{\sigma ^4}}} < 3\]

Распределение объемов молока по жирности

1. Определим средний % жирности всего объема молока по средней арифметической взвешенной:

    \[\bar X = \frac{{\sum\limits_{i = 1}^n {{x_i} \cdot {f_i}} }}{{\sum\limits_{i = 1}^n {{f_i}} }} = \frac{{9196}}{{2580}} = 3.564\,\left( \%  \right)\]

2. Определим среднеквадратическое отклонение взвешенное:

    \[{\sigma _X} = \sqrt {\frac{{\sum\limits_{i = 1}^n {{{({X_i} - \bar X)}^2}}  \cdot {f_i}}}{{\sum\limits_{i = 1}^n {{f_i}} }}}  = \sqrt {\frac{{172.919}}{{2580}}}  = 0.2589\]

3. Определим моду. Модальным интервалом будет интервал с наибольшей частотой. Это интервал 3,4-3,6, на который приходится 780 ц молока.

    \[{M_o} = {X_{{M_o}}} + h\frac{{{f_2} - {f_1}}}{{\left( {{f_2} - {f_1}} \right) + \left( {{f_2} - {f_3}} \right)}} = 3.4 + 0.2\frac{{780 - 450}}{{\left( {780 - 450} \right) + \left( {780 - 620} \right)}} = 3.535\]

4. Определим медиану. Медианным интервалом является интервал 3,4-3,6, т. к. он первый, на который приходится более 50% суммы накопленных частот.

    \[{M_e} = {X_{{M_e}}} + h\frac{{\frac{{\sum {{f_i}} }}{2} - \sum {{f_{{M_e} - 1}}} }}{{{f_{{M_t}}}}} = 3.4 + 0.2\frac{{\frac{{2580}}{2} - 680}}{{780}} = 3.556\,(\% )\]

5. Коэффициент асимметрии:

    \[{A_s} = \frac{{{\mu ^3}}}{{{\sigma ^3}}} = \frac{{0.00109}}{{0.01735}} = 0.0629 > 0\]

    \[{\mu ^3} = \frac{{\sum\limits_{i = 1}^n {{{({X_i} - \bar X)}^3}}  \cdot {f_i}}}{{\sum\limits_{i = 1}^n {{f_i}} }} = \frac{{2,81534}}{{2580}} = 0,00109\]

6. Коэффициент эксцесса:

    \[{E_X} = \frac{{{\mu ^4}}}{{{\sigma ^4}}} - 3 = \frac{{0.01078}}{{0.00449}} - 3 =  - 0.5999 < 0\]

    \[{\mu ^4} = \frac{{\sum\limits_{i = 1}^n {{{({X_i} - \bar X)}^4}}  \cdot {f_i}}}{{\sum\limits_{i = 1}^n {{f_i}} }} = \frac{{27,8161}}{{2580}} = 0,01078\]

Данное распределение плосковершинное (Ex=-0.5999<0), со слабо выраженной правосторонней асимметрией (As: 0 < 0.0629 < 0.25).

    \[{M_o} < \,{M_e} < \,\bar X\; \to \;3.535 < 3.556 < 3.564\]

Смотри также по теме:

 

 

Добавить комментарий