Структурные средние: мода, медиана


Структурные средние

Для характеристики рядов распределения (структуры вариационных рядов), наряду со средней, используются т. н. структурные средние: мода и медиана. Мода и медиана наиболее часто используются в экономической практике.

Мода- варианта, которая наиболее часто встречается  в ряду распределения (в данной совокупности).

В дискретных вариационных рядах мода определяется по наибольшей частоте. Предположим товар А реализуют в городе 9 фирм по следующим ценам в рублях:

44; 43; 44; 45; 43; 46; 42; 46;43Так как чаще всего встречается цена 43 рубля, то она и будет модальной.

При характеристике социальных групп населения по уровню дохода следует использовать модальное значение, нежели среднее. Средняя будет занижать одни показатели и завышать другие — тем самым осредняя (уравнивания) доходы всех слоев населения.

В интервальных вариационных рядах моду определяют приближенно по формуле:

    \[{M_o} = {X_{{M_o}}} + h\frac{{{f_2} - {f_1}}}{{\left( {{f_2} - {f_1}} \right) + \left( {{f_2} - {f_3}} \right)}}\]

  • ХМ0 — нижняя граница модального интервала;
  • hMo  - величина (шаг, ширина) модального интервала;
  • f1 - локальная частота интервала, предшествующего модальному;
  • f2 - локальная частота модального интервала;
  • f3 - локальная частота интервала, следующего за модальным.

Распределение населения  по уровню среднедушевого месячного дохода

Среднедушевой доход, руб.

Удельный вес населения, % (f i)

Накопленная частота, % (Si)

менее 1000

1000-3000

3000-5000

5000-7000

7000-9000

9000 и выше

2,4

35,5

30,0

15,7

7,7

8,7

2,4

37,9

67,9

83,6

91,3

100,0

Всего

100,0

Х

Интервал 1000-3000 в данном распределении будет модальным, т.к. он имеет наибольшую частоту (f=35,5). Тогда по вышеуказанной формуле мода будет равна:

    \[{M_o} = 1000 + 2000\frac{{35.5 - 2.4}}{{(35.5 - 2.4) + (35.5 - 30.0)}} = 2715\]

На графике (гистограмме распределения) моду определяют следующим образом: по оси ординат откладывают локальные частоты, а по оси абсцисс -интервалы либо центры интервалов. Выбирают самый высокий столбик, которому соответствует величина признака с наибольшей частотой в ряду распределения.

Мода применяется для решения некоторых практических задач. Так, например, при изучении товарооборота рынка берется модальная цена, для изучения спроса на обувь, одежду используют модальные размеры обуви и одежды.

Медиана- это численное значение признака у той единицы совокупности, которая находится в середине ранжированного ряда (построенного в порядке возрастания, либо убывания значений изучаемого признака). Медиану иногда называют серединной вариантой, т.к. она делит совокупность на две равные части таким образом, чтобы по обе ее стороны находилось одинаковое число единиц совокупности. Если всем единицам ряда присвоить порядковые номера, то порядковый  номер медианы будет определяться по формуле (n+1):2 для рядов, где n — нечетное. Если же ряд с четным числом единиц, то медианой будет являться среднее значение между двумя соседними вариантами, определенными по формуле: n:2, (n+1):2, (n:2)+1.

В дискретных вариационных рядах с нечетным числом единиц совокупности — это конкретное численное значение в середине ряда.

Нахождение медианы в интервальных вариационных рядах требует предварительного определения интервала, в котором находится медиана, т.е. медианного интервала – этот интервал характеризуется тем, что его кумулятивная (накопленная) частота равна полусумме или превышает полусумму всех частот ряда.

    \[{M_e} = {x_{_{Me}}} + {h_{_{Me}}} \times \frac{{\frac{{\sum f}}{2} - {S_{_{Me - 1}}}}}{{{f_{_{Me}}}}}\]

  • XMe  -нижняя граница медианного интервала
  • hMe   -величина медианного интервала;
  • SMe-1-сумма накопленных частот интервала, предшествующего медианному интервалу;
  • fMe  -локальная частота медианного интервала.

По данным таблицы определим медианное значение среднедушевого дохода. Для этого необходимо определить какой интервал будет медианным. Используем формулу номера медианной единицы ряда, т.е. середины:

 

    \[N = \frac{{\Sigma f + 1}}{2} = \frac{{100 + 1}}{2} = 50.5\,\% \]

Дробное значение N (всегда при четном числе членов) равное 50,5% говорит о том, что середина ряда находится между 50% и 51%, т.е. в третьем интервале. Иными словами: медианным считается интервал, на который впервые приходится более половины суммы накопленных частот. Отсюда медиана:

    \[{M_e} = 3000 + 2000\frac{{0.5 \cdot 100 - 37.9}}{{30}} = 3807\]

Для того, чтобы определить графически интервал, в котором находится медиана, по оси ординат откладывают накопленные частоты, а по оси абсцисс — центры интервалов. Из точки на оси ординат, которой соответствует 50.5% суммы накопленных частот, проводят линию параллельно оси абсцисс до пересечения с кумулятой. Из точки пересечения опускают перпендикуляр на ось абсцисс.

Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию. Если M0<Me<Х — имеет место правосторонняя асимметрия. Если же Х<Me<M- левосторонняя асимметрия ряда. По приведенному примеру можно сделать заключение, что наиболее распространенным является доход порядка 2715 руб. в месяц. В то же время, более половины населения располагает доходом свыше 3807 руб., при среднем уровне 4338 руб.

    \[\begin{array}{l} \overline x = \frac{{\sum {{x_i} \cdot {f_i}} }}{{\sum {{f_i}} }} = \frac{{{x_{_1}}{f_{_1}} + {x_{_2}}{f_{_2}} + ... + {x_{_n}}{f_{_n}}}}{{{f_{_1}} + {f_{_2}} + ... + {f_{_n}}}} = \\ \\ = \frac{{1000 \cdot \left( {0 \cdot 0.024 + 2 \cdot 0.355 + 4 \cdot 0.3 + 6 \cdot 0.157 + 8 \cdot 0.077 + 10 \cdot 0.087} \right)}}{\begin{array}{l} 0.024 + 0.355 + 0.3 + 0.157 + 0.077 + 0.087\\ \end{array}} = \\ \\ = \frac{{4338}}{1} = 4338 \end{array}\]

Из соотношения этих показателей следует сделать вывод о правосторонней асимметрии распределения населения по уровню среднедушевого денежного дохода:

    \[{M_o} < \,{M_e} < \,\bar X\; \to \;2715 < 3807 < 4338\]

Квартиль –это четвертая часть совокупности, определяется как и медиана, только сумму частот необходимо разделить на 4, а при определении квартильного интервала, кумулятивная частота должна быть больше или равна четверти суммы частот совокупности.

Дециль – делит совокупность на десять равных частей. Определяется аналогично как и квартиль, только сумму частот необходимо разделить на 10. 

Смотри также по теме: