Статистические ряды распределения представляют собой упорядоченное распределение единиц совокупности по группам и группировкам. Ряды распределения изучают структуру совокупности, позволяют изучить ее однородность, размах и границы. Ряды распределения, образованные по качественным признакам, называют атрибутивными. При группировке по количественному признаку выделяются вариационные ряды. Вариационные ряды – ряды распределения единиц совокупности по признакам, имеющим количественное выражение, т. е. образованы численными значениями.
Вариационные ряды по строению делятся на:
- Дискретные (прерывные) – основаны на прерывных вариациях признака. Это такие ряды, где значения вариант имеют значения целых чисел (т. е. не могут принимать дробные значения). Дискретные признаки отличаются друг от друга на некоторую конкретную величину.
- Интервальные (непрерывные) – имеют любые, в том числе и дробные количественные выражения и представлены в виде интервалов. Непрерывные признаки могут отличаться один от другого на сколь угодно малую величину.
Вариационные ряды имеют два элемента:
- варианта (x)
- частота (f)
Варианта – отдельное значение варьируемого признака, которое он принимает в ряду распределения.
Частота – численность отдельных вариант или каждой группы вариационного ряда. В некоторых случаях применяется частость. Частоты, выраженные в % или долях процента, называются частостями и рссчитываются как отношение локальной частоты варианты к сумме накопленных частот.
В свою очередь, частота бывает:
- локальной
- накопленной (кумулятивная — нарастающим итогом)
Если вариационный ряд имеет неравные интервалы, то частоты в отдельных интервалах не сопоставимы, т. к. зависят от ширины интервала. В этих случаях рассчитывают плотность распределения, которая дает правильное представление о характере распределения вариант (единиц совокупности). Плотность распределения, в свою очередь, бывает:
- абсолютная плотность распределения – отношение частоты к величине (ширине) интервала
- относительная плотность распределения — отношение частости к ширине интервала
Интервалы |
Локальная частота (f) |
Накопленная частота (Σf) |
Частость (ω) |
Плотность распределения (φ) |
20-30 |
3 |
3 |
0,3 |
0,03 |
30-40 |
5 |
8 |
0,5 |
0,05 |
40-50 |
1 |
9 |
0,1 |
0,01 |
50-60 |
1 |
10 |
0,1 |
0,01 |
Для характеристики рядов распределения применяются следующие показатели:
Пример:
Условие
Известно распределение 20 однотипных торговых точек по величине ежедневной прибыли (тыс. руб.):
11,3; 10,2; 13,9; 10,7; 11,8; 8,2; 12,4; 9,6; 13,1; 10,6; 6,3; 11,3; 10,2; 15,1; 10,5; 11,0; 15,1; 11,6; 10,4; 11,7.
- Составить интервальный ряд распределения.
- Построить гистограмму распределения плотности относительных частот.
Решение
Запишем исходные данные в виде ранжированного ряда:
6,3; 8,2; 9,6; 10,2; 10,2; 10,4; 10,5; 10,6; 10,7; 11,0; 11,3; 11,3; 11,6; 11,7; 11,8; 12,4; 13,1; 13,9; 15,1; 15,1.
Диапазон изменения вариант в выборке составляет 6–16. Этот диапазон разобьем на несколько интервалов. Ширину (шаг) интервала рассчитаем по формуле:
Следует иметь в виду, что чем меньше интервал, тем точнее результаты. В нашем случае принимаем размер интервала равным 2 единицам, то есть h=2. Зависимость между количеством групп (n) и численностью единиц совокупности (N) выражается формулой Стерджесса при условии, что данное распределение подчиняется закону нормального распределения (ЗНР) и применяются равные интервалы:
В практической работе можно использовать данные таблицы:
N | 15-24 | 25-44 | 45-89 | 90-179 | 180-359 | 360-719 | 720-1439 |
n | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
Получаем пять интервалов: первый 6–8, второй 8–10, третий 10–12, четвертый 12–14, пятый 14–16.
Определим частоту попадания вариант выборки в каждый интервал.
В первый интервал попадает одно значение ряда: 6,3, поэтому f1=1. Во второй интервал попадают два значения: 8,2 и 9,6, поэтому f2=2. Аналогично находим f3=12, f4=3, f5=2. Определим относительные частоты попадания вариант выборки в каждый интервал:
в 1 интервал
во 2 интервал
в 3 интервал
в 4 интервал
в 5 интервал
Сумма относительных частот
Следовательно, вычисления выполнены верно.
Определим плотность относительных частот вариант как отношение относительной частоты (ωi) к ширине интервала (h):
для первого интервала
для второго интервала
для третьего интервала
для четвертого интервала
для пятого интервала
Результаты выполненных расчетов сводим в таблицу.
Интервальный ряд распределения прибыли предприятий
Интервал значений прибыли (h) | 6 — 8 | 8 – 10 | 10 — 12 | 12 — 14 | 14 — 16 |
Частоты вариант (fi) | 1 | 2 | 12 | 3 | 2 |
Относительные частоты (ωi) | 0,05 | 0,10 | 0,60 | 0,15 | 0,10 |
Плотность относительных частот (φi) | 0,025 | 0,050 | 0,300 | 0,075 | 0,050 |
Гистограмма распределения
Построим гистограмму, показывающую зависимость плотности относительных частот от значения вариант. По горизонтальной оси наносим шкалу возможных значений вариант, по вертикальной оси – плотность относительных частот; величину относительной плотности считаем постоянной внутри соответствующего интервала. Получаем столбчатую диаграмму, называемую гистограммой распределения плотности относительных частот.