По данным приложения 1, составить вариационный ряд распределения сельскохозяйственных предприятий по одному признаку. Построенный интервальный ряд изобразить графически с помощью полигона, гистограммы и кумуляты. Определить среднее значение признака, моду, медиану, дисперсию, среднее квадратическое отклонение, коэффициент вариации.
73. Среднегодовая численность работников на 100 га сельскохозяйственных угодий, чел.
№ п/п Среднегодовая численность, чел. Площадь сельскохозяйственных угодий, га Численность работников на 100 га, чел.
1 157 4327 3,6
2 144 5597 2,6
3 115 3976 2,9
4 166 7093 2,3
5 287 8723 3,3
6 498 12871 3,9
7 597 9734 6,1
8 333 7664 4,3
9 149 4282 3,5
10 399 5780 6,9
11 171 3999 4,3
12 910 10946 8,3
13 184 7899 2,3
14 247 5970 4,1
15 224 5072 4,4
16 219 5775 3,8
17 155 4276 3,6
18 265 8275 3,2
19 293 7444 3,9
20 424 14811 2,9
21 161 5193 3,1
22 214 4994 4,3
23 585 12338 4,7
24 751 11967 6,3
25 688 17183 4
26 563 10648 5,3
27 103 2290 4,5
28 253 5865 4,3
29 228 4178 5,5
30 230 4259 5,4
31 351 12907 2,7
32 105 2985 3,5
33 582 10563 5,5
34 910 12708 7,2
35 532 16061 3,3
Решение:
Размах выборки:
R=xmax-xmin=8,3-2,3=6
Оценим число интервалов по формуле Стерджеса:
k=1+[3.32*lg35]=6
Длину интервалов вычислим по формуле:
h=Rk-1=66-1=1,2
Наметим границы интервалов группировки. Нижнюю границу выбираем так, чтобы минимальная варианта попадала в середину интервала:
xН=xmin-h2
xН=2,3-1,22=1,7
Конец последнего интервала должен удовлетворять условию:
xкон-h≤xmax<xкон
Промежуточные интервалы получаем, прибавляя к концу предыдущего интервала длину h. Распределяем варианты выборки по интервалам группировки (находим частоты интервалов):
№ интервала
Границы интервала численности работников на 100 га, чел Середина интервала, xi Число предприятий в группе, ni
Накопленное число предприятий, Si
1 1,7 2,9 2,3 4 4
2 2,9 4,1 3,5 14 18
3 4,1 5,3 4,7 8 26
4 5,3 6,5 5,9 6 32
5 6,5 7,7 7,1 2 34
6 7,7 8,9 8,3 1 35
Графически ряд распределения изображается в виде полигона, гистограммы или кумуляты распределения. На оси абсцисс откладываются значения изучаемого признака (границы интервалов), а на оси ординат число хозяйств или накопленное число хозяйств.
Строим полигон:
Гистограмма распределения:
Кумулята распределения:
Рассчитаем основные характеристики вариационного ряда.
Модой называется значение признака, имеющее наибольшую частоту в ряду распределения, мода находится в интервале с самой большой частотой (2,9 – 4,1). В рядах с равными интервалами мода внутри модального интервала определяется по формуле.
Mo=XMo+h*nMo-nMo-1nMo-nMo-1+nMo-nMo+1
Mo=2,9+1,2*14-414-4+14-8=3,55
Медианой называется значение признака, находящееся в середине ряда распределения. В интервальном ряду она находится по формуле:
Me=XMe+h*0,5n-SMe-1nMe
По накопленным частотам видно, что медиана тоже находится в интервале 2,9– 4,1. Поэтому:
Me=2,9+1,2*0,5*35-414≈4,06
Среднее значение признака определим по формуле:
x=ixi*nin=2,3*4+…+8,3*135≈4,4
Дисперсия:
σ2=ixi2*nin-x2=2,32*4+…+8,32*135-4,42≈2,01
Среднее квадратическое отклонение:
σ=2,01≈1,4
Коэффициент вариации:
V=σx*100=1,44,4*100≈31,8%
Таким образом, средняя численность работников на 100 га угодий по совокупности предприятий составила 4,4 человек, при этом численность колебалась в промежутке x±σ=4,4±1,4, т.е. от 3 до 5,8 работников на 100 га угодий. Этот интервал, а также коэффициент вариации показывают, что имеются различия в численности работников на 100 га угодий в год по предприятиям.