113. Дать количественную оценку связи между двумя признаками. Построить график корреляционной зависимости между признаками. По графику определить тип уравнения связи. Методом наименьших квадратов найти параметры уравнения регрессии. Полученное уравнение нанести на график связи. Рассчитать коэффициенты корреляции и детерминации. Оценить значимость выборочного коэффициента корреляции при уровне значимости 0,05. Для выполнения задач использовать данные приложения 1 по первым 15 предприятиям, по указанным в соответствующем варианте двум признакам.
Выявить влияние следующих факторов на изменение результативных признаков:
113. Основные средства на 1 га пашни (тыс. руб.) и выручка от реализации продукции на 1 га пашни (тыс. руб.).
№ п/п Основные средства, тыс. руб
Выручка от продажи продукции, тыс. руб. Площадь пашни, га Основные средства на 1 га пашни, тыс. руб. Выручка от реализации продукции на 1 га пашни, тыс. руб.
1 105134 119903 4327 24,3 27,7
2 101014 145595 5562 18,2 26,2
3 133710 119796 3930 34 30,5
4 207666 270623 7093 29,3 38,2
5 356652 300856 8509 41,9 35,4
6 323862 436966 12668 25,6 34,5
7 475241 602285 9508 50 63,3
8 402035 379274 7601 52,9 49,9
9 211550 192944 4200 50,4 45,9
10 295448 293715 5735 51,5 51,2
11 83527 93989 3956 21,1 23,8
12 711493 688832 10654 66,8 64,7
13 199481 179362 7203 27,7 24,9
14 305281 181176 5000 61,1 36,2
15 384657 266139 5027 76,5 52,9
Решение:
Одним из факторов роста объёмов производства и реализации продукции является объем основных средств, поэтому результативным признаком (У) является выручка от реализации. Основные средства из расчета на среднегодового работника являются факторным признаком (X).
Согласно условию задач, на основании данных приложения 1, построим график зависимости. На график наносится 15 пар значений результативного и факторного признаков в виде точек. Шкалы по осям координат различаются в зависимости от значений признаков по конкретным вариантам.
Расположение точек на рисунке показывает, что зависимость между признаками выражается линейным уравнением регрессии:
y=a0+a1x
Параметры уравнения регрессии нужно найти методом наименьших квадратов, для чего составляется и решается следующая система линейных уравнений:
iyi=n*a0+a1ixiixi*yi=a0ixi+a1ixi2
Составим вспомогательную таблицу для расчёта коэффициентов корреляции и регрессии:
№ п/п Основные средства на 1 га пашни (X), тыс. руб. Выручка от реализации продукции на 1 га пашни(Y), тыс. руб. XY X2 Y2
1 24,3 27,7 673,11 590,49 767,29
2 18,2 26,2 476,84 331,24 686,44
3 34 30,5 1037,00 1156,00 930,25
4 29,3 38,2 1119,26 858,49 1459,24
5 41,9 35,4 1483,26 1755,61 1253,16
6 25,6 34,5 883,20 655,36 1190,25
7 50 63,3 3165,00 2500,00 4006,89
8 52,9 49,9 2639,71 2798,41 2490,01
9 50,4 45,9 2313,36 2540,16 2106,81
10 51,5 51,2 2636,80 2652,25 2621,44
11 21,1 23,8 502,18 445,21 566,44
12 66,8 64,7 4321,96 4462,24 4186,09
13 27,7 24,9 689,73 767,29 620,01
14 61,1 36,2 2211,82 3733,21 1310,44
15 76,5 52,9 4046,85 5852,25 2798,41
Σ 631,3 605,3 28200,08 31098,21 26993,17
Имеем следующую систему уравнений:
605,3=15*a0+631,3*a128200,08=631,3*a0+31098,21*a1
Решив систему, получаем значения:
a0=15,030;a1=0,602
Уравнение регрессии имеет вид:
y=15,030+0,602x
Коэффициент регрессии а1 показывает, что средств из расчета на 100 га пашни при увеличении величины основных средств на 1 тыс. руб., выручка от реализации продукции в среднем по совокупности предприятий вырастет на 602 рубля.
Для оценки тесноты связи между признаками рассчитывается коэффициент корреляции:
r=xy-x*yσx*σy
Вычислим необходимые значения:
x=ixin=631,315≈42,087
y=iyin=605,315≈40,353
xy=ixi*yin=28200,0815≈1880,005
σx=ixi2n-(x)2=31098,2115-(42,087)2≈17,376
σy=iyi2n-(y)2=26993,1715-(40,353)2 ≈13,083
Вычисляем коэффициент корреляции:
r=28200,08-42,087*40,35317,376*13,083=0,799
Коэффициент детерминации:
r2=0,7992≈0,639
Коэффициент корреляции показывает, что зависимость между факторным и результирующим признаками довольно сильная. Коэффициент детерминации свидетельствует о том, что 63,9 % различий в выручке от реализации продукции объясняется величиной основных средств, а остальные 36,1% объясняется влиянием других факторов.
Так как регрессионный анализ зависимости между признаками проводится по выборочным данным, то необходимо проверить значимость выборочного коэффициента корреляции.
Выдвигаем нулевую гипотезу: величина коэффициента корреляции в генеральной совокупности равна нулю при конкурирующей гипотезе о неравенстве нулю коэффициента корреляции:
H0_r=0; H1:r≠0
Проверку нулевой гипотезы проведем с помощью критерия t – Стьюдента. Наблюдаемое значение критерия t находим по формуле:
tH=r*n-21-r2=0,799*15-21-0,639≈4,793
По таблице распределения t – Стьюдента, при уровне значимости = 0,05 и числе степеней свободы k= n – 2 = 15 – 2 = 13, находим критическое значение t0,05;13= 2,16.
Так как tH>t0,05;13 , то нулевая гипотеза не принимается, значит, коэффициент корреляции существенно отличен то нуля в генеральной совокупности. Величина основных средств оказывает статистически существенное влияние на выручку от реализации продукцию в расчете на одного работника.