На основании исходных данных соответствующих своему варианту – файл xls

На основании исходных данных, соответствующих своему варианту – файл xls. «Исходные данные».
Требуется:
2.1 найти коэффициент парной корреляции между двумя количественными факторами Yj и Xi, вычисляя его разными способами:
2.1.1 используя формулу
2.1.2. используя соотношение где , ,
2.1.3 используя встроенную функцию Excel КОРРЕЛ
2.1.4 используя надстройку Excel «Анализ данных» инструмент Корреляция
2.2 Используя шкалу Чеддока описать характер линейной корреляционной связи между признаками y и x
2.3 найти коэффициент детерминации ;
2.4 определить статистическую значимость коэффициента парной корреляции rXY с помощью t-критерия Стьюдента ;
2.5 проверить статистическую значимость коэффициента детерминации с помощью критерия Фишера
, в случае парной регрессии
2.6 построить интервальную оценку парного коэффициента корреляции (доверительный интервал).

2.7 Сделать выводы.

Решение:

2.1 Для расчета корреляции построим расчетную таблицу:

1 200 25 372 40000 643738384 5074400 491.3611111 148781.6327 8550.175926
2 129 22 039 16641 485717521 2843031 2384.694444 8686446.299 143925.3981
3 202 20 569 40804 423083761 4154938 584.0277778 19512342.97 -106750.8796
4 280 25 505 78400 650505025 7141400 10438.02778 269072.7438 52996.12037
5 154 20 409 23716 416527281 3142986 568.0277778 20951471.85 109091.787
6 108 24 984 11664 624200256 2698272 4876.694444 5.188271605 159.0648148
7 114 19 320 12996 373262400 2202480 4074.694444 32106703.85 361697.3981
8 66 23 188 4356 537683344 1530408 12506.69444 3233802.966 201107.3981
9 128 25 263 16384 638219169 3233664 2483.361111 76575.18827 -13789.99074
10 673 34 948 452929 1221362704 23520004 245190.0278 99235909.63 4932712.787
11 75 19 981 5625 399240361 1498575 10574.69444 25052805.63 514709.3981
12 47 21 988 2209 483472144 1033436 17117.36111 8989669.633 392274.6759
13 128 21 788 16384 474716944 2788864 2483.361111 10228980.74 159380.8426
14 97 22 377 9409 500730129 2170569 6534.027778 6808330.522 210916.6204
15 188 20 602 35344 424442404 3873176 103.3611111 19221891.63 -44573.49074
16 162 23 040 26244 530841600 3732480 250.6944444 3787997.188 30816.06481
17 115 23 876 13225 570063376 2745740 3948.027778 1232716.744 69762.4537
18 335 54 504 112225 2970686016 18258840 24701.36111 871295925.2 4639202.009
Среднее 178 24986 51031 687138490 5091292 19406 62824413 647899
Сумма 3 201 449 753 918 555 12 368 492 819 91 643 263 349 311 1 130 839 430 11 662 188

Читайте также:  Примерно один ребёнок из 1000 рождается с симптомом Дауна По данным из 200 родильных домов количество детей

2.1.1 используя формулу

2.1.2 используя соотношение
Выборочные среднеквадратические отклонения:

2.1.3 используя встроенную функцию Excel КОРРЕЛ

2.1.4 Используя надстройку Excel «Анализ данных» инструмент Корреляция:

2.2 Используя шкалу Чеддока опишем характер линейной корреляционной связи между признаками y и x.
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0,1< rxy < 0,3 – слабая;
0,3 < rxy < 0,5 – умеренная;
0,5 < rxy < 0,7 – заметная;
0,7 < rxy < 0,9 – высокая;
0,9 < rxy < 1 – весьма высокая.
В нашем примере связь между среднедушевыми денежными доходами по субъектам РФ в 2014 году и числом самоубийств по субъектам Российской Федерации в 2014 году в Центральном ФО прямая и заметная.

2.3 Коэффициент детерминации

2.4 Определим статистическую значимость коэффициента парной корреляции rXY с помощью t-критерия Стьюдента

(m = 1 — количество объясняющих переменных)
Находим tкрит при уровне значимости α=0,05 и степенях свободы k=n-2=16:

Читайте также:  Характеристическое уравнение Кубическое уравнение имеет три корня

Поскольку |tнабл| > tкрит, то гипотезу о равенстве 0 коэффициента корреляции отвергаем. Другими словами, коэффициент корреляции статистически значим.

2.5 проверим статистическую значимость коэффициента детерминации с помощью критерия Фишера

Табличное значение критерия при уровне значимости α=0,05 со степенями свободы k1=1 и k2=16

Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим.

2.6 Построим интервальную оценку парного коэффициента корреляции (доверительный интервал):

Доверительный интервал для коэффициента корреляции:

Окончательно получим:

2.7 Выводы: зависимость между среднедушевыми денежными доходами по субъектам РФ в 2014 году и числом самоубийств по субъектам Российской Федерации в 2014 году в Центральном ФО существенна.

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...