Используя приведенные в корреляционной таблице данные, требуется:
1. Найти числовые характеристики выборки – среднее x, y; среднее квадратическое отклонения sx, sy корреляционный момент Kxy, коэффициент корреляции rв
2. Проверить значимость коэффициента корреляции.
3. Найти эмпирические функции регрессии yx, xy
X
Y 2 6 10 14 18
5 2 4 2
10
2 10 4
15
3 10 5
20
2 5
25
1
Решение:
. Найти числовые характеристики выборки – среднее x, y; среднее квадратическое отклонения sx, sy корреляционный момент Kxy, коэффициент корреляции rв
Перепишем корреляционную таблицу в следующем виде
X
Y 2 6 10 14 18 ny
5 2 4 2
8
10
2 10 4
16
15
3 10 5 18
20
2 5 7
25
1 1
nx
2 6 15 16 11 50
Составим корреляционную таблицу в условных вариантах, выбрав в качестве ложных нулей c1=14, h1=6-2=4 и c2=15,h2=10-5=5
Тогда
u1=x1-c1h1=2-144=-3; u2=x2-c1h1=6-144=-2
u3=x3-c1h1=10-144=-1; u4=x4-c1h1=14-144=0
u5=x5-c1h1=18-144=1
v1=y1-c2h2=5-155=-2; v2=y2-c2h2=10-155=-1
v3=y3-c2h2=15-155=0; v4=y4-c2h2=20-155=1
v5=y5-c2h2=25-155=2
Тогда корреляционная таблица примет вид:
u
v
-3 -2 -1 0 1 nv
-2 2 4 2
8
-1
2 10 4
16
0
3 10 5 18
1
2 5 7
2
1 1
nu
2 6 15 16 11 50
Вычисляем выборочные характеристики и коэффициент корреляции
u=150iuinui=150-3∙2-2∙6-1∙15+0∙16+1∙11=-2250=-0,44
v=150jvjnvj=150-1∙5+0∙21+1∙14+2∙9+3∙1=-2350=-0,46
x=h1u+c1=4∙-0,44+14=12,24
y=h2v+c2=5∙(-0,46)+15=12,7
su2=1niui2nui-u2=1509∙2+4∙6+1∙15+0∙16+1∙11–0,442=
=150∙68-0,194=1,17
su=1,17≈1.08, sx=h1su=4∙1,08=4,32
sv2=1njvj2nvj-v2=150-22∙8+-12∙16+02∙18+12∙7+22∙1-
-(-0,46)2=5950-0,21=0,97
sv=0,97≈0,98, sy=h2sv=5∙0,98=4,9
Kxy=nuvvu-v∙u=2∙2∙5+6∙4∙5+6∙2∙10+10∙2∙5+10∙10∙10
+10∙3∙15+14∙4∙10+14∙10∙15+14∙2∙20+18∙5∙15+18∙5∙20
+18∙1∙25-12,24∙12,7=17,15
rв=Kxy sx∙sy=17,154,32∙4,9=17,1521,168≈0,81
2. Проверим значимость коэффициента корреляции.
Выдвигаем гипотезы:
H0: rв=0, нет линейной взаимосвязи между переменными;
H1: rв≠0, есть линейная взаимосвязь между переменными.
Для того чтобы при уровне значимости пусть α=0,05 проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия (величина случайной ошибки)
tнабл=rn-21-r2
где r=rв=0,81, n=50
Тогда
tнабл=0,81∙50-21-0,812=5,6120,586=9,57
Найдем tкрит(α, k), где α=0,05, k=n-2=50-2=48.
Тогда, tкрит0,05, 48 найдем по таблице критических точек распределения Стьюдента имеем, что tкрит0,05, 48=2,01
Таким образом, имеем, что tнабл=9,57>tкрит=2,01 нулевую гипотезу отвергают и, следовательно, выборочный коэффициент корреляции значимо отличается от 0 , то есть Х и Y линейно корреляционны.
3. Найти эмпирические функции регрессии yx, xy
Уравнение линейной регрессии с Y на X имеет вид:
y-y=rвsysx (x-x)
Тогда,
y-12,7=0,81∙4,94,32 (x-12,24)
y-12,7=0,92 (x-12,24)
y-12,7=0,92x- 11,26
y=0,92x- 11,26+12,7
y=0,92x+1,44
Уравнение линейной регрессии с X на Y имеет вид:
x-x=rвsxsy(y-y)
x-12,24=0,81∙4,324,9 (y-12,7)
x-12,24=0,71 (y-12,7)
x-12,24=0,71y-9,07
x=0,71 y-9,07+12,24
x=0,71 y+3,17