Математическая статистика. Расчетная работа 4
Линейная регрессия
Для каждого из приведенных в таблице наборов Xi, Yi проделайте следующие действия.
Найдите числовые характеристики выборок.
Напишите уравнение линейной регрессии Y на X и X на Y.
Постройте диаграммы рассеяния, проведите прямые линейной регрессии.
№ п/п
X1
Y1
Y2
Y3
1 2,15 12,09 8,04 71,30
2 3,12 17,17 17,30 52,71
3 4,08 33,32 34,78 41,71
4 5,14 37,07 37,22 26,37
5 6,01 31,00 25,54 12,28
6 7,14 26,79 17,67 5,19
7 8,08 43,23 31,96 15,35
8 9,08 34,74 24,66 24,82
9 10,08 57,67 46,59 66,47
10 11,18 70,16 53,80 115,84

Решение:

№ п/п
X1
Y1
X2
Y2
X3
Y3
1 2,15 12,09 2,15 8,04 2,15 71,30
2 3,12 17,17 3,12 17,30 3,12 52,71
3 4,08 33,32 4,08 34,78 4,08 41,71
4 5,14 37,07 5,14 37,22 5,14 26,37
5 6,01 31,00 6,01 25,54 6,01 12,28
6 7,14 26,79 7,14 17,67 7,14 5,19
7 8,08 43,23 8,08 31,96 8,08 15,35
8 9,08 34,74 9,08 24,66 9,08 24,82
9 10,08 57,67 10,08 46,59 10,08 66,47
10 11,18 70,16 11,18 53,80 11,18 115,84
Средние:
X1=110i=110×1,i≈6,606=X2=X3
Y1=110i=110y1,i≈36,324
Y2=110i=110y2,i≈29,756
Y3=110i=110y3,i≈43,204
Дисперсии:
DX1=110i=110(x1,i-X1)2≈8,246=DX2=DX3
DY1=110i=110(y1,i-Y1)2≈273,371
DY2=110i=110(y2,i-Y2)2≈185,386
DY3=110i=110(y3,i-Y3)2≈1049,783
Ковариации:
KX1Y1=110i=110(x1,i-X1)(y1,i-Y1)≈41,452
KX2Y2≈27,171KX3Y3≈19,477
Коэффициенты корреляции:
rX1Y1=KX1Y1DX1*DY1≈0,873
rX2Y2≈0,695
rX3Y3≈0,209
Выборочная линейная регрессия Yна X по выборке xi, yi, i=1, 2,…n, определяется уравнением
y=ax+b=Y+rXYDYDX(x-X)
где выборочные коэффициенты регрессии a=KXYDX, b=Y-aX.
Аналогично определяется выборочная регрессия X на Y:
x=a’y+b’=X+rXYDXDY(y-Y)
где выборочные коэффициенты регрессии a’=KXYDY, b’=X-a’Y
a
5,027 3,295 2,362
b
3,117 7,989 27,601
a’
0,152 0,147 0,019
b’
1,098 2,245 5,804

Сплошная прямая – регрессия Yна X, штриховая – регрессия X на Y.
Математическая статистика. Расчетная работа 3.
«Монетка»
После выполнения пунктов 1 и 2 получены результаты:
Вариационный ряд
6 4 2 6 4 6 5 6 9 3
5 8 4 3 5 4 3 8 5 6
4 5 2 6 7 5 8 4 6 4
7 3 5 3 6 6 7 3 6 1
6 4 5 8 4 6 8 7 7 4
6 4 4 5 3 9 3 4 3 6
6 4 5 6 7 3 6 5 4 4
4 8 2 5 3 4 3 2 6 5
4 5 7 5 5 7 2 2 5 6
5 4 3 2 7 7 6 6 3 3

3. По выборке строим статистический ряд:
xi
0 1 2 3 4 5 6 7 8 9 10
ni
0 1 7 15 20 18 21 10 6 2 0

4. Полигон и гистограмма частот ni:

5. Числовые характеристики выборочного распределения.
Выборочное среднее:
xв=1ni=1knixi=1*1+7*2+15*3+20*4+18*5+21*6+10*7+6*8+2*9100=492100=4,92
Выборочная дисперсия:
Dв=1ni=1kni(xi-xв)2=1ni=1knixi2-(xв)2=1*12+7*22+15*33+20*42+18*52+21*62+10*72+6*82+2*92100-4,922=27,26-4,922=3,054
Выборочное СКО: σв=Dв=1,747.
В качестве точечных оценок параметров распределения берем найденные выборочные средние, a≈xв=4,92, σ≈σВ=1,747.
6, 7. Построение кривой нормального распределения и сравнение теоретического и экспериментального распределений.
Кривая нормального распределения fx=1σ2π*e-(x-a)22σ2 строится при помощи полученных экспериментальных значениях параметров
a=4,92 и σ=1,747:

8. Вероятности попадания в интервалы.
Pα<X<β=Фβ-a σ-Фα-a σ
где Фx – функция Лапласа, Фx=12π0xe-t22dt, Ф-x=-Ф(x).
Значения функции Лапласа берутся из таблиц.
Pa-σ<X<a+σ=Фa+σ-a σ-Фa-σ-a σ=Ф1-Ф-1=2Ф1=0,6827
Аналогично,
Pa-2σ<X<a+2σ=2Ф2=0,9545
Pa-3σ<X<a+3σ=2Ф3=0,9973
Интервалы Экспериментальная относительная частота Теоретическая вероятность
(a-σ; a+σ) (3,173; 6,667) 0,59 0,6827
(a-2σ; a+2σ) (1,426; 8,414) 0,97 0,9545
(a-3σ; a+3σ) (-0,321; 10,161) 1 0,9973

9. Вычисление критерия χ2 Пирсона и проверка гипотезы о нормальности распределения.
Критерий Пирсона χ2: χнабл2=i=010ni-npi2npi, где ni – экспериментальные частоты, а pi – теоретические вероятности, соответствующие значениям случайной величины X. Вычисления дают:
xi
ni
npi
ni-npi2npi
0 0 0,433 0,433
1 1 1,842 0,385
2 7 5,649 0,323
3 15 12,483 0,507
4 20 19,879 0,001
5 18 22,812 1,015
6 21 18,864 0,242
7 10 11,241 0,137
8 6 4,827 0,285
9 2 1,494 0,172
10 0 0,333 0,333
Сумма 100 99,857 3,833

т.е., χнабл2=3,833. При n→∞ распределение этой случайной величины, независимо от того, каков закон распределения генеральной совокупности, стремится к распределению Пирсона χ2 с числом степеней свободы v=q-1-k, где k – число параметров генерального распределения, оцениваемых на основании наблюденных данных. Так как оба параметра распределения генеральной совокупности оцениваются по данным выборки, число степеней свободы v=11-3=8.
По таблице распределения χ2 для v=8 и α=0,05 находим критическую точку χкр20,05;8=15,507. Так как χнабл2=3,833<χкр2=15,507, гипотеза о нормальном характере распределения случайной величины X не отвергается.
10. Доверительный интервал для математического ожидания величины X. Считая, что величина X распределена по нормальному закону с найденными ранее a≈xв=4,92, σ≈σВ=1,747 и принимая, что доверительная вероятность α=0,05, найдем доверительный интервал I0,95 для математического ожидания величины X :
I1-α=xв-tα*SВn, xв+tα*SВn
где SВ – исправленное среднеквадратическое отклонение,
SВ=nn-1Dв=1110*3,054=1,833,
tα – квантиль распределения Стьюдента, из таблиц t0,05=2,201.
Отсюда I0,95=(3,704;6,136), с вероятностью 0,95 среднее количество гербов в серии из 10 выбрасываний лежит в этом интервале.

5.0
Helen2309
Белгородский кооперативный институт, 1988 (в наст. вр. Белгородский университет кооперации, экономики и права). Специальность по диплому "Экономика торговли". Опыт работы на предпр. пищевой промышленности, в органах статистики и торговли