Расчет F-критерия Фишера, индекса (коэффициента) детерминации, критерия Дарбина -Уотсона, средней ошибки аппроксимации

Исходные данные

Используем опытные данные при построении уравнения квадратичной функции вида y = ax2 + bx + c, оценим значимость полученного уравнения регрессии У=0.6531x2-1.3403x+1.9226.

Решение системы линейных уравнений и определение параметров для данного уравнения, с использованием метода Крамера, смотри МНК для параболы 2-го порядка.

xi -1 -0,8 0 0,5 1 1,8 2 2,5 2,6 3,3
yi 4.3 3 2 1.5 1 0.8 2.5 2.7 3.5 4.2

Диаграмма рассеяния и график уравнения регрессии

Расчет критериев оценки

Для оценки значимости параметров регрессии и корреляции сначала рассчитаем среднее значение зависимой переменной:

    [bar y = frac{1}{n}sumlimits_{i = 1}^n {{y_i}}  = frac{{25.5}}{{10}} = 2.55]

Составим таблицу вспомогательных величин, где:

    [{varepsilon _i} = {y_i} - {tilde y_i},,;Delta {varepsilon _i} = {varepsilon _i} - {varepsilon _{i - 1}},,;{A_i} = left| {frac{{{y_i} - {{tilde y}_i}}}{{{y_i}}}} right|;,]

   xi  yi  ýi  yi-ÿ  (yi-ÿ)2 εi  εi2  Ai  Δεi  (Δεi)2 

1

−1

4.3

3.9160

1.75

3.0625

0.3840

0.1475

0.0893

2

−0.8

3

3.4128

0.45

0.2025

−0.4128

0.1704

0.1376

−0.7968

0.6349

3

0

2

1.9226

−0.55

0.3025

0.0774

0.006

0.0387

0.4902

0.2403

4

0.5

1.5

1.4157

−1.05

1.1025

0.0843

0.0071

0.0562

0.0069

0

5

1

1

1.2353

−1.55

2.4025

−0.2353

0.0554

0.2353

−0.3196

0.1022

6

1.8

0.8

1.6260

−1.75

3.0625

−0.8260

0.6822

1.0324

−0.5906

0.3488

7

2

2.5

1.8542

−0.05

0.0025

0.6458

0.417

0.2583

1.4717

2.166

8

2.5

2.7

2.6535

0.15

0.0225

0.0465

0.0022

0.0172

−0.5992

0.3591

9

2.6

3.5

2.8525

0.95

0.9025

0.6475

0.4193

0.1850

0.6010

0.3612

10

3.3

4.2

4.6114

1.65

2.7225

−0.4114

0.1693

0.0980

−1.0589

1.1214

11,9 25,5 13.785   2.0763 2.1481   5.3339

Критерии оценки

Индекс корреляции:

    [R = sqrt {1 - frac{{sum {{{left( {{y_i} - {{tilde y}_i}} right)}^2}} }}{{sum {{{left( {{y_i} - bar y} right)}^2}} }}}  = sqrt {1 - frac{{2.0763}}{{13.785}}}  approx 0.9216]

Зависимость (связь) между переменными весьма тесная.

Индекс детерминации (коэффициент детерминации) используют для характеристики качества уравнения регрессии. R2=0.92162=0.8494  Чем больше R2, тем большая часть дисперсии результативного признака (y) объясняется уравнением регрессии и тем лучше уравнение регрессии описывает исходные данные. Изменчивость зависимой переменной (у) на 84,94 % объясняется изменчивостью независимой переменной (х). Иными словами: в 85 случаях из 100 изменение величины результативного показателя (у) объясняется изменением величины факторного признака (х). 

Средняя ошибка аппроксимации:

    [bar A = frac{1}{n}sum {left| {frac{{{y_i} - {{tilde y}_i}}}{{{y_i}}}} right|; cdot 100%  = frac{{2.1481}}{{10}}}  cdot 100%  approx 21.4811% ,]

Общее суждение о качестве модели среднее (полученный критерий выше максимально допустимых значений: 12-15 %).

F-критерий Фишера (фактический):

    [{F_{fakt}} = frac{{{R^2}}}{{1 - {R^2}}} cdot frac{{{k_2}}}{{{k_1}}} = frac{{0.8494}}{{1 - 0.8494}} cdot frac{7}{2} approx 19.7371]

Fтабл. (α. k1, k2) → Fтабл.(0.05, 2, 7)=4.7374;

k=m=2, k=n-m1=10-2-1=7α=0.05  m– это число параметров при переменных уравнения регрессии (без свободного члена). 

Fфакт > Fтеор. (19,7371>4.7374) – признается  статистическая  значимость уравнения в целом.

Критерий Дарбина-Уотсона (фактический):

    [DW = frac{{sumlimits_{i = 1}^n {{{({varepsilon _i} - {varepsilon _{i - 1}})}^2}} }}{{sum {varepsilon _i^2} }} = frac{{5.3339}}{{2.0763}} approx 2.5689]

Автокорреляция отклонений отсутствует, если выполняется следующее условие: dL < DW и dU < DW < 4 – dОтсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии. (dL < DW > dU) → 0.95<2.5689>1.54 основная  гипотеза (H0) об отсутствии автокорреляции первого порядка между остатками модели регрессии принимается. 

4.86
kotos2
На связи нахожусь регулярно, бесплатно консультирую заказчика по любому вопросу. Занимаюсь написанием работ очень давно, цены заниженные, пока не наберу хорошую статистику.