Оценка значимости квадратичной регрессии


Значимость уравнения регрессии

Расчет F-критерия Фишера, индекса (коэффициента) детерминации, критерия Дарбина -Уотсона, средней ошибки аппроксимации

Пример расчета критериев оценки

Исходные данные

Используем опытные данные при построении уравнения квадратичной функции вида y = ax2 + bx + c, оценим значимость полученного уравнения регрессии У=0.6531x2-1.3403x+1.9226.

Решение системы линейных уравнений и определение параметров для данного уравнения, с использованием метода Крамера, смотри МНК для параболы 2-го порядка .

xi -1 -0,8 0 0,5 1 1,8 2 2,5 2,6 3,3
yi 4.3 3 2 1.5 1 0.8 2.5 2.7 3.5 4.2

Диаграмма рассеяния и график уравнения регрессии

 

Расчет критериев оценки

Для оценки значимости параметров регрессии и корреляции сначала рассчитаем среднее значение зависимой переменной: 

    \[\bar y = \frac{1}{n}\sum\limits_{i = 1}^n {{y_i}}  = \frac{{25.5}}{{10}} = 2.55\]

Составим таблицу вспомогательных величин, где: 

    \[{\varepsilon _i} = {y_i} - {\tilde y_i},\,\;\Delta {\varepsilon _i} = {\varepsilon _i} - {\varepsilon _{i - 1}},\,\;{A_i} = \left| {\frac{{{y_i} - {{\tilde y}_i}}}{{{y_i}}}} \right|\;\,\]

   xi  yi  ýi  yi-ÿ  (yi-ÿ)2 εi  εi2  Ai  Δεi  (Δεi)2 

1

−1

4.3

3.9160

1.75

3.0625

0.3840

0.1475

0.0893

-

-

2

−0.8

3

3.4128

0.45

0.2025

−0.4128

0.1704

0.1376

−0.7968

0.6349

3

0

2

1.9226

−0.55

0.3025

0.0774

0.006

0.0387

0.4902

0.2403

4

0.5

1.5

1.4157

−1.05

1.1025

0.0843

0.0071

0.0562

0.0069

0

5

1

1

1.2353

−1.55

2.4025

−0.2353

0.0554

0.2353

−0.3196

0.1022

6

1.8

0.8

1.6260

−1.75

3.0625

−0.8260

0.6822

1.0324

−0.5906

0.3488

7

2

2.5

1.8542

−0.05

0.0025

0.6458

0.417

0.2583

1.4717

2.166

8

2.5

2.7

2.6535

0.15

0.0225

0.0465

0.0022

0.0172

−0.5992

0.3591

9

2.6

3.5

2.8525

0.95

0.9025

0.6475

0.4193

0.1850

0.6010

0.3612

10

3.3

4.2

4.6114

1.65

2.7225

−0.4114

0.1693

0.0980

−1.0589

1.1214

11,9 25,5 13.785   2.0763 2.1481   5.3339

Критерии оценки

Индекс корреляции: 

    \[R = \sqrt {1 - \frac{{\sum {{{\left( {{y_i} - {{\tilde y}_i}} \right)}^2}} }}{{\sum {{{\left( {{y_i} - \bar y} \right)}^2}} }}}  = \sqrt {1 - \frac{{2.0763}}{{13.785}}}  \approx 0.9216\]

Зависимость (связь) между переменными весьма тесная.

Индекс детерминации (коэффициент детерминации) используют для характеристики качества уравнения регрессии. R2=0.92162=0.8494  Чем больше R2, тем большая часть дисперсии результативного признака (y) объясняется уравнением регрессии и тем лучше уравнение регрессии описывает исходные данные. Изменчивость зависимой переменной (у) на 84,94 % объясняется изменчивостью независимой переменной (х). Иными словами: в 85 случаях из 100 изменение величины результативного показателя (у) объясняется изменением величины факторного признака (х). 

Средняя ошибка аппроксимации:  

    \[\bar A = \frac{1}{n}\sum {\left| {\frac{{{y_i} - {{\tilde y}_i}}}{{{y_i}}}} \right|\; \cdot 100\%  = \frac{{2.1481}}{{10}}}  \cdot 100\%  \approx 21.4811\% \,\]

  

Общее суждение о качестве модели среднее (полученный критерий выше максимально допустимых значений: 12-15 %).

F-критерий Фишера (фактический):

    \[{F_{fakt}} = \frac{{{R^2}}}{{1 - {R^2}}} \cdot \frac{{{k_2}}}{{{k_1}}} = \frac{{0.8494}}{{1 - 0.8494}} \cdot \frac{7}{2} \approx 19.7371\]

Fтабл. (α. k1, k2) → Fтабл.(0.05, 2, 7)=4.7374;

k=m=2, k=n-m-1=10-2-1=7 α=0.05  m– это число параметров при переменных уравнения регрессии (без свободного члена). 

Fфакт > Fтеор. (19,7371>4.7374)  - признается  статистическая  значимость уравнения в целом.

Критерий Дарбина-Уотсона (фактический): 

    \[DW = \frac{{\sum\limits_{i = 1}^n {{{({\varepsilon _i} - {\varepsilon _{i - 1}})}^2}} }}{{\sum {\varepsilon _i^2} }} = \frac{{5.3339}}{{2.0763}} \approx 2.5689\]

Автокорреляция отклонений отсутствует, если выполняется следующее условие: dL < DW и dU < DW < 4 – dОтсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии. (dL < DW > dU) → 0.95<2.5689>1.54  основная  гипотеза (H0) об отсутствии автокорреляции первого порядка между остатками модели регрессии принимается.  

Смотри также по теме: