Значимость уравнения регрессии
Пример расчета критериев оценки
Расчет F-критерия Фишера, индекса (коэффициента) детерминации, критерия Дарбина -Уотсона, средней ошибки аппроксимации
Исходные данные
Используем опытные данные при построении уравнения квадратичной функции вида y = ax2 + bx + c, оценим значимость полученного уравнения регрессии У=0.6531x2-1.3403x+1.9226.
Решение системы линейных уравнений и определение параметров для данного уравнения, с использованием метода Крамера, смотри МНК для параболы 2-го порядка.
xi | -1 | -0,8 | 0 | 0,5 | 1 | 1,8 | 2 | 2,5 | 2,6 | 3,3 |
yi | 4.3 | 3 | 2 | 1.5 | 1 | 0.8 | 2.5 | 2.7 | 3.5 | 4.2 |
Диаграмма рассеяния и график уравнения регрессии
Расчет критериев оценки
Для оценки значимости параметров регрессии и корреляции сначала рассчитаем среднее значение зависимой переменной:
Составим таблицу вспомогательных величин, где:
xi | yi | ýi | yi-ÿ | (yi-ÿ)2 | εi | εi2 | Ai | Δεi | (Δεi)2 | |
1 |
−1 |
4.3 |
3.9160 |
1.75 |
3.0625 |
0.3840 |
0.1475 |
0.0893 |
– |
– |
2 |
−0.8 |
3 |
3.4128 |
0.45 |
0.2025 |
−0.4128 |
0.1704 |
0.1376 |
−0.7968 |
0.6349 |
3 |
0 |
2 |
1.9226 |
−0.55 |
0.3025 |
0.0774 |
0.006 |
0.0387 |
0.4902 |
0.2403 |
4 |
0.5 |
1.5 |
1.4157 |
−1.05 |
1.1025 |
0.0843 |
0.0071 |
0.0562 |
0.0069 |
0 |
5 |
1 |
1 |
1.2353 |
−1.55 |
2.4025 |
−0.2353 |
0.0554 |
0.2353 |
−0.3196 |
0.1022 |
6 |
1.8 |
0.8 |
1.6260 |
−1.75 |
3.0625 |
−0.8260 |
0.6822 |
1.0324 |
−0.5906 |
0.3488 |
7 |
2 |
2.5 |
1.8542 |
−0.05 |
0.0025 |
0.6458 |
0.417 |
0.2583 |
1.4717 |
2.166 |
8 |
2.5 |
2.7 |
2.6535 |
0.15 |
0.0225 |
0.0465 |
0.0022 |
0.0172 |
−0.5992 |
0.3591 |
9 |
2.6 |
3.5 |
2.8525 |
0.95 |
0.9025 |
0.6475 |
0.4193 |
0.1850 |
0.6010 |
0.3612 |
10 |
3.3 |
4.2 |
4.6114 |
1.65 |
2.7225 |
−0.4114 |
0.1693 |
0.0980 |
−1.0589 |
1.1214 |
11,9 | 25,5 | 13.785 | 2.0763 | 2.1481 | 5.3339 |
Критерии оценки
Индекс корреляции:
Зависимость (связь) между переменными весьма тесная.
Индекс детерминации (коэффициент детерминации) используют для характеристики качества уравнения регрессии. R2=0.92162=0.8494 Чем больше R2, тем большая часть дисперсии результативного признака (y) объясняется уравнением регрессии и тем лучше уравнение регрессии описывает исходные данные. Изменчивость зависимой переменной (у) на 84,94 % объясняется изменчивостью независимой переменной (х). Иными словами: в 85 случаях из 100 изменение величины результативного показателя (у) объясняется изменением величины факторного признака (х).
Средняя ошибка аппроксимации:
Общее суждение о качестве модели среднее (полученный критерий выше максимально допустимых значений: 12-15 %).
F-критерий Фишера (фактический):
Fтабл. (α. k1, k2) → Fтабл.(0.05, 2, 7)=4.7374;
k=m=2, k=n-m–1=10-2-1=7, α=0.05 m– это число параметров при переменных уравнения регрессии (без свободного члена).
Fфакт > Fтеор. (19,7371>4.7374) – признается статистическая значимость уравнения в целом.
Критерий Дарбина-Уотсона (фактический):
Автокорреляция отклонений отсутствует, если выполняется следующее условие: dL < DW и dU < DW < 4 – dU Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии. (dL < DW > dU) → 0.95<2.5689>1.54 основная гипотеза (H0) об отсутствии автокорреляции первого порядка между остатками модели регрессии принимается.