Аналитическое выравнивание себестоимости зерновых культур


Аналитическое выравнивание себестоимости зерновых культур выразим через линейное уравнение тренда, которое имеет вид: y = a0 +  a1*t  (y = а + b*t)

Находим параметры уравнения методом наименьших квадратов

t

y

t 2

y 2

t•y

y(t)

(y-y cp) 2

(y-y(t))2

(t-t p) 2

(y-y(t)) : y

1

223.97

1

50162.56

223.97

231.54

365.65

57.27

4

0.0338

2

219.44

4

48153.91

438.88

218.19

212.93

1.56

1

0.0057

3

214.87

9

46169.12

644.61

204.85

100.44

100.44

0

0.0466

4

197.99

16

39200.04

791.96

191.5

47.03

42.08

1

0.0328

5

167.97

25

28213.92

839.85

178.16

1359.99

103.8

4

0.0607

15

1024.24

55

211899.55

2939.27

1024.24

2086.04

305.15

10

0.18

Система уравнений МНК:
a0 n + a1∑t = ∑y
a0∑t + a1∑t2 = ∑y•t
Для наших данных система уравнений имеет вид:
5a0 + 15a1 = 1024.24
15a0 + 55a1  = 2939.27
Из первого уравнения выражаем а0 и подставляем во второе уравнение, в результате получаем:

a0 = -13.35,   a1 = 244.88
Уравнение тренда:
y = -13.35 t + 244.88
Эмпирические коэффициенты тренда a0 и a1 (b) являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных. Коэффициент тренда a1(b) =-13.35 показывает среднее изменение результативного показателя с изменением периода времени t на единицу его измерения (год). В данном примере с увеличением  t (времени) на 1 год,  y (себестоимость) уменьшится в среднем на ( -13.35).

 

Ошибка аппроксимации.
Оценим качество уравнения тренда с помощью ошибки абсолютной аппроксимации.

    \[\bar \varepsilon  = \frac{1}{n}\sum {\frac{{\left| {{y_i} - {{\tilde y}_t}} \right|}}{{{y_i}}}} *100\%  = \frac{{0.18}}{5}*100\%  = 3.59\%\]

Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения тренда к исходным данным. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве тренда.
Однофакторный дисперсионный анализ.
Средние значения:

    \[\bar t = \frac{{\sum\limits_{i = 1}^n {{t_i}} }}{n} = \frac{{15}}{5} = 3\]

    \[\bar y = \frac{{\sum\limits_{i = 1}^n {{y_i}} }}{n} = \frac{{1024.24}}{5} = 204.85\]

    \[\overline {ty}  = \frac{{\sum\limits_{i = 1}^n {{t_i}{y_i}} }}{n} = \frac{{2939.27}}{5} = 587.85\]

 Дисперсия:

    \[{D_t} = \frac{{\sum {{t_i}^2} }}{n} - {t^2} = \frac{{55}}{5} - {3^2} = 2\]

    \[{D_y} = \frac{{\sum {{y^2}_i} }}{n} - {\bar y^2} = \frac{{211899.55}}{5} - {204.85^2} = 417.21\]

Среднеквадратическое отклонение:

    \[{\sigma _{(t)}} = \sqrt {{D_{(t)}}}  = \sqrt 2  = 1.41\]

    \[{\sigma _{(y)}} = \sqrt {{D_{(y)}}}  = \sqrt {417.21}  = 20.43\]

Коэффициент эластичности.
Коэффициент эластичности представляет собой показатель силы связи фактора t с результатом у, показывающий, на сколько процентов изменится значение у при изменении значения фактора на 1%.

Коэффициент эластичности меньше 1. Следовательно, при изменении t на 1%,Y изменится менее чем на 1%. Другими словами — влияние t на Y не существенно.
Эмпирическое корреляционное отношение.
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерения тесноты зависимости между анализируемыми показателями (факторами). Изменяется в пределах [0;1].

В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1]. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < η < 0.3: слабая;
0.3 < η < 0.5: умеренная;
0.5 < η < 0.7: заметная;
0.7 < η < 0.9: высокая;
0.9 < η < 1: весьма высокая;
Полученная величина свидетельствует о том, что изменение временного периода t существенно влияет на y.
Коэффициент детерминации.

т.е. в 85.37% случаев влияет на изменение данных. Другими словами — точность подбора уравнения тренда — высокая.

Анализ точности определения оценок параметров уравнения тренда.                     

m = 1 — количество влияющих факторов в модели тренда

По таблице Стьюдента находим tтабл
tтабл (n-m-1;  α/2) = (3;0.025) = 3.182
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и t = 1
(244.88 -13.35*1 — 3.182*40.59;    244.88 -13.35*1 — 3.182*40.59)
(190.94; 272.13)
Интервальный прогноз.
Определим среднеквадратическую ошибку прогнозируемого показателя.


где L — период упреждения; уn+L — точечный прогноз по модели на (n + L)-й момент времени; n — количество наблюдений во временном ряду; Sy — стандартная ошибка прогнозируемого показателя;  tα — табличное значение критерия Стьюдента для уровня значимости α и для числа степеней свободы, равного n-2.

Проверка гипотез относительно коэффициентов линейного уравнения тренда.

Критерий Стьюдента.  t-статистика.

Доверительный интервал для коэффициентов уравнения тренда. Определим доверительные интервалы коэффициентов тренда, которые с надежностью 95%  будут следующими:
(b — tнабл Sb;   b + tнабл Sb)
(-13.35 — 3.182•3.19;   -13.35 + 3.182•3.19)
(-23.4933;     -3.1967)
(a — t набл Sa;    a + t набл Sa)
(244.88 — 3.182•10.58;    244.88 + 3.182•10.58)
(211.2249;    278.5411)
Критерий Фишера. F-статистика.

Fтабл. = 10.1 (a =0.05; df1=1 df2=3)
где m — количество факторов в уравнении тренда (m=1).
Поскольку Fрасч. > Fтабл., то коэффициент детерминации (и в целом уравнение тренда) статистически значим.
Проверка на наличие автокорреляции остатков.
1. Графический метод

Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения εi с моментами их получения i. При этом, по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат – отклонения εi (либо оценки отклонений).
Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости, скорее всего, будет свидетельствовать об отсутствии автокорреляции.
Автокорреляция становится более наглядной, если построить график зависимости εi от εi-1
2. Коэффициент автокорреляции остатков:

    \[{r_{{\varepsilon _i}}} = \frac{{\overline {{\varepsilon _\iota }{\varepsilon _{\iota - 1}}} - \overline {{\varepsilon _\iota }} \cdot \overline {{\varepsilon _{\iota - 1}}} }}{{\Sigma {S_{{\varepsilon _\iota }}} \cdot \Sigma {S_{{\varepsilon _{\iota - 1}}}}}}\]

Если коэффициент автокорреляции rei < 0.5, то есть основания утверждать, что автокорреляция отсутствует.
3. Критерий Дарбина-Уотсона.
Этот критерий является наиболее известным для обнаружения автокорреляции.
При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин ei

y

y(x)

ei = y-y(x)

e2

(ei — ei-1)2

223.97

231.54

-7.57

57.27

0

219.44

218.19

1.25

1.56

77.7

214.87

204.85

10.02

100.44

77

197.99

191.5

6.49

42.08

12.5

167.97

178.16

-10.19

103.8

278.06

305.15

445.26

Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона:

Критические значения d1 и d2 определяются на основе таблиц Распределения Дарбина-Уотсона для требуемого уровня значимости α, числа наблюдений n = 5 и количества объясняющих переменных m=1.

Автокорреляция отсутствует, если выполняется следующее условие:
d1 < DW и d2 < DW < 4 — d2
Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Поскольку 1.5 > 1.46 < 2.5, то автокорреляция остатков присутствует.
Для более надежного вывода целесообразно обращаться к табличным значениям.
По таблице Дарбина-Уотсона для n=5 и k=1 (уровень значимости 5%) находим:  d1 = 1.08;  d2 = 1.36.
Поскольку 1.08 < 1.46 и 1.36 < 1.46 < 4 — 1.36, то автокорреляция остатков отсутствует.
Проверка наличия гетероскедастичности.
1) Методом графического анализа остатков.
В этом случае по оси абсцисс откладываются значения объясняющей переменной X, а по оси ординат либо отклонения ei, либо их квадраты ei2 Если имеется определенная связь между отклонениями, то гетероскедастичность имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии гетероскедастичности.
2) При помощи теста ранговой корреляции Спирмена.
Коэффициент ранговой корреляции Спирмена.
Присвоим ранги признаку ei и фактору X. Найдем сумму разности квадратов d2. По формуле вычислим коэффициент ранговой корреляции Спирмена:

X

ei

ранг X, dx

ранг ei, dy

(dx — dy)2

1

7.57

1

4

9

2

-1.25

2

3

1

3

-10.02

3

1

4

4

-6.49

4

2

4

5

10.19

5

5

0

18

Связь между признаком ei и фактором X  слабая и прямая. 

Оценка коэффициента ранговой корреляции Спирмена. Значимость коэффициента ранговой корреляции Спирмена:


По таблице Стьюдента находим tтабл:
tтабл (n-m-1;  α/2) = (3;  0.05/2) = 3.182
Поскольку tнабл. < tтабл., то принимаем гипотезу о равенстве р=0 коэффициента ранговой корреляции. Другими словами, коэффициент ранговой корреляции статистически — не значим.

Интервальная оценка для коэффициента корреляции (доверительный интервал).

Доверительный интервал для коэффициента ранговой корреляции:
r (-1.3088;  1.5088)
Проверим  нулевую гипотезу H0: гетероскедастичность отсутсвует. Поскольку 3.182 > 0.17, то гипотеза об отсутствии гетероскедастичности принимается.

Смотри также: