Парная и множественная регрессии


Парная и множественная регрессии

Экономико-математическая модель — это система формализованных соотношений, описывающих основные взаимосвязи элементов, образующих экономическую систему. Система экономико-математических моделей эконометрического типа служит для описания относительно сложных процессов экономического или социального характера. В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявить факторы (признаки), оказывающие существенное влияние на вариацию изучаемых явлений и процессов.
Простейшая экономико-математическая модель может быть представлена в  следующем виде: Y = a*x  Эта модель приобретает более сложный вид, если рассматривается зависимость анализируемого показателя под влиянием нескольких факторов: Y = a + b1*X1 + b2*X2 + … + bp*Xp

Не рекомендуется включать в модель факторы, которые взаимно дублируют друг друга, т. е. отражают одну и ту же сторону изучаемого явления. Следует иметь ввиду, что  количество наблюдений должно быть примерно в 2 — 3 раза больше числа факторов, включаемых в уравнение регрессии.

Применение  корреляционно – регрессионного метода анализа (КРА)  между изучаемыми явлениями дает возможность:

1. Определить аналитическую форму связи между признаками, описав её с помощью уравнений регрессии.
2. Установить меру тесноты и направление связи  между результативным  и  факторным  признаками.
Связь  между результативным  и  факторным  признаками может быть прямолинейной и криволинейной   (по параболе, гиперболе).
В случае прямолинейной формы связи результативный признак изменяется под влиянием факторного равномерно.
В случае криволинейной формы – равномерное увеличение факторного признака ведет к изменению результативного признака с ускорением.
Уравнение регрессии может быть записано соответственно по прямой, по гиперболе, по параболе второго порядка:

Решение  системы и определение параметров по сгруппированным данным для уравнения прямой, параболы, гиперболы:

 

В качестве примера парной регрессии для иллюстрации корреляционного анализа прямолинейной зависимости используем приведенные данные об изменении уровня выработки рабочих (Y) в зависимости от уровня фондовооруженности труда (Х).

n

х

у

ху

х2

у2

ух

1

3,1

4,5

13,95

9,61

20,25

4,28

2

3,4

4,4

14,96

11,56

19,36

4,65

3

3,6

4,8

17,28

12,96

23,04

4,90

4

3,8

5,0

19,00

14,44

25,00

5,15

5

3,9

5,5

21,45

15,21

30,25

5,28

6

4,1

5,4

22,14

16,81

29,16

5,52

7

4,2

5,8

24,36

17,64

33,64

5,65

8

4,4

6,0

26,40

19,36

36,00

5,90

9

4,6

6,1

28,06

21,16

37,21

6,15

10

4,9

6,5

31,85

24,01

42,25

6,28

Итого

40

54

219,45

162,76

296,16

53,75

  • n–число наблюдений (в данном примере 10)
  • Х-фондовооруженность труда (стоимость основных производственных фондов на одного работника предприятия)
  • У-среднегодовая выработка продукции одним работником

Ниже рассмотрена зависимость результативного показателя (фондовооруженности) от определяющих его факторов (уровня выработки), которую можно выразить уравнением парной регрессии y=f(x). Подставив полученные значения в систему уравнений и умножив все члены первого уравнения на 4, получим:

Вычитаем из второго уравнения первое:

Уравнение связи, описывающее зависимость производительности труда от фондовооруженности: Ух = 0,4+1,25Х

Коэффициент а=0,4 – постоянная величина результативного показателя, которая не связана с изменением данного фактора.  Параметр показывает среднее изменение результативного показателя с повышением или понижением величины фактора на единицу его измерения. В данном примере с увеличением фондовооруженности труда на 1 тыс. руб. выработка рабочих повышается в среднем на 1,25 тыс. руб.

Подставив в уравнение регрессии соответствующие значения (Хi) , можно определить выровненные (теоретические) значения результативного показателя (Ух) для каждого предприятия. Например, чтобы рассчитать выработку рабочих на первом предприятии, где фондовооруженность труда равна 3,1 тыс. руб., необходимо это значение подставить в уравнение связи: Ух = 0,4+1,25*3,1=4,28

Полученная величина показывает, какой была бы выработка при фондовооруженности труда 3,1 тыс. руб., если бы данное предприятие использовало свои производственные мощности в такой степени, как в среднем все предприятия этой выборки. Фактическая выработка на данном предприятии выше расчетного значения. Следовательно, предприятие использует свои производственные мощности несколько лучше, чем в среднем по отрасли. Аналогичные расчеты сделаны для каждого предприятия. Данные приведены в последней графе таблицы. Сравнение фактического уровня выработки рабочих с расчетным позволяет оценить результаты работы отдельных предприятий.

По такому же принципу решается уравнение связи при криволинейной зависимости между изучаемыми явлениями. Когда при увеличении одного показателя, значения другого возрастают до определенного уровня, а потом начинают снижаться (например, зависимость производительности труда рабочих от их возраста), то для записи такой зависимости лучше всего подходит парабола второго порядка.

Для измерения тесноты связи между факторным и результативными показателями исчисляется коэффициент корреляции. При прямолинейной форме связи между изучаемыми показателями он рассчитывается по следующей формуле:

Этот коэффициент может принимать значения от 0 до 1. Чем ближе его величина к 1, тем более тесная связь между изучаемыми явлениями, и наоборот. В данном случае величина коэффициента корреляции является существенной (r=0.97). Это позволяет сделать вывод о том, что фондовооруженность — один из основных факторов, от которого на анализируемых предприятиях зависит уровень производительности труда.

Если коэффициент корреляции возвести в квадрат, получим коэффициент детерминации (d=0.94). Он показывает, что производительность труда на 94% зависит от фондовооруженности труда, а на долю других факторов приходится 6% изменения ее уровня.

Рассмотрим пример многофакторного корреляционного анализа. Для этого, с помощью табличного процессора,  сформируем матрицу исходных данных, в первой графе которой записывается порядковый номер наблюдения, во второй — величина результативного показателя (У), а в следующих – данные по факторным показателям (Хi). Уравнение множественной регрессии получило следующее выражение:

Ух = 0,49+3,65Х1+0,09Х2+1,02Х3-0,122Х4+0,052Х5 , где:

  •  Ух – рентабельность продаж, %;
  •  Х1 – материалоотдача, руб.;
  •  Х2 – фондоотдача, коп.;
  •  Х3 – производительность труда (среднегодовая выработка продукции на одного работника), тыс. руб.;
  •  Х4 – продолжительность оборота оборотных средств предприятия, дни;
  •  Х5 – удельный вес продукции высшей категории качества, %.

Коэффициенты уравнения показывают количественное воздействие каждого фактора на результативный показатель при неизменности других. В данном случае можно дать следующую интерпретацию полученному уравнению: рентабельность повышается на 3,65% при увеличении материалоотдачи на 1 руб.; на 0,09% — с ростом фондоотдачи на 1 коп.; на 1,02% — с повышением среднегодовой выработки продукции на одного работника на 1 тыс. руб.; на 0,052% – при увеличении удельного веса продукции высшей категории качества на 1%. С увеличением продолжительности оборота средств на 1 день рентабельность снижается в среднем на 0,122%.

Коэффициент множественной корреляции равен 0,92, коэффициент множественной детерминации – 0,85. Это значит, что изменение уровня рентабельности на 85% зависит от изменения исследуемых факторов, а на долю других факторов приходится 15% вариации результативного показателя. Значит, данное уравнение можно использовать для практических целей, а именно:

  1. расчета влияния факторов на прирост результативного показателя;
  2. подсчета резервов повышения уровня исследуемого показателя;
  3. планирования и прогнозирования его величины.

Влияние каждого фактора на прирост (отклонение от плана) результативного показателя рассчитывается следующим образом: ΔУхi = bi*ΔXi

Допустим, что уровень материалоотдачи на анализируемом предприятии по плану на отчетный год – 2,5 руб. фактически – 2,4 руб. Из-за этого уровень рентабельности продукции ниже планового на 0,365%: 

ΔУхi = 3.65*(2.4 — 2.5) = 0.365%

Аналогичным образом подсчитывают резервы роста результативного показателя. Для этого планируемый прирост факторного показателя умножают на соответствующий ему коэффициент регрессии в уравнении связи. Предположим, что в следующем году намечается рост материалоотдачи с 2,4 до 2,7 руб. За счет этого рентабельность повысится на:     ΔУхi = (2,7-2,4)*3,65 = 1,1%

Подобные расчеты делаются по каждому фактору с последующим обобщением результатов анализа. Результаты многофакторного регрессионного анализа могут быть использованы также для планирования и прогнозирования уровня результативного показателя. С этой целью необходимо в полученное уравнение связи подставить плановый (прогнозный) уровень факторных показателей: 

Ух = 0,49+3,65*2,7+0,09*85+1,02*8,5-0,122*20+0,052*33=25,95%

Таким образом, многофакторный корреляционный анализ имеет важную научную и практическую значимость. С установлением места и роли каждого фактора в формировании уровня исследуемых показателей точнее обосновываются планы и управленческие решения, объективнее оцениваются итоги деятельности предприятий и полнее определяются внутрихозяйственные резервы.

Значимость выбранного уравнения регрессии, параметров уравнения и коэффициента корреляции  следует оценить, применив критические методы оценки: F-критерий Фишера, t – критерий Стьюдента 

Смотри также по теме: