Уравнения линейной регрессии
Наше уравнение регрессии включает постоянный член, следовательно, первое условие выполняется автоматически. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков; построить график остатков. Первое условие. Математическое ожидание случайной составляющей в любом наблюдении должно быть равно нулю. Вычислим остатки; найдём остаточную сумму квадратов; оценим дисперсию… Читать ещё >
Уравнения линейной регрессии (реферат, курсовая, диплом, контрольная)
По предприятиям легкой промышленности региона получена информация, характеризующая зависимость объема выпуска продукции (X, млн. руб.) от объема капиталовложений (Y, млн. руб.).
X. | ||||||||||
Y. |
Требуется:
- 1. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
- 2. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков; построить график остатков.
- 3. Проверить выполнение предпосылок МНК.
- 4. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью критерия Фишера, найти среднюю относительную ошибку аппроксимации.
- 5. Представить графически: фактические и модельные значения точки прогноза.
- 6. Составить уравнения нелинейной регрессии и привести их графики:
- — полиномиальной (2-го порядка);
- — степенной.
Решение.
Линейное уравнение имеет вид:
у = а + bx +,.
где возмущение, случайная величина, характеризующая отклонения реального значения результативного признака от теоретического.
Найдём параметры, а и b с помощью метода наименьших квадратов:
n=10 исходя из условия.
Составим расчётную таблицу 1.1.:
Таблица 1.1 Вычисление параметров.
регрессия аппроксимация детерминация Подставляем полученные данные в нашу систему:
- 336 = 10а + 235b a= 12.24
- 8649 = 235а + 6351b b=0.91
— формула для расчёта теоретического значения у.
Экономическая интерпретация коэффициента регрессии:
Данная формула показывает, что при увеличении капиталовложений на 1 млн руб. объём выпуска продукции увеличится на 2290 тыс. руб.
Вычислим остатки; найдём остаточную сумму квадратов; оценим дисперсию остатков; построим график остатков.
После построения уравнения регрессии мы можем разбить значение у в каждом наблюдении на две составляющих — и ;
.
Остаток представляет собой отклонение фактического значения зависимой переменной от значения данной переменной, полученное расчетным путем:
().
Для вычисления остатков, остаточной суммы квадратов составим расчётную таблицу 1.2.
Для нахождения дисперсии на одну степень используем формулу:
Таблица 1.2 Вычисление остатков.
№ п/п. | Объём капиталовложений, млн.руб., х. | Объём выпуска продукции, млн.руб., у. | |||
42,23 427 882. | 0,765 721 183. | 0,5 863 289. | |||
27,69 233 555. | — 0,692 335 546. | 0,4 793 285. | |||
33,14 556 427. | — 1,145 564 273. | 1,3 123 175. | |||
27,69 233 555. | 1,307 664 454. | 1,7 099 863. | |||
44,96 089 318. | 0,3 910 682. | 0,15 293. | |||
34,96 330 718. | 0,36 692 818. | 0,13 464. | |||
47,68 750 754. | — 0,687 507 544. | 0,4 726 666. | |||
30,41 894 991. | 1,581 050 091. | 2,4 997 194. | |||
24,5 684 973. | — 2,56 849 728. | 4,2 306 308. | |||
23,14 797 827. | 0,852 021 726. | 0,725 941. | |||
Среднее значение. | 23,5. | 33,6. | 33,6. | ||
Сумма. | 12,19 795. |
Остаточная сумма квадратов = 12.02 показывает, какое влияние на результат оказывают прочие факторы, следовательно, прочие факторы оказывают незначительное влияние на результат.
— дисперсия на одну степень свободы.
Построим график остатков (рис. 1.1).
Рис. 1.1 График остатков
Проверим выполнение предпосылок МНК.
Первое условие. Математическое ожидание случайной составляющей в любом наблюдении должно быть равно нулю.
Наше уравнение регрессии включает постоянный член, следовательно, первое условие выполняется автоматически.
Второе условие. В модели возмущение есть величина случайная, а объясняющая переменная — величина не случайная.
Это условие так же выполнено.
Третье условие. Отсутствие систематической связи между значениями случайной составляющей в любых двух наблюдениях.
Т.к. наша случайная составляющая в первом наблюдении, например, равна 1,27, а во втором — -1,99, т. е. то, что она положительна в первом случае не обуславливает то, что она будет такой же в других наблюдениях. Значит, случайные составляющие не зависят друг от друга.
Четвёртое условие. Дисперсия случайной составляющей должна быть постоянна для всех наблюдений. Это условие равноизменчивости возмущения.
Несмотря на то, что случайные составляющие не зависимы друг от друга и меняются постоянно в разном направлении, но они не порождают большой ошибки.
Таким образом, все предпосылки МНК выполнены.
Вычислим коэффициент детерминации,.
- -проверим значимость уравнения регрессии с помощью — критерия Фишера ,
- -найдём среднюю относительную ошибку аппроксимации.
Сделаем вывод о качестве модели.
Определим линейный коэффициент парной корреляции по следующей формуле:
;
Можно сказать, что связь между объемом капиталовложений х и объемом выпуска продукции у прямая, очень сильная.
Рассчитаем коэффициент детерминации:
R2 = r2yx = 0,982.
Вариация результата у (объема выпуска продукции) на 98,2% объясняется вариацией фактора х (объемом капиталовложений), т. е качество модели высокое.
Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера:
F>FТАБЛ = 5,32 для = 0,05; к1=m=1, k2=n-m-1=8.
Уравнение регрессии с вероятностью 0,95 статистически значимое, т. к. F>FТАБЛ .
Определим среднюю относительную ошибку аппроксимации:
Среднюю ошибку найдём с помощью таблицы 1.3.
Таблица 1.3 Ошибки аппроксимации.
В среднем расчетные значения y для линейной модели отличаются от фактических значений на 0,39% - модель достаточно точно аппроксимирует исходные данные.
Вывод: Линейная модель статистически значима, высокого качества.
Представим графически: фактические и модельные значения точки прогноза (рис. 1.2.).
Рис. 1.2 График фактических, модельных и прогнозных значений у
а) Уравнение регрессии второго порядка это полиномальное уравнение регрессии второго порядка:
y = a2x2 + a1x + a0.
Находим параметры уравнения методом наименьших квадратов.
Система уравнений МНК:
a0n + a1? x + a2? x2 = ?y.
a0?x + a1? x2 + a2? x3 = ?yx.
a0?x2 + a1? x3 + a2? x4 = ?yx2.
Таблица 1.4.
№ п/п. | Объём капиталовложений, млн.руб., х. | Объём выпуска продукции, млн.руб., у. | x2. | y2. | xy. | x3. | x4. | x2*y. |
сумма. |
Для наших данных система уравнений имеет вид.
- 10a0 + 235a1 + 6351a2 = 336
- 235a0 + 6351a1 + 19 1455a2 = 8649
- 6351a0 + 19 1455a1 + 622 5783a2 = 251 595
Получаем a2 = -0.377, a1 = 1.101, a0 = 10.122.
Уравнение тренда:
y = -0.377×2+1.101x+10.122.
Рис. 1.3 График полиномы второго порядка
б) Построение степенной модели парной регрессии Уравнение степенной модели имеет вид:
Оценочное уравнение регрессии будет иметь вид.
y = a xb + е,.
где ei — наблюдаемые значения ошибок еi, а и b соответственно оценки параметров б и в регрессионной модели, которые следует найти.
Здесь е — случайная ошибка.
Рассчитаем его параметры, используя данные таблицы 1.5.
После линеаризации получим:
ln (y) = ln (a) + b ln (x).
Таблица 1.5 Нахождение параметров степенной модели.
№ п/п. | Объём капиталовложений, млн.руб., х. | Объём выпуска продукции, млн.руб., у. | Y = lg y. | X = lg x. | Y*X. | |
1,633 468. | 1,518 514. | 2,305 885. | 2,48 044 462. | |||
1,431 364. | 1,230 449. | 1,514 005. | 1,76 122. | |||
1,50 515. | 1,361 728. | 1,854 303. | 2,49 604 623. | |||
1,462 398. | 1,230 449. | 1,514 005. | 1,799 406 039. | |||
1,653 213. | 1,556 303. | 2,422 077. | 2,572 898 769. | |||
1,544 068. | 1,39 794. | 1,954 236. | 2,158 514 495. | |||
1,672 098. | 1,591 065. | 2,531 487. | 2,660 415 721. | |||
1,50 515. | 1,30 103. | 1,692 679. | 1,95 824 527. | |||
1,342 423. | 1,113 943. | 1,24 087. | 1,495 382 821. | |||
1,380 211. | 1,79 181. | 1,164 632. | 1,489 498 088. | |||
Среднее значение. | 23,5. | 33,6. | 1,512 954. | 1,33 806. | 1,819 418. | 2,42 563 045. |
Сумма. | 15,12 954. | 13,3806. | 18,19 418. |
Для наших данных система уравнений имеет вид.
- 10a + 30.81 b = 34.84
- 30.81 a + 96.46 b = 108.29
Домножим уравнение (1) системы на (-3.08), получим систему, которую решим методом алгебраического сложения.
- -30.81a -94.89 b = -107.3
- 30.81 a + 96.46 b = 108.29
Получаем:
1.57 b = 1.
Откуда b = 0.6252.
Теперь найдем коэффициент «a» из уравнения (1):
- 10a + 30.81 b = 34.84
- 10a + 30.81 * 0.6252 = 34.84
- 10a = 15.57
a = 1.5574.
Получаем эмпирические коэффициенты регрессии: b = 0.6252, a = 1.5574.
Уравнение регрессии (эмпирическое уравнение регрессии):
y = e1.55 741 893×0.6252 = 4.74 655×0.6252.
Рис. 1.4 График степенной модели