Программирование в эконометрике
Для принятия решения об отсутствии или наличие автокорреляции в исследуемом ряду расчетное значение r (1) сопоставляют с табличным (критическим) значением r для = 0,05. Если r (1) < r, то гипотеза об отсутствии автокорреляции в исследуемом ряду может быть принята, иначе — делают вывод о наличии автокорреляции в ряду. В диалоговом окне Регрессия в поле Входной интервал Y введем диапазон ячеек… Читать ещё >
Программирование в эконометрике (реферат, курсовая, диплом, контрольная)
В данной работе необходимо выполнить следующие задания в соответствии со своим вариантом:
- 1) построить линейную модель Y (t) = a0 + a1t, параметры которой оценить методом наименьших квадратов (МНК);
- 2) оценить адекватность построенной модели на основе исследования:
случайной остаточной компоненты по критерию пиков;
независимости уровней ряда остатков по d-критерию и по первому коэффициенту автокорреляции;
нормальности распределения остаточной компоненты по RS-критерию;
- 3) построить точечный и интервальный прогнозы на два шага вперед;
- 4) отобразить на графике фактические данные, результаты расчетов и прогнозирования;
- 5) для данного ряда выбрать наилучший вид тренда.
Пусть имеются данные о динамике объемов ВВП США (в ценах 1997 г., млрд долл. США).
Год. | Объем ВВП США, млрд. долл. | Год. | Объем ВВП США, млрд. долл. |
3221,7. | 4148,5. | ||
3380,8. | 4279,8. | ||
3533,2. | 4404,5. | ||
3703,5. | |||
3796,8. | 4781,6. | ||
3776,3. | 4836,9. | ||
3843,1. | 4884,9. | ||
3760,3. | 4848,4. | ||
3906,6. |
Порядок выполнения.
1. Оценка параметров модели Оценим параметры с помощью надстройки Excel Анализ данных.
Для этого выполним следующие действия:
введем исходные данные (рис. 1):
Рис. 1. Исходные данные
выберем команду Сервис + Анализ данных;
в появившемся окне выберем инструмент Регрессия, а затем щелкнем по кнопке ОК (рис. 2).
Рис. 2. Диалоговое окно Анализ данных
в диалоговом окне Регрессия в поле Входной интервал Y введем диапазон ячеек зависимой переменной (Котировки). В поле Входной интервал Х введем диапазон ячеек, который содержит значения независимой переменной (t). Если выделить и заголовки столбцов, то необходимо установить флажок в поле Метки.
Для параметров вывода выберем поле Новый рабочий лист.
Для анализа остатков выберем поля Остатки и График подбора.
Диалоговое окно будет выглядеть следующим образом (рис. 3).
Рис. 3. Диалоговое окно Регрессия
Результат регрессионного анализа будет выведен на новый лист рабочей книги Excel. Анализ содержит таблицу регрессионной статистики и дисперсионного анализа, таблицу регрессионного анализа, а также график подбора (рис. 4).
Регрессионная статистика. | |
Множественный R. | 0,980 404. |
R-квадрат. | 0,961 191. |
Нормированный R-квадрат. | 0,958 604. |
Стандартная ошибка. | 110,1229. |
Наблюдения. |
Дисперсионный анализ.
df. | SS. | MS. | F. | Значимость F. | |
Регрессия. | 371,5118. | 5,39E-12. | |||
Остаток. | 181 905,8. | 12 127,05. | |||
Итого. |
Коэффициенты. | Стандартная ошибка. | t-статистика. | P-Значение. | Нижние 95%. | Верхние 95%. | Нижние 95,0%. | Верхние 95,0%. | |
Y-пересечение. | 3151,126. | 55,86 531. | 56,40 578. | 6,97E-19. | 3032,052. | 3270,201. | 3032,052. | 3270,201. |
Переменная X 1. | 105,0833. | 5,451 896. | 19,27 464. | 5,39E-12. | 93,46 289. | 116,7038. | 93,46 289. | 116,7038. |
Вывод остатка.
Наблюдение. | Предсказанное Y. | Остатки. |
3256,21. | — 34,5098. | |
3361,293. | 19,50 686. | |
3466,376. | 66,82 353. | |
3571,46. | 132,0402. | |
3676,543. | 120,2569. | |
3781,626. | — 5,32 647. | |
3886,71. | — 43,6098. | |
3991,793. | — 231,493. | |
4096,876. | — 190,276. | |
4201,96. | — 53,4598. | |
4307,043. | — 27,2431. | |
4412,126. | — 7,62 647. | |
4517,21. | 22,7902. | |
4622,293. | 159,3069. | |
4727,376. | 109,5235. | |
4832,46. | 52,4402. | |
4937,543. | — 89,1431. |
Рис. 4. График подбора
В результате расчетов получено линейное уравнение зависимости yt (урожайность) от t (время) в виде:
Y (t) = 3151,126 + 105,0833t.
Оценка параметров модели «вручную». Расчеты коэффициентов модели будем проводить по формулам кривых роста оцененных МНК:
a0 = a1,.
где , — средние значения уровней ряда и моментов наблюдения соответственно.
Оценка параметров регрессии:
а1 = 105,083;
а0 = 4096,876 471 — 105,083 9 3151,1294.
В результате ручного расчета получено линейное уравнение зависимости yt (объем ВВП) от t (время) в виде:
Y (t) = 3151,1294 + 105,083t.
Оценка параметров модели средствами мастера диаграмм представлена на рис.
Год (t). | Объем ВВП США, млрд. долл. (yt). | t-tср | (t-tср)^2. | y-y ср | (t-tср)(y-yср). | |
3221,7. | — 8. | — 875,1 764 706. | 7001,411 765. | |||
3380,8. | — 7. | — 716,764 706. | 5012,535 294. | |||
3533,2. | — 6. | — 563,6 764 706. | 3382,58 824. | |||
3703,5. | — 5. | — 393,3 764 706. | 1966,882 353. | |||
3796,8. | — 4. | — 300,764 706. | 1200,305 882. | |||
3776,3. | — 3. | — 320,5 764 706. | 961,7 294 118. | |||
3843,1. | — 2. | — 253,7 764 706. | 507,5 529 412. | |||
3760,3. | — 1. | — 336,5 764 706. | 336,5 764 706. | |||
3906,6. | — 190,2 764 706. | |||||
4148,5. | 51,62 352 941. | 51,62 352 941. | ||||
4279,8. | 182,9 235 294. | 365,8 470 588. | ||||
4404,5. | 307,6 235 294. | 922,8 705 882. | ||||
443,1 235 294. | 1772,494 118. | |||||
4781,6. | 684,7 235 294. | 3423,617 647. | ||||
4836,9. | 740,235 294. | 4440,141 176. | ||||
4884,9. | 788,235 294. | 5516,164 706. | ||||
4848,4. | 751,5 235 294. | 6012,188 235. | ||||
Сумма. | 69 646,9. | 5,45697E-12. | ||||
Среднее. | 4096,876 471. |
Рис. 5. Корреляционное поле и тренд
Оценка качества построенной модели Для этого исследуем адекватность модели. Модель является адекватной, если математическое ожидание значений остатков близко или равно нулю, и если значения остаточного ряда случайны, независимы и подчинены нормальному закону распределения;
Проверка равенства нулю математического ожидания уровней ряда остатков Для этого найдем значения ряда остатков и произведем суммирование.
Год (t). | Объем ВВП США, млрд. долл. (yt). | Y рег. | E. | |
3221,7. | 3256,212. | — 34,5124. | ||
3380,8. | 3361,295. | 19,5046. | ||
3533,2. | 3466,378. | 66,8216. | ||
3703,5. | 3571,461. | 132,0386. | ||
3796,8. | 3676,544. | 120,2556. | ||
3776,3. | 3781,627. | — 5,3274. | ||
3843,1. | 3886,71. | — 43,6104. | ||
3760,3. | 3991,793. | — 231,493. | ||
3906,6. | 4096,876. | — 190,276. | ||
4148,5. | 4201,959. | — 53,4594. | ||
4279,8. | 4307,042. | — 27,2424. | ||
4404,5. | 4412,125. | — 7,6254. | ||
4517,208. | 22,7916. | |||
4781,6. | 4622,291. | 159,3086. | ||
4836,9. | 4727,374. | 109,5256. | ||
4884,9. | 4832,457. | 52,4426. | ||
4848,4. | 4937,54. | — 89,1404. | ||
Сумма. | 69 646,9. | 69 646,9. | 0,0012. |
В нашем случае 0, поэтому гипотеза о равенстве математического ожидания значений остаточного ряда нулю выполняется. Модель по данному свойству адекватна.
Проверка независимости (отсутствие автокорреляции) Данное свойство проверяют с помощью критерия Дарбина-Уотсона. Для этого находится статистика Дарбина-Уотсона (d-статистика):
Для проверки используют два пороговых значения dв и dн, зависящие только от числа наблюдений, числа регрессоров и уровня значимости.
Расчетное значение d равно:
= 0,7087.
Значение рассчитанного параметра d больше dв и меньше 4dв, поэтому принимаем гипотезу об отсутствии автокорреляции по критерию Дарбина-Уотсона.
Значение рассчитанного параметра d больше dв и меньше 4dв, поэтому принимаем гипотезу об отсутствии автокорреляции по критерию Дарбина-Уотсона.
Также для проверки наличия автокорреляции можно воспользоваться первым коэффициентом автокорреляции:
Для принятия решения об отсутствии или наличие автокорреляции в исследуемом ряду расчетное значение r (1) сопоставляют с табличным (критическим) значением r для = 0,05. Если r (1) < r, то гипотеза об отсутствии автокорреляции в исследуемом ряду может быть принята, иначе — делают вывод о наличии автокорреляции в ряду.
Вычислим r (1) для нашего примера:
r (1) = = 0,6205.
Рассчитанное значение меньше табличного. Это означает, что гипотеза об отсутствии автокорреляции в ряду урожайности может быть принята.
Модель по параметру независимости адекватна.
Проверка случайности возникновения отдельных отклонений от тренда Используем критерий, основанный на поворотных точках.
Значение случайной переменной считается поворотной точкой, если оно одновременно больше (меньше) соседних с ним элементов. Если остатки случайны, то поворотная точка приходится примерно на каждые 1,5 наблюдения. Если их больше, то возмущения быстро колеблются, и это не может быть объяснено только случайностью. Если же их меньше, то последовательные значения случайного компонента положительно коррелированны.
Критерий случайности отклонений от тренда при уровне вероятности 0,95 можно представить как.
где р фактическое количество поворотных точек в случайном ряду; 1,96 квантиль нормального распределения для 5%-го уровня значимости.
Квадратные скобки означают, что от результата вычисления следует взять целую часть (не путать с процедурой округления!).
Если неравенство не соблюдается, то ряд остатков нельзя считать случайным (т.е. он содержит регулярную компоненту), стало быть, модель не является адекватной.
Построим график остатков.
Рис. 6. График остатков
Количество поворотных точек равно 3.
Значение = [6,7794] = 6.
Неравенство выполняется 3 < 6. Следовательно, свойство случайности выполняется. Модель по данному параметру не адекватна.
Соответствие ряда остатков нормальному закону распределения Данное соответствие можно проверить с помощью RS-критерия:
где max, min — соответственно максимальный и минимальный уровни ряда остатков; S среднеквадратическое отклонение ряда остатков.
Если расчетное значение RS попадает между табулированными границами с заданным уровнем вероятности, то гипотеза о нормальном распределении ряда остатков принимается. В этом случае допустимо строить доверительный интервал прогноза.
Среднеквадратическое отклонение ряда остатков S = 3,6912.
RS = = 3,5611.
Расчетное значение попадает в интервал [2,67−3,69], следовательно, выполняется свойство нормального распределения. Модель по этому параметру адекватна.
Если все пункты проверки дают положительный результат, то выбранная трендовая модель является адекватной реальному ряду экономической динамики, и, следовательно, ее можно использовать для построения прогнозных оценок. В противном случае модель надо улучшать.
Точечный и интервальный прогнозы на два шага вперед Точечный прогноз — это прогноз, которым называется единственное значение прогнозируемого показателя. Это значение определяется подстановкой в полученное (рассчитанное) уравнение выбранной кривой роста величины времени t, соответствующей периоду упреждения:
t = n + 1; t = n + 2 и т. д.
Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, имеет малую вероятность. Возникновение соответствующих отклонений объясняется следующими причинами.
- 1. Выбранная для прогнозирования кривая не является единственно возможной для описания тенденции. Можно подобрать такую кривую, которая дает более точные результаты.
- 2. Прогноз осуществляется на основании ограниченного числа исходных данных. Кроме того, каждый исходный уровень обладает еще и случайной компонентой. Поэтому и кривая, по которой осуществляется экстраполяция, также будет содержать случайную компоненту.
- 3. Тенденция характеризует движение среднего уровня ряда динамики, поэтому отдельные наблюдения могут от него отклоняться. Если такие отклонения наблюдались в прошлом, то они будут наблюдаться и в будущем.
Интервальные прогнозы строятся на основе точечных прогнозов. Доверительным интервалом называется такой интервал, относительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показателя. Ширина интервала зависит от качества модели, т. е. степени ее близости к фактическим данным, числа наблюдений, горизонта прогнозирования и выбранного пользователем уровня вероятности.
При построении доверительного интервала прогноза рассчитывается величина U (k), которая для линейной модели имеет следующий вид.
где р — число факторных переменных; k — период прогнозирования; tб — табличное значение t-статистики Стьюдента при заданном уровне значимости и числе наблюдений (значение tб можно получить с помощью встроенной функции Excel СТЬЮДРАСПОБР);
— стандартная ошибка (среднеквадратическое отклонение от модели).
Для других моделей величина U (k) рассчитывается аналогичным образом, но имеет более громоздкий вид. Как видно из формулы, величина U зависит прямо пропорционально от точности модели, коэффициента доверительной вероятности tб, степени углубления в будущее на k шагов вперед, т. е. на момент t = n + k, и обратно пропорциональна объему наблюдений. Доверительный интервал прогноза будет иметь следующий вид:
Если построенная модель адекватна, то с выбранной пользователем вероятностью можно утверждать, что при сохранении сложившихся закономерностей развития прогнозируемая величина попадает в интервал, образованный верхней и нижней границей.
После получения прогнозных оценок необходимо убедиться в их разумности и непротиворечивости оценкам, полученным иным способом.
Построим прогнозы на два шага вперед (k = 1 и k = 2):
1) точечный.
2) интервальный Рассчитаем стандартную ошибку:
Тогда значение U (k) для расчета доверительного интервала будет равно:
Данные расчета верхних и нижних границ доверительного интервала приведены в таблице.
n+k. | U (k). | Прогноз. | Верхняя граница. | Нижняя граница. |
17+1. | 6,3583. | 5042,62. | 5048,98. | 5036,26. |
17+2. | 6,3682. | 5147,703. | 5145,07. | 5141,33. |
График фактических данных, результатов расчета и прогнозирования Для построения графика прогнозирования воспользуемся инструментом Excel Мастер диаграмм.
Для этого необходимо:
- 1. Выделить диапазоны ячеек значений t, урожайности и оценки урожайности.
- 2. Запустить Мастер диаграмм, в диалоговом окне мастера выбрать тип диаграммы Точечный, на котором значения соединены отрезками.
Далее в мастере установить необходимые настройки и параметры. Желательно для исходных значений у задать параметр, который обозначает фактические значения урожайности.
3. В диалоговом окне Исходные данные на вкладке Ряд добавить ряды для значений точечного и интервального прогноза. Для этого выбрать кнопку Добавить, в поле Имя указать название ряда, в поле Значение Х диапазон прогноза, в поле Значение Y диапазон либо точного, либо интервального прогнозов.
В результате график прогноза выглядит следующим образом (рис. 7).
Рис. 7. Результаты моделирования и прогнозирования
Выбор наилучшего тренда для оценки временного ряда При анализе временных рядов широко используются графические методы, которые задают направление его дальнейшего анализа. В Excel для этого можно использовать средство Мастер диаграмм.
Для создания диаграммы необходимо выделить данные, которые будут отображены на диаграмме. Сюда следует включить как числовые данные, так и подписи к ним. Excel автоматически распознает подписи и использует их при построении диаграммы.
Работа мастера состоит из четырех основных шагов.
Шаг 1. Выбор типа и вида диаграммы. Во вкладке Стандартные можно увидеть основные типы диаграмм. Выбрав тип диаграммы, нажать кнопку Далее (рис. 8).
Рис. 8. Окно выбора типа диаграммы
Шаг 2. Выбор и уточнение ориентации диапазона данных и ряда.
Следующее диалоговое окно позволяет выполнить следующие действия:
выбрать (или изменить) диапазон данных листа. Если перед началом работы с мастером данные не были выделены, то, используя это поле, можно выбрать их сейчас;
уточнить ориентацию диапазона данных диаграммы с помощью переключателя Ряды в строках столбцах;
добавлять и удалять ряды;
присваивать рядам имена;
изменять подписи категорий и т. д.
Шаг 3. Настройка диаграммы. Это наиболее сложный этап работы мастера. В появившемся окне предлагается большое количество самых различных параметров диаграммы. Если параметры не изменяются, то используются установленные по умолчанию значения.
Шаг 4. Выбор месторасположения диаграммы. На этом шаге определяется месторасположение созданной диаграммы.
Построение линий тренда Для описания закономерностей в исследуемом временном ряду строятся линии тренда. В табл. приведены типы линий тренда, используемые в Excel.
Для добавления линии тренда в диаграмму необходимо выполнить следующие действия: excel автокорреляция точечный.
- 1) щелкнуть правой кнопкой мыши по ряду данных;
- 2) в динамическом меню выбрать команду Добавить линию тренда.
На экране появится окно Линия тренда;
- 3) выбрать вид зависимости регрессии. Если выбран тип Полиномиальная, то необходимо обязательно выбрать степень полинома. Если выбран тип Линейная фильтрация (данный тип не является регрессией, производится сглаживание данных методом скользящей средней), то в поле точки необходимо ввести число точек для расчета средней величины;
- 4) перейти на вкладку Параметры. В списке Название аппроксимирующей (сглаженной) кривой установить переключатель Автоматическое или Другое, после чего введите название кривой и оно появится в легенде диаграммы;
- 5) если линия тренда регрессия, то можно задать прогнозируемое количество периодов, которые будут добавлены к линии тренда;
- 6) в случае необходимости можно задать остальные параметры.
На один график корреляционного поля можно нанести несколько линий тренда и по параметру R2 (коэффициент детерминации) определить вид тренда для предложенного временного ряда.
Для нашего примера график для выбора наилучшей модели выглядит следующим образом (рис. 9).
Рис. 9. Выбор наилучшей модели
В качестве лучшего можно выбрать тренд полиномиальный шестого порядка.