ЭКОНОМЕТРИКА. Методы и модели анализа временных рядов. Прогнозирование экономических процессов с использованием временных рядов.

Презентация:



Advertisements
Похожие презентации
Лекция 10 Временные ряды в эконометрических исследованиях.
Advertisements

Временные ряды в эконометрических исследованиях..
Лекция 8 Временные ряды в эконометрических исследованиях.
Теория прогнозирования включает: анализ объекта прогнозирования методы прогнозирования: 1. мaтематические(формализованные) -симплексные(простые) -статистические.
СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ НТБ.
В задачу регрессионного анализа входит исследование остаточных величин. Исследование остаточных величин.
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Лекция 1 «Введение». Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов. Специфической.
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Анализ индекса Доу-Джонса Выполнила Мартынова И.В. Санкт-Петербургский Государственный Университет Факультет Прикладной Математики – Процессов Управления.
Изучение рядов динамики Классификация Правила построения Показатели динамики.
Кандидат технических наук, доцент Грекул Владимир Иванович Учебный курс Теория информационных систем Лекция 5.
Регрессионный анализ. Основная особенность регрессионного анализа: при его помощи можно получить конкретные сведения о том, какую форму и характер имеет.
Свойства коэффициентов регрессии и проверка гипотез.
«Линейная регрессия и корреляция: смысл и оценка параметров»
Определение. Случайная величина имеет нормальное распределение вероятностей с параметрами и 2, если ее плотность распределения задается формулой:
Вычислительный аспект задач построения трендов Выполнил: Большаков М.А. Дипломный руководитель: Вьюненко Л.Ф.
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
Лекция 2 Часть I: Многомерное нормальное распределение, его свойства; условные распределения Часть II: Парная линейная регрессия, основные положения.
Транксрипт:

ЭКОНОМЕТРИКА. Методы и модели анализа временных рядов. Прогнозирование экономических процессов с использованием временных рядов

2 Рекомендуемая литература

3 Эконометрика: Учебник / Под ред. И.И. Елисеевой – М.: Финансы и статистика, Практикум по эконометрике: Учеб. пособие / Под ред. И.И.Елисеевой – М.: Финансы и статистика, 2001.

Вопросы Структура временных рядов экономических показателей. Требования, предъявляемые к исходной информации. Основные этапы построения моделей экономического прогнозирования. Выявление и устранение аномальных наблюдений во временных. Предварительный анализ временных рядов. Проверка наличия тренда. Предварительный анализ временных рядов. Сглаживание временных рядов. Предварительный анализ временных рядов. Вычисление количественных характеристик развития экономических процессов. Построение моделей кривых роста. Оценка параметров кривых роста с помощью метода наименьших квадратов (МНК). Временной ряд, тренд, трендовая модель. Получение трендовой модели средствами Excel. Оценка качества моделей прогнозирования. Проверка адекватности и оценка точности. Оценка адекватности модели кривой роста. Оценка точности модели кривой роста, выбор наилучшей кривой роста. Прогнозирование на основе кривой роста.

Моделирование продаж объёма пива в РФ

Русский крест - динамика общих коэффициентов рождаемости и смертности (на 1000 человек населения)

Структура и особенности временных рядов экономических показателей Структура и особенности временных рядов экономических показателей Динамика финансово-экономических показателей обычно отражается динамическими и временными рядами. Динамические ряды Динамические ряды – упорядоченная совокупность последовательных наблюдений одного показателя y в зависимости от последовательно возрастающих или убывающих значений другого показателя x. Временные ряды Временные ряды – динамические ряды, у которых в качестве признака упорядочения выбрано время t. Формы представления временных рядов : – Векторная Y(t), t = 1, 2, …, N – фактор времени, – Табличная => t12…N ytyt y1y1 y2y2 …ynyn

– Графическая форма представления ВР

Всякий временной ряд состоит из отдельных уровней. Уровни ряда - отдельные значения временного ряда, характеризующие изменение показателя во времени. Уровни ряда могут измеряться в различных величинах: – абсолютных ( размер прибыли, издержек, … ); – относительных ( объем производства с/х продукции на душу населения ); – среднеих за некоторый период времени ( среднеесуточная выработка продукции,… ); – индексных ( индексы роста накопленного дохода,… ). Уровни временного ряда могут принимать: детерминированные значения – не представляют интереса ( например, число дней в месяце ); случайные значения – подвергаются научному анализу, при этом они могу быть: дискретными и непрерывными. Длина временного ряда определяется количеством наблюдений n.

Среди временных рядов выделяют два вида : моментные ВР – последовательные наблюдения характеризуют показатель на некоторый момент времени 0 t1 t2 t3 … t интервальные ВР – показатель характеризуется за определенный период времени. 0 t1 t2 t3... t Структура временных рядов Изучение структуры ВР строится на основе компонентного анализа - разложения исходного ряда на составляющие компоненты: f t – тренд (систематическая) составляющая или тенденция; c t – циклическая составляющая – нестрого периодические циклические колебания, которые совершаются в течение ряда лет и вызваны политическими, военными, экономическими причинами; s t – сезонная составляющая – строго периодические циклические колебания, которые совершаются в течение года и вызваны природно-климатическими условиями; ε t – случайная составляющая ( несистематическая) – все то, что осталось от ВР после выделения из него f t,c t,s t.

Экономические процессы могут быть представлены в виде различных моделей : одной из названных составляющих компонент: y t = f t, s t … ; аддитивной модели (сумма составляющих компонент): y t = f t + c t + s t + ε t ; мультипликативной модели (произведение составляющих компонент): y t = f t · c t · s t · ε t ; Если все компоненты в ряду выявлены верно, то ε t должна : подчиняться нормальному закону распределения; представляться случайными числами; быть независима от остатков других уровней ряда; математическое ожидание М ( ε t ) 0.

Этапы построения прогнозов экономических показателей, представленных временными рядами Предварительный анализ временных рядов. Построение моделей. Оценка качества моделей. Выбор лучшей модели. Получение прогноза.

Предварительный анализ временных рядов 1. Выявление аномальных наблюдений Метод Ирвина. 2. Сглаживание временных рядов. Метод простой скользящей среднеей. Метод взвешенной скользящей среднеей. Метод экспоненциально го сглаживания. 3. Проверка наличия тренда. Метод проверки разностей среднеих уровней. Метод Фостера- Стьюарта. 4. Вычисление количественных характеристик развития экономических процессов.

Проверка требований, предъявляемых к исходной информации и ее анализ На этапе предварительного анализа уровни ВР должны проверяться: на сопоставимость; на однородность; на устойчивость; на полноту (представительность, репрезентативность) данных.

Сопоставимость Сопоставимость означает, что урони ряда должны отвечать ряду требований: 1) выражаться в одних и тех же единицах измерения; 2) иметь одинаковый шаг наблюдения; 3) рассчитываться по одной и той же методике; 4) охватывать одни и те же единицы совокупности; 5) соответствовать одинаковым интервалам или моментам времени. Несопоставимость чаще всего проявляется в стоимостных показателях. Полнота данных означает достаточное число наблюдений для выполнения прогноза, из условий обнаружения закономерностей.

Однородност ь предполагает отсутствие нетипичных и аномальных наблюдений и изломов тенденций. Однородност ь предполагает отсутствие нетипичных и аномальных наблюдений и изломов тенденций. Устойчивость характеризует преобладание закономерности над случайностью в изменении уровней ряда. Преобладание случайности Преобладание закономерности Преобладание случайности Преобладание закономерности На данном этапе строятся графики динамики и подвергаются визуальному анализу. визуальному анализу.

Расчет динамических характеристик ВР включает в себя: Расчет абсолютных приростов: – цепныхy цепн = y t - y t-1, – базисныхy базисн = y t - y 1, – среднеих САП = (y n - y 1 ) / (n-1), где y 1, y t, y t-1, y n – первый, текущий, предшествующий и последний уровни ВР, соответственно. САП может использоваться для прогнозирования : y n+k = y n + k · САП y n+k = y n + k · САП, где k – шаг прогнозирования. Недостаток САП – нельзя опираться только на последнее наблюдение, поскольку оно имеет случайное значение, поэтому низкое качество прогноза, нельзя построить доверительный интервал прогноза.

Расчет темпов роста: – Цепных Т цепн = y t / y t-1, – Базисных Т базисн = y t / y 1, – Средних Т средне =. Выявление автокорреляции. Автокорреляция отражает взаимосвязь между уровнями временного ряда и она характеризуется коэффициентом автокорреляции: r l =, где l – количество шагов на которое сдвигаются уровни ряда. Если 0,7 < |r l | < 1,0, то имеет смысл выполнять прогноз на l шагов вперед.

Коррелограмма автокорреляционной функции ВВП

Выявление аномальных наблюдений включает: 1. Определение аномальных наблюдений (по критерию Ирвина) : для каждого наблюдения начиная со второго, рассчитывается: λ t = | y t - y t-1 | / σ y, где σ y = - среднеее квадратическое отклонение ; - среднеее арифметическое значение показателя y t. рассчитанные значения λ t сравниваются с табличным λ t табл, и если выполняется неравенство λ t > λ t табл, то наблюдение аномально. Табличные значения λ t => Число наблюдений, n Вероятность, p 0,950,99 101,52,0 201,31,8

Предварительный анализ данных. Влияние аномальных наблюдений на результаты моделирования

Установление причин возникновения аномальных наблюдений АН могут быть вызваны двумя причинами: –техническими - из-за ошибок в измерении и передаче информации, их называют ошибками первого рода ( они подлежат устранению); –объективными – из-за ошибок, возникающих в результате воздействия на данный процесс редко проявляющихся объективных факторов, называют ошибками второго рода (устранению не подлежат). Устранение АН производится путем их замены среднеей арифметической соседних уровней ряда: y t = (y t – 1 + y t + 1 ) / 2, или экспоненциальной скользящей среднеей.

Пример. Проверить ВР на наличие АН. Здесь y t = 240, y t ср =24, (y t -y t ср ) 2 = 574, σ y 8, λ t табл = 1,5. Для 6- го наблюдения λ t > λ t табл, поэтому с вероятностью p=0,95% можно предположить, что оно аномально. Поскольку его природа неизвестна, то АН относится к ошиб- кам второго рода и его заменяем на среднеее арифметическое соседних уровней y 6 = (y 5 + y 7 ) / 2 = (17+34)/2 = 25,5. t ytyt , y t -y t ср (y t -y t ср ) λ tλ t -0,750,251,380,631,630,50,880,251,38 30

Сглаживание ВР Сглаживание ВР позволяет более четко выявить тренд и подготовить ряд для построения модели прогнозирования. Сглаживание может выполняться различными методами: – Простой скользящей среднеей; – Взвешенной скользящей среднеей; – Экспоненциального сглаживания. Метод простой скользящей среднеей: 1)Выбирается интервал сглаживания m = 3,5,7,9. Если необходимо сгладить мелкие колебания, то m выбирается по возможности большим, и m уменьшается, если необходимо сохранить мелкие волны.

2) Рассчитывается параметр : p=(m-1)/2. 3) Вычисляется среднеее арифметическое значение уровней в интервале сглаживания:. 4) Интервал сглаживания смещается на один уровень ряда и вновь рассчитывается среднеее арифметическое. Вычисления продолжаются до последнего уровня. Недостаток метода – первые и последние p уровней остаются не сглаженными. Метод взвешенной скользящей среднеей Сглаживание производится по уравнению полинома ŷ с учетом весовых коэффициентов (для m=5).

Особенности весовых коэффициентов: - симметричны относительно центрального члена; - сумма весов с учетом общего члена равна 1,0. Метод экспоненциального сглаживания Для выравнивания используются значения предыдущих уровней взятых с определенным весом 0 < α <1,0. Расчетная формула: ŷ. Пример. Произвести сглаживание уровней известного временного ряда различными методами. t ytyt , y t сгл пр -- 17,619,722,323,125,729,5 -- y t сгл взв --19,7 15,6 16,226,530,928,1-- y t сгл эксп -----α =0,7-25,632,7

Выявление тренда Тренд – долговременная устойчивая тенденция изменения показателя во времени. Различают 3 вида:,,. возрастающий убывающий боковой Для выявления тренда используются: –Знаковый критерий Кокса и Стьюарта; –метод Фостера-Стьюарта; –метод проверки разностей среднеих уровней: –метод автокорреляционных функций и другие.

Метод обнаружения тренда - сравнение среднеих уровней ряда. Временной ряд разбивают на две примерно равные по числу уровней части, каждая из которых рассматривается как некоторая самостоятельная выборочная совокупность, имеющая нормальное распределение. Если временной ряд имеет тенденцию к тренду, то среднеие, вычисленные для каждой совокупности, должны существенно (значимо) различаться между собой. Если же расхождение незначительно, несущественно (случайно), то временной ряд не имеет тенденции. Таким образом, проверка наличия тренда в исследуемом ряду сводится к проверке гипотезы о равенстве среднеих двух нормально распределенных совокупностей.

Метод обнаружения тренда - сравнение среднеих уровней ряда.

Построение моделей временных рядов. Формирование уровней ряда определяется закономерностями трех основных типов: инерцией тенденции, инерцией взаимосвязи между после­ довательными уровнями ряда и инерцией взаимосвязи между исследуемым показателем и показателями- факторами, оказывающими на него причин­ное воздействие. Соответственно различают задачи анализа и моделирования тенденций, взаимосвязи между последовательными уровнями ряда; причинных взаимодействий между исследуемым показателем и показателями - факторами. Первая из них решается с помощью моделей кривых роста, вторая - с помощью адаптивных методов и моделей, а третья с помощью регрессионных моделей.

Модели кривых роста Плавную кривую (гладкую функцию), аппроксимирующую временной ряд принято называть кривой роста. Аналитические методы выделения (оценки) неслучайной составляющей временного ряда с помощью кривых роста реализуются в рамках моделей регрессии, в которых в роли зависимой переменной выступает переменная y t, а в роли единственной объясняющей переменной время t.

Виды аппроксимирующих функций В качестве кривых роста для описания тренда могут выбираться различные функции: – Полиномиальные (полином q –й степени) y t =a 0 +a 1 t+a 2 t 2 +…+a q t q ; – Экспоненциальные y t =a 0 ·e a1t – простая экспонента, y t =a 0 +a 1 ·e a2t – модифицированная; – S –образные t y t =a 0 · a 1 a2 – Гомперца, y t = a 0 /(1+a 1 ·e – a2t ) – логистическая.

Расчет параметров модели МНК Параметры большинства "кривых роста", как правило, оцениваются по методу наименьших квадратов, т.е. подбираются таким образом, чтобы график функции "кривой роста" располагался на минимальном удалении от точек исходных данных. Согласно методу наименьших квадратов при оценке параметров модели всем наблюдениям присваиваются равные веса, т.е. их информационная ценность признается равной, а тенденция развития на всем участке наблюдений – неизменной.

Построим график у = f(t) t y ytyt ypyp εtεt Y p =a 0 +a 1 t ε t =y t -y p или ε 2 t = (y t - y p ) 2

Далее минимизируется сумма квадратов отклонений ε t 2, для чего вычисляются частные производные по a 1, a 0 и приравниваются нулю. В результате решения системы уравнений получаем: ;. Вычисленные значения параметров модели подставляются в уравнение модели: y p =a 0 +a 1 t,

Оценка качества модели Проверка адекватности 1. Проверка независимости (отсутствие автокорреляции). 2. Проверка случайности. 3. Соответствие ряда остатков нормальному закону распределения. 4. Равенство нулю среднеей ошибки. Оценка точности модели Среднеквадратическое отклонение. Минимальная по абсолютной величине ошибка. Средняя относительная ошибка аппроксимации.

Оценка качества модели прогнозирования Модель считается хорошей со статистической точки зрения, если она адекватна и достаточно точна. Качество оценивается на основе исследования остаточной компоненты ε t по критериям адекватности : –Критерий поворотных точек или p - критерий (свойство случайности); –R/S – критерий (нормальность распределения); –Критерий Дарбина-Уотсона или d – критерий (свойство независимости остатков); –Равенство математического ожидания нулю M(ε t )= 0. и критериям точности : Среднее квадратическое отклонение S; Средняя относительная ошибка аппроксимации ε отн.

1) Проверка равенства математического ожидания нулю ( Равенство нулю среднеей ошибки). Если случайная компонента имеет нормальное распределение, то проверка выполняется по t- критерию Стьюдента где – среднее арифметическое значение ε t, S ε – стандартное (среднееквадратическое) отклонение значений ε t. Если рассчитанное значение t- критерия Стьюдента меньше его табличного значения с уровнем значимости α и числом степеней свободы (n-1), то H 0 нулевая гипотеза о равенстве нулю математического ожидания принимается.

2) Проверка условия случайности возникновения отдельных отклонений от тренда Для проверки случайности уровней ряда могут быть использованы критерий серий и критерий поворотных точек. Критерий «пиков», или критерий поворотных точек. Значение случайной переменной считается поворотной точкой, если оно одновременно больше (меньше) соседних с ним элементов. Если остатки случайны, то поворотная точка приходится примерно на каждые 1,5 наблюдения. Если их больше, то возмущения быстро колеблются и это не может быть объяснено только случайностью. Если же их меньше, то последовательные значения случайного компонента положительно коррелированны.

Проверка случайности. Критерий поворотных точек (p – критерий) Данный критерий служит для проверки свойства случайности колебаний остаточной компоненты относительно тренда. Значение ε t считается поворотной точкой если выполняется одно из условий: ε t-1 ε t+1 или ε t-1 > ε t < ε t+1. Свойство случайности с уровнем значимости 0,05 выполняется, если фактическое количество поворотных точек p больше расчетного:

3) Проверка независимости (отсутствие автокорреляции) Критерий Дарбина-Уотсона или d – критерий (свойство независимости остатков т.е. отсутствие автокорреляции ) :, где ε i = y i факт – y i расч. Критерий d –распределен в интервале 0 … 4. Если d 2. Если 0 < d < d 1, то остатки содержат автокорреляцию. Если d 1 < d < d 2, то имеется неопределенность и тогда рассчитывается первый коэффициент автокорреляции по формуле:

Проверка независимости (отсутствие автокорреляции )

Рассчитанное значение r (1) сопоставляется с r (1) табл табличным, и если r (1) < r (1) табл, то автокорреляция отсутствует, в противном случае присутствует ( r(1) табл =0,36 ). Если d 2 < d < 2,то ряд остатков не коррелирован. d > 2d Если d > 2, то d - критерий пересчитывается по формуле: d = 4 – d и дальнейшие выводы делают по d. * * * * * 0 d 1 d d Для n = 15 значения d 1 = 1,08 и d 2 =1,36 (при уровне значимости 0,05). Проверка независимости (отсутствие автокорреляции)

4) Соответствие ряда остатков нормальному закону распределения R/S – критерий (нормальность распределения ε t ) Критерий рассчитывается как отношение размаха вариации случайной величины R = ε t max - ε t min к стандартному отклонению S ε =. Если фактическое численное значение R/S-критерия попадает в диапазон табличных значений: для n = 10 => R/S = 2,670…3,685; для n = 20 => R/S = 3,180…4,490; для n = 30 => R/S = 3,470…4,890, при уровне значимости =0,05, то H 0 нулевая гипотеза о ненормальном распределении ε t отвергается и принимается альтернативная гипотеза H 1 о нормальном распределении случайной компоненты.

Критерии точности модели В качестве статистических показателей точности модели применяются: среднеее квадратическое отклонение S ε =, где n – количество уровней ряда, k - число факторов в модели. Чем меньше значение S ε тем выше точность модели; среднеяя относительная ошибка аппроксимации ε отн =, %. Если ε отн < 5%, то точность модели считается удовлетворительной, при ε отн > 10% - низкой. Точность модели можно оценивать и по коэффициенту детерминации R 2

Выбор лучшей модели производится по критериям адекватности и точности. Лучшей считается та модель, которая имеет лучшие показатели качества. Получение точечного и интервального прогноза Получение точечного и интервального прогноза Точечный прогноз получают путем подстановки в модель значений фактора времени на прогнозируемом шаге ŷ n+k = a 0 + a 1 · (n+k), где n + k = t. Поскольку вероятность точечного прогноза близка к нулю, то рассчитывается интервальный прогноз ŷ n+k [ŷ n+k ± u k ], где u k = S· t α ·..

Строим прогнозные значения показателя y t Прошлое Будущее Настоящее t y Y p =a 0 +a 1 t Точечный прогноз Интервальный прогноз