Проверка качества спецификации модели. Качество спецификации модели Под качеством спецификации модели понимается: - качество выбора функции уравнения.

Презентация:



Advertisements
Похожие презентации
Лекция 8 Проверка статистических гипотез Качество спецификации модели.
Advertisements

АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Метод наименьших квадратов В математической статистике методы получения наилучшего приближения к исходным данным в виде аппроксимирующей функции получили.
Проверка гипотез на примере уравнения регрессии Проверка гипотез и соответствующие статистические выводы являются одними из центральных задач математической.
Метод наименьших квадратов УиА 15/2 Айтуар А.. В математической статистике методы получения наилучшего приближения к исходным данным в виде аппроксимирующей.
Парная линейная корреляция. Метод наименьших квадратов Задача: найти оценки параметров a и b такие, что остаток в i-ом наблюдении (отклонение наблюдаемого.
Эконометрика. Литература Доугерти К. Введение в эконометрику. - 3-е изд. - М.: ИНФРА- М, XIV, 465 с. Доугерти К. Введение в эконометрику. - 3-е.
Анализ Уравнения МРА Уравнение Y = *X 2 + …+ k *X k + u оценивается по МНК по выборке: (Y i, X 2i, …, X ki ), i = 1, …, n, и получается выборочное.
Лекция 3 - Проверка гипотез в одномерном статистическом анализе 3.1. Основные понятия, используемые при проверке гипотез 3.2. Общий алгоритм статистической.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Кандидат технических наук, доцент Поляков Константин Львович Учебный курс Эконометрика: идентификация, оценивание и анализ статических моделей Лекция 7.
1 МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ ПЛАТА ASVABC S 1 ПЛАТА = S + 3 ASVABC + u Геометрическая интерпретация множественной регрессионной модели с.
Лекция 2.1 Линейная регрессионная модель для случая одной объясняющей переменной. Метод наименьших квадратов (МНК)
КЛАССИЧЕСКИЙ РЕГРЕССИОННЫЙ АНАЛИЗ. ОБЩАЯ ЛИНЕЙНАЯ МОДЕЛЬ.
Определение. Случайная величина имеет нормальное распределение вероятностей с параметрами и 2, если ее плотность распределения задается формулой:
Лекция 2 Часть I: Многомерное нормальное распределение, его свойства; условные распределения Часть II: Парная линейная регрессия, основные положения.
Свойства коэффициентов регрессии и проверка гипотез.
Общая теория статистики Регрессионно- корреляционный анализ.
«Линейная регрессия и корреляция: смысл и оценка параметров»
P4P4 X X1X1 X2X2 X3X3 X4X4 Разница между действительным и оцененным значением Y называется остатком. P3P3 P2P2 P1P1 R1R1 R2R2 R3R3 R4R4 ( остаток ) e1e1.
Транксрипт:

Проверка качества спецификации модели

Качество спецификации модели Под качеством спецификации модели понимается: - качество выбора функции уравнения регрессии; - качество выбора набора регрессоров (факторов) Пусть имеем модель в виде уравнения парной регрессии: Y t = a 0 + a 1 x t + u t (11.1) Y t = a 0 + a 1 x t + u t (11.1) Задача: оценить степень влияния экзогенной переменной Х (фактора) на величину эндогенной переменной Y. Другими словами: насколько правильно предположение, что поведение эндогенной переменной зависит от значения фактора Х.

Качество спецификации модели В качестве меры влияния принимаются дисперсии переменных Y, X и u. Знаем, что уравнение регрессии описывает поведение среднего значения эндогенной переменной: Y* = a 0 + a 1 x t (11.2) Y* = a 0 + a 1 x t (11.2) Тогда уравнение (11.1) можно записать как: Y t = Y* t +u t (11.3) Y t = Y* t +u t (11.3)

Качество спецификации модели Вычислим дисперсию Y в уравнении (11.3) Вычислим COV(Y t *,u t ): Таким образом, (11.4)

Качество спецификации модели Введем обозначения: Здесь: TSS – общая сумма квадратов эндогенной переменной (Total sum of squares ) RSS – регрессионная сумма квадратов (Regression sum of squares ESS – сумма квадратов остатков (ошибок) (Error sum of squares

Качество спецификации модели С учетом принятых обозначений выражение (11.4) можно записать в виде: TSS = RSS + ESS(11.4) В качестве показателя степени влияния выбранного регрессора на поведение эндогенной переменной принимается отношение: (11.5) R 2 – называется коэффициентом детерминации

Качество спецификации модели Замечание. Коэффициент детерминации R 2 имеет смысл (определен) только для моделей, в спецификации которой присутствует коэффициент a 0. Если коэффициент a 0 отсутствует, то нарушается равенство (11.4). Поясним это графически. Y=0.786x Y=2+0.5x TSS=RSS=2.625 ESS=0 TSS=2.625 RSS=237.7 ESS=8.57 TSSRSS+ESS

Качество спецификации модели Если R 2 =1, т.е. RSS=TSS, a ESS=0, то такая модель называется «абсолютно хорошей». Это означает, что выбранный регрессор полностью объясняет поведение эндогенной переменной. Если R 2 =0, т.е. RSS=0, а ESS=TSS, то такую модель называют «абсолютно плохой». В этом случае весь диапазон изменения эндогенной переменной объясняется влиянием случайного возмущения, а выбранный регрессор не оказывает влияния, не объясняет поведение эндогенной переменной.

Качество спецификации модели Отметим следующее: R 2 – величина случайная, т.к. его конкретное значение вычисляется по результатам случайной выборки Это означает, что полученное значение коэффициента детерминации отличное от нуля еще не является достаточным основанием считать модель качественной. Необходимо проверить статистическую гипотезу о равенстве нулю R 2 : (H 0 : R 2 =0). Внимание! Формулируется гипотеза о равенстве нулю R 2, т.е гипотеза о том, что модель плохая.

Качество спецификации модели Для проверки гипотезы H 0 : R 2 =0 : 1. Формируем случайную величину с известным законом распределения (11.6) где: к - количество регрессоров в модели n – количество наблюдений в выборке Случайная величина F Test подчиняется закону распределения вероятностей Фишера. Критическое значение зависит от уровня доверительной вероятности и двух параметров: k и (n-k-1).

Качество спецификации модели Для проверки гипотезы H0: R 2 =0 : 2. Вычисляется по данным выборки значение F Test. 3. Находится по таблице значение F кр (P дов, k, n-k-1). 4. Сравниваются значения Fкр и F Tes t. ЕслиF Test F круто гипотеза H 0 : R 2 =0 не отвергается Значит модель имеет плохое качество спецификации. Т.е. выбранный регрессор не объясняет поведение эндогенной переменной. Замечание. Значения R 2 и F Test вычисляются функцией «ЛИНЕЙН» в EXCEL. (11.7)

Качество спецификации модели YtYt XtXt t 8,80,3612,5 9,40,2111,4 10,00,0810,4 10,60,2011,3 11,00,1010,5 11,90,1210,7 12,70,4112,9 13,50,5013,6 14,30,4313,1 15,50,5914,3 16,70,9016,6 18,60,8216,0 19,71,0417,7 21,11,5321,4 22,81,9424,6 23,91,7523,1 25,21,9924,9 26,02,0325,3 26,82,4028,1 Пример. Зависимость сбережений граждан (Y) от размера располагаемого дохода в Великобритании 7, , , , , , , ,60239,86224 R2R2 F Test Результат «ЛИНЕЙН» Fкр=F(0.95,1,17)=4.4 F Test > F кр Вывод: Спецификация модели качественная Диаграмма рассеяния и график модели

Качество спецификации модели Замечание. Значения коэффициента детерминации растет с увеличение числа регрессоров. В случае модели в виде уравнения множественной регрессии применяется модифицированный коэффициент детерминации Ř 2 : (11.8) Здесь: R 2 - коэффициент детерминации в форме (11.5) n – объем выборки k – количество регрессоров в модели

Качество спецификации модели Замечание. При анализе модели в виде уравнения множественной регрессии принятие гипотезы H 0 : R 2 =0 означает, что все регрессоры не объясняют (не влияют) поведение эндогенной переменной. Отклонение гипотезы H 0 : R 2 =0, означает, что не все регрессоры объясняют (влияют) поведение эндогенной переменной. Другими словами, в составе выбранных на этапе спецификации модели регрессоров есть как влияющие, так и не влияющие регрессоры. Вопрос. Как определить влияющие и не влияющие регрессоры? Ответ. Необходимо проверить гипотезу H 0 : a i =0

Качество спецификации модели Проверка статистической гипотезы H 0 : a i =0 Известно, что в схеме Гаусса-Маркова дробь (11.9) подчиняется закону распределения Стьюдента (11.9) где: ã i – оценка i-го параметра модели с – заданная константа σ ai -оценка стандартной ошибки оценки параметра В данном случае с=0, т.е. сравнивается вычисленное значение оценки с нулем. Если гипотеза не отвергается для i-го регрессора, то этот регрессор не оказывает влияние на эндогенную переменную и его можно исключить из уравнения модели.

Качество спецификации модели п/пYtYt XtXt PtPt YtYt XtXt PtPt 1 171,31095,499, ,4779,2100, ,51058,396, ,0751,699, ,81049,394, ,4722,5100, ,81021,693, ,5701,3100, ,81015,593, ,3646,8102, ,5988,894, ,6616,3104, ,3942,994, ,4580,8104, ,9906,893, ,0542,3104,8 9 89,1873,5102, ,7524,9105, ,3875,893, ,0503,8105, ,2865,399, ,0489,7104, ,2858,495, ,9479,7104, ,5810,3100,0 -1,2740, ,59 0,7870,017290,161 0,94598,6976#N/A 192,4222#N/A ,3#N/A Расходы на жилье (Y) от располагаемого дохода (Х) и цен на жилье (Р) Модель 1: Y=a 0 +a 1 x+a 2 p+u -7,2823,9 0,884,0 0,818,0 72,023, ,4 7452,8 t i = t i = Модель 2: Y=a 0 +bp+v Выводы: регрессор x 2 не значим, его можно убрать модель 2 качественно объясняет поведение Y