ПРАКТИКУМ ПО ПРИКЛАДНЫМ ЭКОНОМИЧЕСКИМ ИССЛЕДОВАНИЯМ Часть 2 ЛЕКЦИЯ 2 ТЕСТИРОВАНИЕ РЕГРЕССИОННЫХ ОСТАТКОВ НА НАЛИЧИЕ ВЫБРОСОВ, НОРМАЛЬНОСТЬ, ГОМОСКЕДАСТИЧНОСТЬ Демидова О.А., Каф. Математической экономики и эконометрики, доцент Лаборатория «Эмпирический анализ предприятий и рынков», заведующий
Тестирование регрессионных остатков на гомоскедастичность
Гетероскедастичность 1 X Y = X Y 2 Одно из условий теоремы Гаусса – Маркова состоит в том, что возмущения u имеют нулевое математическое ожидание и одинаковую дисперсию. X3X3 X5X5 X4X4 X1X1 X2X2
Гетероскедастичность 1 X Y = X Y 3 Было сделано также дополнительное предположение о нормальном законе распределения возмущений. X3X3 X5X5 X4X4 X1X1 X2X2
Гетероскедастичность 1 X Y = X Y 4 Свойство одинаковой дисперсии возмущений называется гомоскедастичностью. X3X3 X5X5 X4X4 X1X1 X2X2
Гетероскедастичность 1 X Y = X Y 5 Линия теоретической регрессии Y = X, которую мы не можем провести и проверить, одинаково ли распределены возмущения. X3X3 X5X5 X4X4 X1X1 X2X2
6 Гетероскедастичность Если дисперсии возмущений различны, то это явление называется гетероскедастичностью. X3X3 X5X5 X4X4 X1X1 X2X2 1 X Y = X Y
7 Гетероскедастичность Наличие гетероскедастичности можно заподозрить, если отклонение наблюдений от линии выборочной регрессии (остатки) достаточно сильно различаются. X3X3 X5X5 X4X4 X1X1 X2X2 1 X Y = X Y
8 Гетероскедастичность Однако ответ на вопрос, имеет ли место гетероскедастичность, можно получить только с помощью тестов. X3X3 X5X5 X4X4 X1X1 X2X2 1 X Y = X Y
9 Последствия гетероскедастичности Если предположение об одинаковых дисперсиях возмущений не выполняется, то стандартные ошибки коэффициентов регрессии вычисляются по неверным формулам t – тесты для проверки гипотез о конкретных значениях коэффициентов не дают правильных результатов F – тесты для проверки гипотез о линейных ограничениях на коэффициенты регрессии не дают правильных результатов Оценки МНК коэффициентов регрессии больше не являются BEST, теряется эффективность оценок.
Данные для 30 стран в Пример
Взглянув на этот рисунок, можно сделать предположение, что с ростом ВВП дисперсия возмущений увеличивается. 11 Пример
Сравним Южную Корею и Мексику с приблизительно одинаковым уровнем ВВП. 12 Пример South Korea Mexico
Другая пара для сравнения – Сингапур и Греция, также с почти одинаковым уровнем ВВП. Очевидно, что для первой пары с большим ВВП и разница больше. Можно предположить наличие гетероскедастичности. 13 Пример Singapore Greece
1 Тест Голдфелда – Квандта Гетероскедастичность – различие дисперсий возмущений для различных наблюдений. Ясно, что видов гетероскедастичности может быть сколь угодно много. X3X3 X5X5 X4X4 X1X1 X2X2 1 X Y = X Y
X3X3 X5X5 X4X4 X1X1 X2X2 1 X Y 2 Однако одним из самых распространенных видов гетероскедастичности является пропорциональность стандартного отклонения возмущений одной из объясняющих переменных. Тест Голдфелда – Квандта
X3X3 X5X5 X4X4 X1X1 X2X2 1 X Y = X Y 3 Этот тип гетероскедастичности иллюстрируется на приведенной диаграмме. Дисперсия возмущений пропорциональна переменной Х. Тест Голдфелда – Квандта
4 Основная и альтернативная гипотезы в тесте Голфелда – Квандта (и во всех остальных тестах, в которых проверяется, имеет ли место гетероскедастичность) формулируются следующим образом: H 0 : гомоскедастичность H 1 : гетероскедастичность Однако сам тест зависит от того, какой вид гетероскедастичности мы предполагаем в альтернативной гипотезе. Тест Голдфелда – Квандта
4 H0:H1:H0:H1:
5 Для проведения теста Голдфелда – Квандта все наблюдения делятся на 3 части. Если выборка небольшая, то выделяют приблизительно 3/8 части всех наблюдений для первой и третьей части и приблизительно 1/4 в середине. Тест Голдфелда – Квандта
6 Для 28 стран оценивается зависимость выпуска продукции обрабатывающей промышленности от ВВП. Выделено 11 стран с маленьким ВВП, 6 со средним и 11 с большим. Пример проведения теста Голдфелда – Квандта
7 Отдельно оцениваются регрессии для 11 стран с маленьким ВВП и для 11 стран с большим ВВП. Пример проведения теста Голдфелда – Квандта
8 Для каждой регрессии находятся суммы квадратов остатков RSS 1 и RSS 2. RSS 2 = 13,518,000,000 RSS 1 = 157,000,000 Пример проведения теста Голдфелда – Квандта
9 Если имеет место гомоскедастичность, RSS 1 и RSS 2 не должны сильно различаться (если число наблюдений в оцениваемых регрессиях совпадает). RSS 2 = 13,518,000,000 RSS 1 = 157,000,000 Пример проведения теста Голдфелда – Квандта
10 Однако в рассматриваемом примере RSS 2 значительно превышает RSS 1. RSS 2 = 13,518,000,000 RSS 1 = 157,000,000 Пример проведения теста Голдфелда – Квандта
11 Тестовая статистика F рассчитывается по приведенной выше формуле. В числителе – оценка дисперсии возмущений по последним n 2 наблюдениям, а в знаменателе - оценка дисперсии возмущений по первым n 1 наблюдениям. K – число параметров в модели. RSS 2 = 13,518,000,000 RSS 1 = 157,000,000 Тестовая статистика в тесте Голдфелда - Квандта
12 Тестовая F – статистика превышает критическое значение даже при уровне значимости 0.1%. Нулевая гипотеза о гомоскедастичности отвергается. RSS 2 = 13,518,000,000 RSS 1 = 157,000,000 Тестовая статистика в тесте Голдфелда - Квандта
13 Оценивается регрессия по всем наблюдениям. Полезно взглянуть на график остатков. Может появиться предположение, что дисперсия возмущений увеличивается с ростом некоторой переменной. Упорядочиваем все наблюдения по модулю подозрительной переменной. Делим все наблюдения на три группы (если наблюдений достаточно много, то приблизительно на трети). Удобно, если в первой и третьей группах количество наблюдений одинаково. Наблюдениями средней группы пренебрегаем, а по первым n 1 и последним n 2 наблюдениям оцениваем отдельные регрессии. Используя суммы квадратов остатков (RSS) в оцененных регрессиях, рассчитываем тестовую статистику по формуле Сравниваем полученное значение F – статистики с критическим (при выбранном уровне значимости). Если значение F – статистики превышает критическое, нулевая гипотеза о гомоскедастичности отвергается. Формальное описание теста Голфелда - Квандта
Тест Глейзера 2 Дисперсия возмущений не обязательно пропорциональна какому- либо фактору, может быть и другой вид зависимости, для определения которой используется тест Глейзера.
3 H0:H1:H0:H1: Тест Глейзера
4 Оценивается регрессия по всем наблюдениям. Сохраняются остатки регрессии e i. Оцениваются регрессии Если коэффициент β значим хотя бы в одной из трех регрессий (значимость коэффициента проверяется как обычно с помощью t – статистики), то имеет место гетероскедастичность (соответствующего вида). Формальное описание теста Глейзера
Тест Уайта 1 Содержательный смысл теста Уайта состоит в следующем: если в модели дисперсия возмущений каким-то, возможно, достаточно сложным образом зависит от регрессоров, то это должно каким-то образом отражаться в остатках обычной регрессии исходной модели.
Тест Уайта 2 H 0 : гомоскедастичность H 1 : гетероскедастичность Вид гетероскедастичности не конкретизируется.
3 Оценивается регрессия по всем наблюдениям. Сохраняются остатки регрессии e i. Оцениваются регрессия квадратов остатков на все регрессоры, их квадраты, попарные произведения и константу. В последней оцененной регрессии находим коэффициент множественной детерминации R 2 Вычисляем тестовую статистику по формуле nR 2. Тестовая статистика имеет распределение «хи – квадрат» с k-1 степенями свободы, где k – число оцениваемых коэффициентов. Сравниваем полученное значение тестовой статистики с критическим при выбранном уровне значимости. Если значение тестовой статистики превышает критическое, то нулевая гипотеза о гомоскедастичности отвергается. Формальное описание теста Уайта
Тест Уайта 4 Привлекательной чертой теста Уайта является его универсальность. Однако этот тест не является конструктивным. Если гетероскедастичность выявлена, то тест Уайта не дает указания на функциональную форму гетероскедастичности. Единственным способом коррекции является применение стандартных ошибок в форме Уайта.
1 H 0 : H 1 : Вид функции f может быть любой. Тест Бройша - Пагана
2 Оценивается регрессия по всем наблюдениям. Сохраняются остатки регрессии e i, i = 1,…,n. Находится RSS. Находится оценка дисперсии возмущений по формуле ^ Оценивается регрессия e 2 на Z 1,…,Z r, находится ESS 0. Формальное описание теста Бройша - Пагана
3 Тестовая статистика Имеет распределение «хи – квадрат» с r степенями свободы. Если при выбранном уровне значимости, то гипотеза H 0 о гомоскедастичности отвергается. Формальное описание теста Бройша - Пагана
1 Что делать в случае гетероскедастичности? Предположим, что нам известны дисперсии возмущений i 2 для всех наблюдений i = 1,…,n.
2 Разделим обе части равенства на i для каждого наблюдения.
3 Тогда дисперсии возмущений в новой регрессии станут одинаковыми и равными 1.
4 Преобразование переменных Все сводится к оценке новой регрессии с преобразованными факторами, оцениваем регрессию Y' на X' и H, которые определенны выше. Отметим, что в новой регрессии нет константы. 1 становится коэффициентом наклона перед переменной 1/ i.
5 Взвешенный метод наименьших квадратов Указанный метод называется взвешенным методом наименьших квадратов. Наибольший вес 1/ i получают наблюдения с наименьшей дисперсией возмущений i.
Взвешенный метод наименьших квадратов 6 Однако на практике стандартные отклонения возмущений обычно неизвестны. Но, оказывается, достаточно знать эти стандартные отклонения с точностью до постоянного множителя. Предположим, что стандартные отклонения возмущений пропорциональны некоторой известной переменной Z i.
Взвешенный метод наименьших квадратов 7 В этом случае мы достигаем гомоскедастичности остатков, разделив все переменные на Z i.
8 Взвешенный метод наименьших квадратов Действительно, как показано выше, дисперсии новых остатков одинаковы и равны 2. Нам нет необходимости знать 2. Достаточно того, что это константа (т.е. одинаковые дисперсии для всех возмущений, гомоскедастичность).
9 Взвешенный метод наименьших квадратов Если после выполнении теста Голдфелда – Квандта гипотеза о гомоскедастичности отвергается, то в качестве Z может быть использована переменная X j.
10 Взвешенный метод наименьших квадратов На практике вместо i часто используют их оценки. Например, если после проведения теста Глейзера гипотеза о гомоскедастичности была отвергнута, поскольку в регрессии ^ коэффициент β значим, то σ i = |e i |, i = 1,..,n
История, произошедшая на Нью-Йорской фондовой бирже 2 Securities and Exchange Commission vs Antitrust division of the US Department of Justice Биржевой комитет: Комиссионные брокерам не являются объектом соглашения между брокерами и клиентами, а устанавливаются биржевым комитетом Подразделение министерства юстиции: Цены комиссионных д.б. либерализованы
История, произошедшая на Нью-йоркской фондовой бирже 3 Биржевой комитет: где Y – доход брокерских компаний, Х – количество акций в сделке. Вывод: естественная монополия, не надо либерализовывать цены.
История, произошедшая на Нью-Йорской фондовой бирже 4 Подразделение министерства юстиции : Дисперсия ошибок зависит от объема сделки. Надо поделить все переменные на. Новое оцененное уравнение: Вывод: это не естественная монополия, надо либерализовать цены.