Лекция 8.6 Что делать в случае гетероскедастичности?
1 Предположим, что нам известны дисперсии возмущений i 2 для всех наблюдений i = 1,…,n.
2 Разделим обе части равенства на i для каждого наблюдения.
3 Тогда дисперсии возмущений в новой регрессии станут одинаковыми и равными 1.
4 Преобразование переменных Все сводится к оценке новой регрессии с преобразованными факторами, оцениваем регрессию Y' на X' и H, которые определенны выше. Отметим, что в новой регрессии нет константы. 1 становится коэффициентом наклона перед переменной 1/ i.
5 Взвешенный метод наименьших квадратов Указанный метод называется взвешенным методом наименьших квадратов. Наибольший вес 1/ i получают наблюдения с наименьшей дисперсией возмущений i.
Взвешенный метод наименьших квадратов 6 Однако на практике стандартные отклонения возмущений обычно неизвестны. Но, оказывается, достаточно знать эти стандартные отклонения с точностью до постоянного множителя. Предположим, что стандартные отклонения возмущений пропорциональны некоторой известной переменной Z i.
Взвешенный метод наименьших квадратов 7 В этом случае мы достигаем гомоскедастичности остатков, разделив все переменные на Z i.
8 Взвешенный метод наименьших квадратов Действительно, как показано выше, дисперсии новых остатков одинаковы и равны 2. Нам нет необходимости знать 2. Достаточно того, что это константа (т.е. одинаковые дисперсии для всех возмущений, гомоскедастичность).
9 Взвешенный метод наименьших квадратов Если после выполнении теста Голдфелда – Квандта гипотеза о гомоскедастичности отвергается, то в качестве Z может быть использована переменная X j.
10 Взвешенный метод наименьших квадратов На практике вместо i часто используют их оценки. Например, если после проведения теста Глейзера гипотеза о гомоскедастичности была отвергнута, поскольку в регрессии ^ коэффициент β значим, то σ i = |e i |, i = 1,..,n
11 Пример Пример зависимости производства на душу населения от ВВП на душу населения (диаграмма рассеивания).
12 Пример Упорядочив страны по возрастанию ВВП на душу населения, разбивает их на три группы, средние наблюдения выкидывает, а для первой и последней группы наблюдений оцениваем регрессии и находим RSS. RSS 1 = 5,378,000 RSS 2 = 17,362,000
13 Пример Проводим тест Голфелда - Квандта. Поскольку тестовая статистика больше критической при 5% уровне значимости, нулевая гипотеза о гомоскедастичности отвергается. RSS 1 = 5,378,000 RSS 2 = 17,362,000
Пример 14 Альтернативная гипотеза в тесте Голфелда – Квандта предполагает пропорциональность стандартного отклонения возмущений объясняющей переменной (в данном примере X = GDP).
Пример 15 Напомним, что для получения эффективных оценок требуется преобразовать переменные, разделив их на ту переменную, которой пропорционально стандартное отклонение возмущений.
16 Пример Диаграмма рассеяния в преобразованных переменных.
17 Пример Снова проводим тест Голдфелда - Квандта. RSS 1 = RSS 2 = 0.070
18 Пример На этот раз гипотеза о гомоскедастичности не отвергается. С помощью преобразования гетероскедастичность была устранена. RSS 2 = RSS 1 = 0.065
19 Второй способ борьбы с гетероскедастичностью Существует другой способ борьбы с гетероскедастичностью, связанный с выбором другой функциональной формы модели, а именно, линейной в логарифмах.
20 Логарифмическое преобразование данных Диаграмма рассеяния для переменных в логарифмическом масштабе.
21 Линейная в логарифмах модель Проведем снова тест Голдфелда – Квандта для линейной в логарифмах модели.. RSS 2 = RSS 1 = 2.140
22 HETEROSCEDASTICITY: WEIGHTED AND LOGARITHMIC REGRESSIONS Нулевая гипотеза о гомоскедастичности не отвергается. RSS 2 = RSS 1 = 2.140
23 Логарифмический масштаб В логарифмическом масштабе разнице между Южной Кореей и Мексикой не так сильно отличается от разницы для Сингапура и Греции, как при линейном масштабе. South Korea Mexico Singapore Greece
24 Линейный масштаб South Korea Mexico Singapore Greece
25 Различные спецификации По одним и тем же данным оценено несколько моделей.