Лекция 7.3 Выбор между линейной и полулогарифмической моделями. Тест Бокса – Кокса.
1 Преобразование Бокса - Кокса Качество оценки двух моделей с одной и той же зависимой переменной мы можем сравнивать с помощью показателя R 2 adj.
2 Для моделей с разными зависимыми переменными это невозможно. Преобразование Бокса - Кокса
3 Оценки параметров β 1,, β 2, λ 1, λ 2 находятся с помощью минимизации RSS по этим параметрам с помощью численных методов. Проверка гипотез о конкретных значениях λ 1, λ 2 называется тестом Бокса – Кокса. Преобразование Бокса - Кокса
4 При λ = 1 преобразование Бокса – Кокса сводится к линейному, а если λ = 0, то к логарифмическому. Преобразование Бокса - Кокса
5 Выбор между линейной и логарифмической моделями сводится к выбору между значениями параметра λ 1 = 1 и λ 1 = 0 при λ 2 = 1. Преобразование Бокса - Кокса
6 Выбор между линейной и полулогарифмической моделью можно осуществить с помощью теста Пола Зарембки (частный случай теста Бокса – Кокса). Выбор между линейной и полулогарифмической моделями H 0 : качество подгонки моделей (1) и (2) одинаковое H 1 : модель с меньшей RSS лучше
7 Тест П.Зарембки 1)Вычисляется среднее геометрическое значение Y: 2)Вводится вспомогательная переменная 3)Оцениваются параметры вспомогательных регрессий
8 Тест П.Зарембки 4) Вычисляется значение тестовой статистики где RSS 3, RSS 4 – суммы квадратов остатков в оцененных регрессиях (3) и (4). 5) Если при выбранном уровне значимости α то гипотеза H 0 отвергается, между моделями (1) и (2) есть значимое различие. Лучше та модель, при оценивании которой меньше RSS.
9 Приведен удобный способ вычисления среднего геометрического.
. sum LGEARN Variable | Obs Mean Std. Dev. Min Max LGEARN | gen EARNSTAR = EARNINGS/exp(2.79). gen LGEARNST = ln(EARNSTAR) 10 Пример
. sum LGEARN Variable | Obs Mean Std. Dev. Min Max LGEARN | gen EARNSTAR = EARNINGS/exp(2.7920). gen LGEARNST = ln(EARNSTAR) 11 Определение новой переменной EARNSTAR. Пример
. sum LGEARN Variable | Obs Mean Std. Dev. Min Max LGEARN | gen EARNSTAR = EARNINGS/exp(2.7920). gen LGEARNST = ln(EARNSTAR) 12 Определение переменной LGEARNST – логарифма от EARNSTAR. Пример
. reg EARNSTAR S EXP Source | SS df MS Number of obs = F( 2, 537) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = EARNSTAR | Coef. Std. Err. t P>|t| [95% Conf. Interval] S | EXP | _cons | Линейная регрессия EARNSTAR на S и EXP. RSS = Пример
. reg LGEARNST S EXP Source | SS df MS Number of obs = F( 2, 537) = Model | Prob > F = Residual | R-squared = Adj R-squared = Total | Root MSE = LGEARNST | Coef. Std. Err. t P>|t| [95% Conf. Interval] S | EXP | _cons | Полулогарифмическая модель. RSS = Пример
. при любом разумном уровне значимости. Следовательно, полулогарифмическая модель лучше. 15 Пример