Дальнейшее Исследование Качества Уравнения Регрессии 1. F-тест-2 Оценено уравнение: Ŷ = b 1 + b 2 *X 2 +…+b k *X k Для него подсчитан R 2 k. Вводятся еще m независимых переменных и уравнение оценивается еще раз: Ŷ = b 1 + b 2 *X 2 +…+b k *X k +b k+1 *X k+1 +…+b k+m *X k+m Для него также подсчитывают R 2 k+m.
Вопрос: Значимо ли улучшается объяснение Y при добавлении X k+1,…X k+m ? Решение: Надо проверить гипотезу: H 0 : k+1 = … = k+m = 0 H A : не H 0 F стат Задается α. F кр (m; n-k-m; α) Если Fстат > Fкр, H 0 отвергается при ур. знач. α. Если Fстат < Fкр, H 0 не отвергается.
ПРИМЕР При изучении годовой доходности сети из 35 кинотеатров вначале было получено уравнение регрессии: Ŷ = 0,9 + 0,06*X 2 + 0,11*X 3, R 1 2 = 0,46. (0,4) (0,021) (0,04) Здесь Y – годовой доход кинотеатра в т.р., X 2 – уровень доходов населения, проживающего в окрестности к/т, в т.р. X 3 - количество фильмов, показанных в к/т за год.
Затем в уравнение были добавлены еще две переменные: X 4 - численность молодежи в возрасте от 14 до 25 лет, проживающей в окрестности; X 5 - число других развлекательных учреждений в окрестности. Пересчитанное уравнение регрессии имело вид: = 1,2 + 0,04*X 2 + 0,1*X 3 + 1,31*X 4 – 0,32*X 5 ; (0,48) (0,017) (0,04) (0,61) (0,15) R 2 2 =0,69
Увеличило ли объясняющую способность уравнения добавление к нему двух новых переменных? H 0 : 4 = 5 = 0 H A : не H 0 F стат = Fкр(0,05;2;30) = 3,32 H 0 отвергается при 5% уровне значимости.
2. F-тест-3 Рассматривается уравнение =b 1 + b 2 *X 2 +…+b k *X k +b k+1 *X k+1 +…+b k+m *X k+m Для него подсчитаны R 2 k+m, RSS k+m. Затем из уравнения удаляются m переменных и уравнение пересчитывается: = b 1 + b 2 *X 2 +…+b k *X k Для него также подсчитываются R 2 k, RSS k.
Вопрос: Значимо ли ухудшается объяснение Y при удалении X k+1,…X k+m ? Решение: Надо проверить гипотезу: H 0 : k+1 = … = k+m = 0 H A : не H 0 F стат Задается уровень значимости α. F кр (m; n-k-m; α) Если Fстат > Fкр, H 0 отвергается при ур. знач. α. Если Fстат < Fкр, H 0 не отвергается.