кандидат технических наук, доцент Поляков Константин Львович Учебный курс Эконометрика: идентификация, оценивание и анализ статических моделей Лекция 11
2 Лукавая статистика
3 100 $ 1000 $ Каков средний заработок ? 1400$/5=280$ Все пятеро будут сильно удивлены !
4 F1F2F2 Доля: 1- Доля:
5 «Выброс» (outlier) это … «Выброс» это измерение, которое «плохо» описывается с помощью выбранной модели. Выбросы нельзя удалять из массива данных. Их надо изучать !
6 Пример Выбросы Y X
7 C=a 0 +a 1 X+v C=a 0 +a 1 X+a 2 d war +v
8 Обнаружение выбросов относительно модели линейной регрессии
9 Содержит ли выборка значения независимых переменных, которые могут сильно повлиять на значения оценок ?
10 Проанализируйте силу воздействия (leverage) измерений При больших значениях p tt трудно понять, в каком измерении находится выброс.
11 Пример для двумерной регрессии
12 Измерение «притягивает» к себе линию регрессии. Большая сила влияния
13
14 Расстояние Махаланобиса (Mahalanobis distance )
15 Содержит ли выборка резко выделяющиеся значения зависимых переменных ?
16 Проанализируйте стьюдентизированные удаленные остатки Удаленные остатки (deleted residual) Оценка значения параметра получена без измерения с номером t
17 Стьюдентизированные удаленные остатки (studentized deleted residual) Оценка дисперсии случайной составляющей по выборке без измерения t Дисперсия апостериорной остаточной разности не постоянна !
18 Дисперсия стьюдентизированной удаленной остаточной разности постоянна ! Наблюдение с номером t является выбросом, если: Пусть выполняется нормальная гипотеза !
19 Расстояние Кука (Cooks distance) Пусть выполняется нормальная гипотеза, тогда CD t ~ F(n,T-n) Мера анормальности наблюдения Чувствительность оценки к выбросу