Статистические гипотезы Лекция 2
Вопросы для обсуждения 1.Общее представление о статистических гипотезах. Статистика и параметры. 2.Гипотезы о среднем. Распределение Стьюдента. 3.Сравнение двух выборок. Структурная модель Стьюдента. 4.Сравнение дисперсий. F-распределение.
ВОПРОС 1 Общее представление о статистических гипотезах.
Статистическая гипотеза Статистическая гипотеза – это предположение по поводу параметров распределения случайной величины. Проверка статистических гипотез осуществляется путем сбора статистики.
Параметры и статистика Параметры Теоретическая величина характеризующая распределение случайной величины Имеет отношение к генеральной совокупности Практически никогда не известна Статистика Эмпирическая характеристика, оценка параметра распределения случайной величины Имеет отношение к выборке Измеряется в ходе эксперимента
Примеры гипотез
Виды гипотез Нулевая (H 0 ) Утверждает что-то конкретное о параметрах распределения Истинность определяется на основе оценки статистики Альтернативная (H 1 ) Утверждает что-то противоречащее нулевой гипотезе, менее конкретна Истинность определяется на основе рассмотрения нулевой гипотезы
Проверка гипотез
Матрица исходов ГипотезыH 0 принимается (H 1 отвергается) H 0 отвергается (H 1 принимается) H 0 верна (H 1 неверна) Правильное принятие H 0 (правильное отвержение H 1 ) Ошибка первого рода (α-ошибка) H 0 неверна (H 1 верна) Ошибка второго рода (β-ошибка) Правильное отвержение H 0 (правильное принятие H 1 ).
Статистическая надежность Теоретически не существует возможности со 100% вероятностью выбрать истинную гипотезу. Вне зависимости от установленного критерия всегда остается вероятность ошибки первого или второго рода. Уменьшая вероятность ошибки первого рода, мы увеличиваем вероятность ошибки второго рода и наоборот.
Уровни статистической надежности P>0,10Н 0 принимается P
ВОПРОС 2 Гипотезы о среднем. Распределение Стьюдента.
Гипотезы о среднем Пусть есть вектор данных X Допустим, что X извлечены из нормальной совокупности с параметрами μ и σ 2 Предположим: H 0 : μ=А Тогда: H 1 : A
Случай 1: σ известна
Случай 2: σ неизвестна
Статистика Стьюдента Распределение t-статистики отличается от нормального. Это распределение принято называть распределением Стьюдента, или просто t-распределением. Распределение Стьюдента симметрично относительно среднего и имеет небольшой положительный эксцесс. Оно характеризуется степенями свободы (обозначается df, от англ. degrees of freedom). Для данного случая число степеней свободы t-статистики на одну меньше объема выборки, т.е. равно n-1.
t-распределение
ВОПРОС 3 Сравнение двух выборок. Структурная модель Стьюдента.
Сравнение двух выборок Пусть есть два вектора данных – X и Y Допустим, что X и Y извлечены из нормальной совокупности с параметрами соответственно μ X и σ X и μ Y и σ Y Предположим: H 0 : μ X = μ Y Тогда: H 1 : μ X μ Y
Структурная модель
Тогда…
Допустим… Сделаем неочевидное, но правдоподобное допущение, что дисперсии X и Y одинаковы. Поскольку дисперсии X и Y определяются дисперсией статистической ошибки ε, то
Отсюда…
ВОПРОС 4 Сравнение дисперсий. F-распределение
Сравнение дисперсий Пусть есть два вектора данных – X и Y Допустим, что X и Y извлечены из нормальной совокупности с параметрами соответственно μ X и σ X и μ Y и σ Y Предположим: H 0 : σ X = σ Y Тогда: H 1 : σ X σ Y
F-статистика
F-распределение