Лекция 3 - Проверка гипотез в одномерном статистическом анализе 3.1. Основные понятия, используемые при проверке гипотез 3.2. Общий алгоритм статистической проверки гипотез 3.3. Способы проверки некоторых типов гипотез: Проверка гипотезы о равенстве среднего нормальной генеральной совокупности определённому числу (t-распределение Стьюдента) Проверка гипотезы о равенстве двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (t-распределение Стьюдента) Проверка гипотезы о равенстве двух дисперсий нормальных генеральных совокупностей (F-распределение Фишера) © Кокодей Т.А., 2012
3.1 Основные понятия, используемые при проверке гипотез © Кокодей Т.А., 2012 Статистическая гипотеза - некоторое предположение о законе распределения случайной величины или о параметрах этого закона в генеральной совокупности, формулируемое на основе анализа выборки. Примеры: «генеральная совокупность распределена по нормальному закону; «средние значения равны в двух нормальных генеральных совокупностях (с одинаковой дисперсией)»; «среднее значение анализируемой генеральной совокупности равно нулю» Нулевая гипотеза Н0 - утверждает, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках; Альтернативная гипотеза Н1 – утверждает, что данное различие присутствует. Если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.
© Кокодей Т.А., 2012 ЗАДАЧА: ПРОВЕРИТЬ, НЕ ПРОТИВОРЕЧИТ ЛИ ВЫСКАЗАННАЯ ГИПОТЕЗА О ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ ИМЕЮЩИМСЯ ВЫБОРОЧНЫМ ДАННЫМ. Статистической проверкой гипотез называется процедура сопоставления высказанной гипотезы о генеральной совокупности с имеющимися в распоряжении выборочными данными x1, x2, x3…., xn с помощью того или иного статистического критерия и сопровождаемая оценкой достоверности получаемого вывода Статистический критерий (тестовая статистика) – это случайная величина с известным (если H0 принимается) законом распределения вероятностей (например,t – Стьюдента, χ2 – Пирсона, F – Фишера), которая служит для проверки гипотезы и характеризует степень различия между сравниваемыми характеристиками (например, среднего генеральной совокупности и эталонного значения). Обозначим эту величину через t(х), ее значение является функцией от выборочных значений СВ Х: x 1, x 2, …, x n.
© Кокодей Т.А., 2012 Критическая область - множество возможных значений критерия t, при которых гипотеза H 0 отвергается (принимается H1); Область принятия гипотезы -множество возможных значений критерия t, при которых нулевая гипотеза H0 принимается (H 1 отвергается); Значения критерия, отделяющие критическую область от области принятия гипотезы, называются критическими точками t кр. Их значения содержатся в статистических таблицах; t р – р асчётное значение критерия, вычисленное по выборке; При проверке гипотезы могут быть допущены ошибки двух видов: 1. ошибка первого рода, если отклонена верная нулевая гипотеза H0. Вероятность данной ошибки «α» называется уровнем значимости. Обычно уровень значимости α выбирается равным 0.01, 0.05, или 0.1 и по этому значению подбирают критическую область. 2. ошибка второго рода, если принята неверная нулевая гипотеза H0.
© Кокодей Т.А., 2012 График плотности распределения вероятностей двустороннего статистического критерия Т
© Кокодей Т.А., Общий алгоритм статистической проверки гипотез 1. Формулировка основной гипотезы H0 и альтернативной гипотезы H1 2. Задание уровня значимости критерия α 3. Выбор статистического критерия как функции от результатов наблюдения t(x)=f(x1,x1,…,xn) и нахождение его критического значения по статистической таблице для выбранного закона распределения; определение вида критической области. 4. По выборке вычисляется наблюдаемое или расчётное значение критерия t р (х) (по наблюдаемым значениям СВ Х). 5. По его значению делается вывод об истинности гипотезы Н0. Если расчётное значение критерия попадает в критическую область, то нулевая гипотеза отвергается, а при попадании его в область принятия гипотезы нулевая гипотеза принимается.
© Кокодей Т.А., 2012 хiхi 3.3. Способы проверки некоторых статистических гипотез Проверка гипотезы о равенстве среднего нормальной генеральной совокупности определённому числу Пусть имеется выборка n значений случайной величины: х 1, х 2,..., x n из нормально распределенной генеральной совокупности (дисперсия неизвестна). Требуется проверить гипотезу H0 о равенстве генеральной средней нормальной совокупности определённому гипотетическому значению «а». В качестве статистического критерия (тестовой статистики) задаём случайную величину t: СВ (критерий) t: - отражает различие между средним и числом «а» - подчиняется распределению Стьюдента (если H0 верна)
© Кокодей Т.А., 2012 Функция плотности t-распределения Стьюдента
© Кокодей Т.А., 2012
.
Проверка гипотезы о равенстве двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы
© Кокодей Т.А., 2012
. Проверка гипотезы о равенстве двух дисперсий нормальных генеральных совокупностей
© Кокодей Т.А., 2012
Домашняя работа (3) Согласно данным задачи предыдущей домашней работы (2) в течение одного случайно выбранного дня в магазине одежды и обуви JC Penny (США) фиксировались длины ступней (см.) покупателей (значения случайной величины Z). Полученные статистические данные для всех 20-ти покупателей выбранного дня представлены ниже: 23,8; 23; 24,2; 24; 21,7; 26,2; 25,1; 23; 24,6; 23,8; 25,4; 24; 25,1; 27,1;22,5; 23,9; 23,9; 23,9; 22,9; 24,9. Выдвинем и проверим три гипотезы на основании полученных выборочных данных, предполагая что СВ Z имеет нормальное распределение вероятностей в генеральной совокупности: 1. Средняя длина ступни покупателя (СВ Z) в генеральной совокупности (под которой будем понимать всех покупателей магазина за год) равна 24 см., что соответствует 38-му размеру обуви. Уровень значимости принять равным 0, Дисперсии длин ступней (СВ Z и Y) покупателей магазинов JC Penny и конкурента Macys (находящихся в разных городах США) будут равны, если фиксировать значения данных признаков в течение года (две генеральные дисперсии равны). Уровень значимости 0,1. 3. Средние длины ступней (СВ Z и Y) покупателей магазинов JC Penny и Macys будут равны, если фиксировать значения данных признаков в течение года. Сделать допущение, что генеральные дисперсии СВ Z и Y неизвестны, но одинаковы. Уровень значимости 0,01. У 27 26,8 24, ,9 26, ,1 24,8 26, , ,9 23,9 27