Проверка статистических гипотез: методы параметрической статистики Лекция 23
План лекции: Генеральная и выборочная совокупность. Оценка параметров генеральной совокупности по выборке. Этапы обработки малой выборки с использованием распределения Стьюдента Определение достоверности различия двух зависимых выборочных совокупностей (разностный метод) Определение достоверности различия двух независимых выборочных совокупностей
Генеральная и выборочные совокупности Наиболее общую совокупность объектов, подлежащих изучению, называют генеральной. Часть генеральной совокупности, случайным образом отобранной для наблюдений, называется случайной выборкой или просто выборкой. Число элементов генеральной или выборочной совокупности называется её объемом.
Выборочные совокупности n
Точечные и интервальные оценки генеральной совокупности: M(x), D(x), σ(x), 95% ДИ Требуется оценить эти параметры по наблюдениям выборки. Пусть оценкой неизвестного параметра Θ является величина Θ n, зависящая от наблюдений выборки: Θ Θ n. (Θ n -случайная величина, меняющаяся от выборки к выборке). Для правильной аппроксимации параметра генеральной совокупности Θ выборочная оценка Θ n по правилам математической статистики должна быть состоятельной и несмещенной.
Оценка Θ n называется состоятельной оценкой параметра Θ, если при n, Θ n Θ, то есть вероятность отклонения оценки от истинного значения параметра можно сделать сколь угодно малой, увеличивая объем выборки. Оценка Θ n называется несмещенной оценкой параметра Θ, если при любом n: М(Θ n ) = Θ. Это означает, что отклонение Θ n от Θ не содержит систематической ошибки. В противном случае оценка называется смещенной.
В качестве оценки М(X) используется выборочное среднее: Оценкой D(X) служит исправленная выборочная дисперсия: Смещенная выборочная дисперсия (n>30): Среднее квадратическое отклонение:
Интервальные оценки для генеральной средней Для n выборок из генеральной совокупности получим ряд средних арифметических: Центральная предельная теорема: Выборочные средние имеют приближенно нормальное распределение независимо от распределения исходной совокупности, из которой были извлечены выборки. Среднее значение всех возможных выборочных средних равно среднему исходной совокупности. Стандартное отклонение всех возможных средних по выборкам данного объема зависит как от стандартного отклонения совокупности, так и от объема выборки.
Таким образом, величина служит мерой точности, с которой выборочное среднее является оценкой среднего по совокупности. Поэтому эту величину называют средней квадратической ошибкой (или ошибкой выборочности, стандартной ошибкой).
Если объекты отобраны в выборку случайным образом, то чем больше ее размеры, тем меньше стандартная ошибка, а значит, меньше расхождения в выборочной и генеральной совокупностях.
Стьюдент – псевдоним одного из основоположников теории статистических оценок и проверки гипотез -английского математика У. Госсета, показавшего, что оценка расхождений между средним значением малой выборки и средним значением генеральной совокупности подчиняется особому закону распределения: t- распределению Стьюдента.
Критерий нормированного отклонения (по Стьюденту): Доверительный интервал имеет вид: Распределение значений t отличается от нормального тем сильнее, чем меньше n. По мере увеличения n, t – распределение Стьюдента приближается к нормальному. При n 30 разница между ними практически исчезает
Разные значения t, отсекающие по 2,5% площади справа и слева: а) под кривой нормального распределения (n=, t=1,96), б) под кривой t–распределения по Стьюденту (n=5, t=2,78).
Пример: Пусть дан ряд значений пульса (ЧСС) у студентов Ф101 группы до экзамена: Найдем среднее арифметическое значение выборки: 2. Вычислим дисперсию (рассеивание ряда) где df = n-1 число степеней свободы
3. Среднее квадратическое отклонение выборки: Это - точечные (т.е. выраженные одним значением) параметры малой выборки. Результат записывается в виде: ЧСС=
4. Определим среднюю квадратическую ошибку: 5. Определим доверительный интервал для генеральной средней. По таблицам Стьюдента находим t для доверительной вероятности 0,95 и числа степеней свободы df=n-1=5:
Коэффициент нормированных отклонений Стьюдента df/Р0,950,990, ,70663,657636,619 24,3039,92531,598 33,1825,84112,941 42,7814,6028,610 52,5714,0326,859 62,4473,7075,959 72,3653,4995,405 82,3063,3555,041 92,2623,2504, ,2283,1694,578
t=2,57, следовательно: =90 2,57 5,8=90 15 уд/мин или уд/мин
Выборки Зависимые Независимые Одна и та же группа до и после лечения Разные группы
Допущения: В генеральной совокупности выборки распределены по нормальному закону Дисперсии независимых выборок одинаковы
Определение достоверности различия двух зависимых выборочных совокупностей (разностный метод) NЧСС до ЧСС после Исследовалось изменение частоты сердечных сокращений студентов до и после экзамена
Нулевая гипотеза: В генеральной совокупности нет различия между средними арифметическими выборок Проверяем гипотезу по критерию Стьюдента t при уровне вероятности p=0,95 ( =0,05) 1.Определяем t эксп : где d-среднее значение разности пульса до и после экзамена s d -стандартная ошибка разности
Нулевая гипотеза: 2.Определяем критическое значение критерия Стьюдента (t таб )для p=0,95 и df=n-1 Если t эксп t таб нулевая гипотеза отвергается, различие средних статистически значимо Если t эксп < t таб, нулевая гипотеза принимается, различие средних статистически не значимо
NЧСС до ЧСС после d(d-dср) dср= D=160
Для разности:
Определим, достоверно ли определена средняя арифметическая разности:
t таб (0,95;5)=2,57 t эксп > t таб, достоверно! Это означает, что нулевая гипотеза отвергается, снижение ЧСС статистически значимо
Для второго ряда измерений:
Примечание:*-значимость различий
Определение достоверности различия двух независимых выборочных совокупностей Нормированное отклонение: Для n
Ф101Ф102Δ Х 1 (Δ Х 1 ) 2 Δ Х 2 (Δ Х 2 ) = Сравним изменение частоты сердечных сокращений студентов Ф101 и Ф102 группы до экзамена
df=(n 1 -1)+(n 2 -1)=11 t табл =2,2 t эксп < t табл, нулевая гипотеза принимается, различие средних арифметических статистически не значимо, выборки принадлежат одной генеральной совокупности
Показатель Группа Ф101Ф102 ЧСС (уд/мин) 90±14,1 (6) 100 ±18,3 (7)
Сводка основных формул Средняя арифметическая выборки Дисперсия Среднее квадратическое отклонение Средняя квадратическая ошибка:
Критерий нормированного отклонения (по Стьюденту) Доверительный интервал для генеральной средней Критерий t эксп для определения достоверности средней арифметической одной выборки
Критерий t эксп разности средних арифметических двух выборок а) n30 б) n
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА: Основная литература: Павлушков И.В. Основы высшей математики и математической статистики. М., ГЭОТАР-Медиа, 2005, с Учебно–методические пособия: Шапиро Л.А., Шилина Н.Г. Руководство к практическим занятиям по медицинской и биологической статистике Красноярск: ООО «Поликом». – 2003.