22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г. Лекция 10. Однофакторный дисперсионный анализ 10-1. Задача дисперсионного.

Презентация:



Advertisements
Похожие презентации
6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.
Advertisements

5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 6. Сравнение двух выборок 6-1. Гипотеза о равенстве средних. Парные выборки 6-2.Доверительный.
5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 11. Двухфакторный дисперсионный анализ Описание метода и пример Анализ.
7 ноября 2012 г.7 ноября 2012 г.7 ноября 2012 г.7 ноября 2012 г. Лекция 4. Проверка статистических гипотез 4-1. Гипотеза о доле признака 4-2. Гипотеза.
Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции
Дисперсионный анализ Врач-ординатор: Чайкисов Ю.С. Иркутский Государственный Медицинский Университет Кафедра Факультетской терапии Иркутск 2007 г.
«Линейная регрессия и корреляция: смысл и оценка параметров»
Статистическое моделирование экспериментального плана Лекция 3.
6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 2. Доверительные интервалы 2-1. Доверительный интервал для доли 2-2. Доверительный.
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Проверка статистических гипотез Основные понятия и терминология Что такое статистическая гипотеза? Лекция 6.
Парная линейная корреляция. Метод наименьших квадратов Задача: найти оценки параметров a и b такие, что остаток в i-ом наблюдении (отклонение наблюдаемого.
25 сентября 2012 г.25 сентября 2012 г.25 сентября 2012 г.25 сентября 2012 г. Тема 16. Непараметрические критерии. Факторный анализ Однофакторный.
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
ОСНОВЫ ДИСПЕРСИОННОГО АНАЛИЗА Лекция 25. План лекции: Виды дисперсионного анализа и его характеристики Факторная и случайная дисперсия Анализ двухфакторных.
Статистическое моделирование факторных планов Лекция 5.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Лекция 3 - Проверка гипотез в одномерном статистическом анализе 3.1. Основные понятия, используемые при проверке гипотез 3.2. Общий алгоритм статистической.
Доцент Аймаханова А.Ш.. 1. Статистические гипотезы в медико- биологических исследованиях. 2. Параметрические критерии различий. 3. Непараметрические критерии.
Проверка статистических гипотез Лекция 7 (продолжение) 1.
Транксрипт:

22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г. Лекция 10. Однофакторный дисперсионный анализ Задача дисперсионного анализа Однофакторный дисперсионный анализ Решение в SPSS

2 Иванов О.В., 2005 Пример данных Имеется ли разница в среднем возрасте учителей, администрации и обслуживающего персонала школы? Взяты выборки из трех генеральных совокупностей. УчителяАдминистрация Обслуживающий персонал

22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г Задача дисперсионного анализа Однофакторный и двухфакторный дисперсионный анализ

4 Иванов О.В., 2005 Дисперсионный анализ (Analysis of Variance) F-критерий, который мы использовали при сравнении дисперсий, может применяться для сравнения трех и более средних. Этот метод называется дисперсионным анализом или в англоязычной аббревиатуре ANOVA (Analysis of Variance). F-критерий можно использовать при сравнении двух средних. Но в этом случае он становится идентичным t-критерию.

5 Иванов О.В., 2005 Однофакторный и двухфакторный анализ Дисперсионный анализ, который рассматривает только одну переменную называется однофакторным дисперсионным анализом (One-Way ANOVA). Дисперсионный анализ может также применяться в случае двух переменных - это двухфакторный дисперсионный анализ (Two-Way ANOVA). Фактор А Фактор B Зависимая переменная Зависимая переменная Фактор Зависимая переменная Зависимая переменная

22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г Однофакторный дисперсионный анализ Постановка задачи Описание метода Пример

7 Иванов О.В., 2005 Признак, фактор и уровни фактора Исследуется только один признак или переменная: возраст сотрудников. Рассматривается только один фактор: категория персонала. Три уровня фактора: учителя, администрация, обслуживающий персонал.

8 Иванов О.В., 2005 Представление данных Данные удобно представлять в виде таблицы. Выборки не обязаны иметь иметь одинаковый объем. Уровень 1Уровень 2…Уровень k x 11 x 21 … xk1xk1 x 12 x 22 … xk2xk2 x 23 … … n1n1 n2n2 nknk Уровни фактора Измерения признака Имеется k уровней. Всего проведено N измерений. Объемы выборок

9 Иванов О.В., 2005 Условия применения 1. Генеральные совокупности, из которых формируются выборки, должны быть нормально распределены. 2. Выборки должны быть независимы. 3. Дисперсии генеральных совокупностей должны быть равны.

10 Иванов О.В., 2005 Гипотезы Для выявления различия между тремя и более средними, выдвигаются следующие гипотезы: не все средние равны

11 Иванов О.В., 2005 Метод Вычисляются две оценки: межгрупповая дисперсия и внутригрупповая дисперсия. Если нет разницы в средних, то оценки межгрупповой и внутригрупповой дисперсий приблизительно равны и значение F-критерия близко к 1, поэтому нулевая гипотеза принимается. Если различие в средних значительно, межгрупповая дисперсия будет гораздо больше, чем внутригрупповая. Значение F- критерия будет значительно больше 1 и нулевая гипотеза будет отвергнута. Поскольку при проверке гипотезы мы сравниваем дисперсии, метод и получил название дисперсионный анализ.

12 Иванов О.В., 2005 Степени свободы и критическая область Степени свободы F-распределения задаются двумя значениями: Числителя: df = k – 1 Знаменателя: df = N – k Уравнение критической области (правосторонняя):

13 Иванов О.В., 2005 Суммы квадратов отклонений Межгрупповая сумма квадратов отклонений: Внутригрупповая сумма квадратов отклонений: Общая сумма квадратов отклонений: B etween Groups W ithin Groups S um S quare

14 Иванов О.В., 2005 Факторная и остаточная дисперсия. Критерий Межгрупповая (факторная) дисперсия: Внутригрупповая (остаточная) дисперсия: F-критерий: B etween Groups W ithin Groups M ean S quare

15 Иванов О.В., 2005 Таблица результатов Результаты вычислений принято представлять в виде следующей таблицы: Сумма квадратов df Среднее квадратичное F Между группами SS B k – 1MS B F-значение Внутри группSS W N – kN – k MS W Итого SS B + SS W N – 1 MS B + MS W

16 Иванов О.В., 2005 Пример УчителяАдминистрация Обслуживающий персонал Шаг 1. Гипотезы:

17 Иванов О.В., 2005 Шаг 2. Критическая область Найдем критическое значение по таблице критических точек распределения Фишера. Уровень значимости α = 0,05. Так как k = 3 и N = 19, то числительdf = k – 1 = 3 – 1 = 2 знаменательdf = N – k = 19 – 3 = 16 Критическое значение равно 3,633. Критическая область F > 3,633

18 Иванов О.В., 2005 Нахождение F-значения в Excel Критическое значение можно найти, используя функцию в Excel: FРАСПОБР (0,05; 2; 16) = 3,633…

19 Иванов О.В., 2005 Шаг 3. Вычисление статистики F УчителяАдминистрация Обслуживающий персонал Шаг 3a. Подсчет средних

20 Иванов О.В., 2005 Шаг 3b. Расчет отклонений

21 Иванов О.В., 2005 Шаг 3c. Расчет дисперсий

22 Иванов О.В., 2005 Шаг 3d. Расчет статистики

23 Иванов О.В., 2005 Шаг 4-5. Получение выводов, ответ 1,649 < 3,633 Полученное значение статистики не попало в критическую область. У нас нет оснований думать, что средние значения отличаются. Ответ. Средний возраст рассматриваемых категорий персонала не различается значимо.

22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г Решение задачи в SPSS Ввод данных АнализОтчет

25 Иванов О.В., 2005 Отчет в SPSS