Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 12 лет назад пользователемinformatika.socio.msu.ru
1 22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г. Лекция 10. Однофакторный дисперсионный анализ Задача дисперсионного анализа Однофакторный дисперсионный анализ Решение в SPSS
2 2 Иванов О.В., 2005 Пример данных Имеется ли разница в среднем возрасте учителей, администрации и обслуживающего персонала школы? Взяты выборки из трех генеральных совокупностей. УчителяАдминистрация Обслуживающий персонал
3 22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г Задача дисперсионного анализа Однофакторный и двухфакторный дисперсионный анализ
4 4 Иванов О.В., 2005 Дисперсионный анализ (Analysis of Variance) F-критерий, который мы использовали при сравнении дисперсий, может применяться для сравнения трех и более средних. Этот метод называется дисперсионным анализом или в англоязычной аббревиатуре ANOVA (Analysis of Variance). F-критерий можно использовать при сравнении двух средних. Но в этом случае он становится идентичным t-критерию.
5 5 Иванов О.В., 2005 Однофакторный и двухфакторный анализ Дисперсионный анализ, который рассматривает только одну переменную называется однофакторным дисперсионным анализом (One-Way ANOVA). Дисперсионный анализ может также применяться в случае двух переменных - это двухфакторный дисперсионный анализ (Two-Way ANOVA). Фактор А Фактор B Зависимая переменная Зависимая переменная Фактор Зависимая переменная Зависимая переменная
6 22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г Однофакторный дисперсионный анализ Постановка задачи Описание метода Пример
7 7 Иванов О.В., 2005 Признак, фактор и уровни фактора Исследуется только один признак или переменная: возраст сотрудников. Рассматривается только один фактор: категория персонала. Три уровня фактора: учителя, администрация, обслуживающий персонал.
8 8 Иванов О.В., 2005 Представление данных Данные удобно представлять в виде таблицы. Выборки не обязаны иметь иметь одинаковый объем. Уровень 1Уровень 2…Уровень k x 11 x 21 … xk1xk1 x 12 x 22 … xk2xk2 x 23 … … n1n1 n2n2 nknk Уровни фактора Измерения признака Имеется k уровней. Всего проведено N измерений. Объемы выборок
9 9 Иванов О.В., 2005 Условия применения 1. Генеральные совокупности, из которых формируются выборки, должны быть нормально распределены. 2. Выборки должны быть независимы. 3. Дисперсии генеральных совокупностей должны быть равны.
10 10 Иванов О.В., 2005 Гипотезы Для выявления различия между тремя и более средними, выдвигаются следующие гипотезы: не все средние равны
11 11 Иванов О.В., 2005 Метод Вычисляются две оценки: межгрупповая дисперсия и внутригрупповая дисперсия. Если нет разницы в средних, то оценки межгрупповой и внутригрупповой дисперсий приблизительно равны и значение F-критерия близко к 1, поэтому нулевая гипотеза принимается. Если различие в средних значительно, межгрупповая дисперсия будет гораздо больше, чем внутригрупповая. Значение F- критерия будет значительно больше 1 и нулевая гипотеза будет отвергнута. Поскольку при проверке гипотезы мы сравниваем дисперсии, метод и получил название дисперсионный анализ.
12 12 Иванов О.В., 2005 Степени свободы и критическая область Степени свободы F-распределения задаются двумя значениями: Числителя: df = k – 1 Знаменателя: df = N – k Уравнение критической области (правосторонняя):
13 13 Иванов О.В., 2005 Суммы квадратов отклонений Межгрупповая сумма квадратов отклонений: Внутригрупповая сумма квадратов отклонений: Общая сумма квадратов отклонений: B etween Groups W ithin Groups S um S quare
14 14 Иванов О.В., 2005 Факторная и остаточная дисперсия. Критерий Межгрупповая (факторная) дисперсия: Внутригрупповая (остаточная) дисперсия: F-критерий: B etween Groups W ithin Groups M ean S quare
15 15 Иванов О.В., 2005 Таблица результатов Результаты вычислений принято представлять в виде следующей таблицы: Сумма квадратов df Среднее квадратичное F Между группами SS B k – 1MS B F-значение Внутри группSS W N – kN – k MS W Итого SS B + SS W N – 1 MS B + MS W
16 16 Иванов О.В., 2005 Пример УчителяАдминистрация Обслуживающий персонал Шаг 1. Гипотезы:
17 17 Иванов О.В., 2005 Шаг 2. Критическая область Найдем критическое значение по таблице критических точек распределения Фишера. Уровень значимости α = 0,05. Так как k = 3 и N = 19, то числительdf = k – 1 = 3 – 1 = 2 знаменательdf = N – k = 19 – 3 = 16 Критическое значение равно 3,633. Критическая область F > 3,633
18 18 Иванов О.В., 2005 Нахождение F-значения в Excel Критическое значение можно найти, используя функцию в Excel: FРАСПОБР (0,05; 2; 16) = 3,633…
19 19 Иванов О.В., 2005 Шаг 3. Вычисление статистики F УчителяАдминистрация Обслуживающий персонал Шаг 3a. Подсчет средних
20 20 Иванов О.В., 2005 Шаг 3b. Расчет отклонений
21 21 Иванов О.В., 2005 Шаг 3c. Расчет дисперсий
22 22 Иванов О.В., 2005 Шаг 3d. Расчет статистики
23 23 Иванов О.В., 2005 Шаг 4-5. Получение выводов, ответ 1,649 < 3,633 Полученное значение статистики не попало в критическую область. У нас нет оснований думать, что средние значения отличаются. Ответ. Средний возраст рассматриваемых категорий персонала не различается значимо.
24 22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г Решение задачи в SPSS Ввод данных АнализОтчет
25 25 Иванов О.В., 2005 Отчет в SPSS
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.