Занятие 4 Дисперсионный анализ ANOVA (продолжение)

Презентация:



Advertisements
Похожие презентации
1 Занятие 5 Дисперсионный анализ ANOVA (продолжение)
Advertisements

Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3.
Дисперсионный анализ. Основной целью дисперсионного анализа является исследование значимости различия между средними. Установить различаются ли три группы.
Проверка гипотез на примере уравнения регрессии Проверка гипотез и соответствующие статистические выводы являются одними из центральных задач математической.
5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 6. Сравнение двух выборок 6-1. Гипотеза о равенстве средних. Парные выборки 6-2.Доверительный.
Доцент Аймаханова А.Ш.. 1. Статистические гипотезы в медико- биологических исследованиях. 2. Параметрические критерии различий. 3. Непараметрические критерии.
Статистическое моделирование экспериментального плана Лекция 3.
Тестирование гипотез в статистике. Критерии Стьюдента Занятие 2.
6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.
Дисперсионный анализ Врач-ординатор: Чайкисов Ю.С. Иркутский Государственный Медицинский Университет Кафедра Факультетской терапии Иркутск 2007 г.
22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г. Лекция 10. Однофакторный дисперсионный анализ Задача дисперсионного.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Лекция 3 - Проверка гипотез в одномерном статистическом анализе 3.1. Основные понятия, используемые при проверке гипотез 3.2. Общий алгоритм статистической.
5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 11. Двухфакторный дисперсионный анализ Описание метода и пример Анализ.
1 Описательная статистика. 2 Основные понятия Переменная = одна характеристика объекта или события Количественные: возраст, ежегодный доход Качественные:
ЛЕКЦИЯ 8 КОРРЕЛЯЦИОННО- РЕГРЕССИОННЫЙ АНАЛИЗ. МОДЕЛИРОВАНИЕ СВЯЗЕЙ.
«Линейная регрессия и корреляция: смысл и оценка параметров»
СРС На тему : « Сравнение средних значений признаков по критерию Стьюдента : Критерий Стьюдента для независимых выборок. Критерий Стьюдента для связанных.
Транксрипт:

Занятие 4 Дисперсионный анализ ANOVA (продолжение)

Сложная «омнибусная» гипотеза АНОВЫ: Похожа на стрельбу из дробовика: не нужно особенно точно целиться, непонятно, какая дробинка попала в какую мишень – какая из маленьких гипотез не верна. Что делать, если мы изначально хотим проверить не все эти гипотезы? Хотим выстрелить из винтовки в строго определённую мишень?

A priori Tests (ANOVA) = Planned comparisons Вся мощность теста направляется на одну гипотезу, остальные игнорируются. ЗАРАНЕЕ Важно: то, какую гипотезу тестировать, выбирают ЗАРАНЕЕ, до проведения какого-либо анализа! В идеале – ещё при постановке исследования. Процедура тестирования – почти как t-критерий Стьюдента.

A priori Tests Обычно используются для тестирования комплексных (а не парных) гипотез. Dr. J разработал новую диету и собирается протестировать её эффективность. Из 20 добровольцев группа 1 (n=5) соблюдает новую диету; группа 2 (n=5) занимается на тренажёре; группа 3 (n=5) занимается аэробикой; группа 4 (n=5) бегает по утрам.

Зависимая переменная – число грамм, на которое изменилась масса тела добровольцев за 3 месяца. Можно было бы провести ANOVA затем апостериорный тест, но нас интересует лишь сравнение диеты Dr. J с разными видами физических упражнений. A priori Tests

«Контраст» = «сравнение» (contrast, comparison) – линейная комбинация средних значений. Коэффициенты сравнения – константы, на которые умножены средние. В сумме = нулю: Из наших 4-х групп рассчитываем A priori Tests

Статистика = параметр выборки – параметр популяции стандартная ошибка параметра выборки A priori Tests Статистика = выборочное сравнение стандартная ошибка выборочного сравнения Она имеет t-распределение – почти как двухвыборочный критерий Стьюдента

Ещё один пример: У нас 4 группы тигров, их кормили: овощами; фруктами; рыбой; мясом. Вопрос: отличалась ли масса тигров, питавшихся животной и растительной едой? A priori Tests

Planned comparisons

мы отвергаем Н 0. Масса тигров, питавшихся растительной и животной едой, различалась

Planned comparisons: МОЩНОСТЬ такого теста ВЫШЕ, чем последовательное использование АНОВЫ и методов множественного сравнения! A priori Tests

Repeated measures ANOVA Сравнение связанных групп Преподаватель решил узнать, как у его студентов продолжительность занятий зависит от дня недели (он поделил время на 15-минутные блоки).

Repeated measures ANOVA Представим, что эти группы независимы и проведём ANOVA. Различия между ними недостоверны. Почему? Из-за большой внутригрупповой изменчивости? Студенты по усердию сильно различаются между собой!\ Как элиминировать межиндивидуальные различия (between-subjects effect)?

Repeated measures ANOVA Вычесть из каждого измерения среднее значение для каждого студента! Вот теперь измерения стали независимы («исправленные»), и дальше можно сравнить их ANOVA ( от обычной ANOVA отличается число степеней свободы внутри измерений – )

Repeated measures ANOVA Н 1 : нулевая гипотеза не верна F = между оценка дисперсии между группами внутри оценка дисперсии внутри групп Обычная ANOVA: Repeated measures ANOVA: F = оценка дисперсии между измерениями «ошибка» Изменчивость: 1.Между измерениями; 2.Между особями ( получается из средних значений для особей); 3.«ошибка» ( внутри «исправленных» измерений ) – error, residual

Repeated measures ANOVA Теперь Н 0 будет отвергнута, т.е., преподаватель сможет утверждать, что усердие его учеников зависит от дня недели. Мощность дисперсионного анализа для повторных измерений выше, чем обыкновенного дисперсионного анализа (в случае связанных выборок).

Другой пример: к тиграм-самцам пришёл новый служитель, а потом – новая уборщица. И возможно, они стали по-другому питаться. Мы хотим узнать, менялась ли их масса. служителямассу тигров-самцов Мы анализируем влияние служителя на массу тигров-самцов. Зависимая переменная Зависимая переменная – масса. Но: Но: для каждой особи по 3 измерения (3 столбика в таблице). Repeated measures ANOVA

Каждый тигр ТРИ раза участвует в наблюдениях. ДО СЛУЖ УБОР 1 тигр тигр тигр тигр тигр тигр F = оценка дисперсии между измерениями «ошибка»

В Statistica каждый столбик измерений называется dependent variable

между наблюдениями Отвергаем Н 0 : Масса тигров в среднем достоверно изменялась после прихода нового служителя и новой уборщицы. «ошибка» - внутри «исправленных» наблюдений изменчивость между особями

Repeated measures ANOVA

Отвергаем Н 0 : Масса тигров в среднем достоверно изменилась после прихода нового служителя и новой уборщицы. А теперь можно провести апостериорный (post-hoc) тест! И выяснить, кто и как повлиял на массу тигров.

Main effect ANOVA (Two-way, multi-way designs) Мы изучали земляных белок из Африки. Ловили их, взвешивали, измеряли зубы, голову. Определяли пол, возраст. А теперь хотим знать, как разные факторы влияют на размер и вес белок. Фактор 1: пол. Фактор 2: возраст. Зависимая переменная: масса тела.

Main effect ANOVA: 1.Мы исследуем действие на выборку ДВУХ (трёх, четырёх) категориальных факторов ( independent variables ). 2.Факторы НЕЗАВИСИМЫ. 3.Зависимая переменная ОДНА.

Main effect ANOVA Получилось 6 групп белок – 6 ячеек (cells) в таблице. Заметим, что во ВСЕХ ячейках должны выполняться условия соответствия нормальному распределению и равенства дисперсий. 1 год2 года3 года самцы самки , ,

Main effect ANOVA Мы тестируем 2 эффекта – пола и возраста белок: main effect for rows main effect for columns. 2 нулевые гипотезы, которые тестируются одновременно! 123 Масса тела самки самцы Примерный вид графического представления: Масса тела

Ещё пример: Мы хотим изучить влияние питания на вес зверьков, отдельно для самцов и самок. Зависимая переменная – масса тела. Фактор 1 Фактор 1 (независимая переменная) – пол ( 1. самки; 2. самцы ) Фактор 2 Фактор 2 – тип еды (1. овощи; 2. фрукты; 3. мясо) Main effect ANOVA

Снова тигры

Тип еды оказывал достоверное влияние на массу тигров; пол – не оказывал достоверного влияния на массу.

Factorial ANOVA Мы изучали земляных белок из Африки. Ловили их, взвешивали, измеряли зубы, голову. Определяли пол, возраст; хотим знать, как разные факторы влияют на массу белок. У нас МНОГО факторов, и они могут быть СВЯЗАНЫ. 1.Мы исследуем действие на выборку ДВУХ (трёх, четырёх) категориальных факторов ( independent variables ). 2.Факторы НЕЗАВИСИМЫ. 3.Зависимая переменная ОДНА.

1 год2 года3 года самцы самки , , У нас ТРИ нулевых гипотезы: среднее в ячейке среднее в столбце среднее в строке общее среднее и для каждой ячейки таблички: это гипотеза о наличии связи между факторами (она состоит у нас из 6-и гипотез, по числу ячеек) Factorial ANOVA

масса возраст 1 23 самцы самки масса возраст 1 23 самцы самки и пол, и возраст влияют на массу; взаимодействия факторов НЕТ возраст влияет на массу, пол – нет; взаимодействие ЕСТЬ если линии на рисунке ПАРАЛЛЕЛЬНЫ, взаимодействия факторов НЕТ. если НЕ ПАРАЛЛЕЛЬНЫ, взаимодействие ЕСТЬ. Factorial ANOVA (насколько они параллельны, решает ANOVA)

Factorial ANOVA Для каждой из гипотез рассчитывается своё значение F-статистики. Средняя по ячейкам внутригрупповая изменчивость Изменчивость между строками Изменчивость между столбцами «взаимодействие» факторов Наличие взаимодействия факторов: например, изменение массы тела с возрастов отличается у самцов и самок

Factorial ANOVA Возможные варианты графиков для таблицы 2х3 (пример про 3 типа лечения у опытных и неопытных врачей): Оба эффекта недостоверны, но есть взаимодействие факторов

эффекты не достоверны, взаимодействия нет 1 эффект достоверен, взаимодействия нет 2 эффекта достоверны, взаимодействия нет 1 эффект достоверен, взаимодействие есть

1 эффект достоверен, взаимодействия нет 1 эффект достоверен, взаимодействие есть Factorial ANOVA

даже здесь линии пересекаются

первые две гипотезы мы отвергаем: и пол, и возраст влияют на массу белок. третью не отвергаем: взаимодействия факторов НЕТ!

Factorial ANOVA

Multivariate factorial ANOVA У нас есть НЕСКОЛЬКО ЗАВИСИМЫХ переменных, или мы провели несколько повторных измерений, и проверяем действие НЕСКОЛЬКИХ ФАКТОРОВ. Повторные измерения: 1. масса до служителя; 2. со служителем; 3. с новой уборщицей. фактор 1: пол фактор 2: цвет