1 Занятие 5 Дисперсионный анализ ANOVA (продолжение)
2 Сложная «омнибусная» гипотеза АНОВЫ: Похожа на стрельбу из дробовика: не нужно особенно точно целиться, непонятно, какая дробинка попала в какую мишень – какая из маленьких гипотез не верна. Что делать, если мы изначально хотим проверить не все эти гипотезы? Хотим выстрелить из винтовки в строго определённую мишень?
3 a priori Tests = Planned comparisons = анализ контрастов (вместо ANOVA) Вся мощность теста направляется на одну гипотезу, остальные игнорируются. ЗАРАНЕЕ Важно: то, какую гипотезу тестировать, выбирают ЗАРАНЕЕ, до проведения какого-либо анализа! В идеале – ещё при постановке исследования. Частный случай а priori теста – двухвыборочный t- критерий Стьюдента. Процедура тестирования у а priori тестов – почти как у t- критерия Стьюдента.
4 анализ контрастов Обычно используются для тестирования КОМПЛЕКСНЫХ (а не парных) гипотез. Dr. J разработал новую диету и собирается протестировать её эффективность. Из 20 добровольцев группа 1 (n=5) соблюдает новую диету; группа 2 (n=5) занимается на тренажёре; группа 3 (n=5) занимается аэробикой; группа 4 (n=5) бегает по утрам.
5 Зависимая переменная – число грамм, на которое изменилась масса тела добровольцев за 3 месяца. Можно было бы провести ANOVA затем апостериорный тест, но нас интересует лишь сравнение диеты Dr. J с разными видами физических упражнений. анализ контрастов
6 «Контраст» = «сравнение» (contrast, comparison) – линейная комбинация средних значений. Коэффициенты сравнения – константы, на которые умножены средние. В сумме = нулю: анализ контрастов Другая формулировка Н 0 : «популяционное сравнение» = 0
7 Статистика = параметр выборки – параметр популяции стандартная ошибка параметра выборки анализ контрастов Статистика = выборочное сравнение - 0 стандартная ошибка выборочного сравнения Она имеет t-распределение
8 Ещё один пример: У нас 4 группы тигров, их кормят: овощами; фруктами; рыбой; мясом. Вопрос: отличается ли масса тигров, питающихся животной и растительной едой? анализ контрастов
9
10 мы отвергаем Н 0. Масса тигров, питавшихся растительной и животной едой, различалась
11 Planned comparisons (анализ контрастов): МОЩНОСТЬ такого теста существенно ВЫШЕ, чем последовательное использование АНОВЫ и методов множественного сравнения! Поэтому, если исследователя интересует конкретное сравнение, лучше использовать анализ контрастов. (и это лучше, чем просто объединить выборки и сравнить т-тестом, так как учитываются различия между группами по одну сторону знака «=») анализ контрастов
12 Factorial ANOVA One-way ANOVA: Одна зависимая переменная, variable (масса тела); Одна группирующая = фактор (тип пищи). Одна нулевая гипотеза Что делать, если нужно проанализировать влияние двух (трёх и т.д.) факторов на зависимую переменную?
13 Например, Мы изучаем влияние размножения на массу тела у самок африканских земляных белок разного возраста. Зависимая переменная – масса тела. Фактор A – наличие выводка ( 1. есть; 2. нет ) Фактор B – возраст (1 год, 2 года, 3 года и старше). Factorial ANOVA Фактора ДВА, наш выбор - two-way ANOVA
14 Получилось a x b = 2 х 3 = 6 групп белок – 6 ячеек (cells) в таблице. Заметим, что во ВСЕХ ячейках должны выполняться условия соответствия нормальному распределению и равенства дисперсий. 1 год2 года3 года без выводка с выводком , , Factorial ANOVA Пусть в каждой ячейке по n наблюдений.
15 Factorial ANOVA 1 год2 года3 года без выводка с выводком , , Формулируем 3 нулевые гипотезы (и 3 альтернативные) : Н 0 : наличие выводка не влияет на массу самки (μ б/выводка =μ с выводком ) Н 0 : возраст самки не влияет на массу самки ( ) Н 0 : нет взаимодействия между факторами.
16 Factorial ANOVA
17 Factorial ANOVA Дисперсия между ячейками не равна сумме изменчивостей между уровнями фактора А и уровнями фактора В. Эта разница определяется взаимодействием факторов: df interaction = df factorA x df factorB
18 Factorial ANOVA MS error, cредняя по ячейкам внутригрупповая изменчивость Изменчивость между строками Изменчивость между столбцами «взаимодействие» факторов Достоверное взаимодействие факторов говорит о том, что различия между уровнями одного из факторов неодинаковы для всех уровней другого фактора. То есть, для каждой гипотезы мы рассчитываем своё F- значение и сравниваем его со своим критическим уровнем.
19 Factorial ANOVA ANOVA table
Масса тела без выводка с выводком Примерный вид графического представления: Масса тела Factorial ANOVA возраст
21 масса возраст 1 23 без выводка с выводком масса возраст 1 23 и размножение, и возраст влияют на массу; взаимодействия факторов НЕТ возраст влияет на массу, размножение – нет; взаимодействие ЕСТЬ если линии на рисунке ПАРАЛЛЕЛЬНЫ, взаимодействия факторов НЕТ. если НЕ ПАРАЛЛЕЛЬНЫ, взаимодействие ЕСТЬ. Factorial ANOVA (насколько они параллельны, решает ANOVA) без выводка с выводком
22 Factorial ANOVA Возможные варианты графиков для таблицы 2х3 (пример про 3 типа лечения у опытных и неопытных врачей): Оба эффекта недостоверны, но есть взаимодействие факторов
23 эффекты не достоверны, взаимодействия нет 1 эффект достоверен, взаимодействия нет 2 эффекта достоверны, взаимодействия нет 1 эффект достоверен, взаимодействие есть
24 1 эффект достоверен, взаимодействия нет 1 эффект достоверен, взаимодействие есть Factorial ANOVA
25 Factorial ANOVA Как определить на глаз влияние каждого из факторов
26 Factorial ANOVA Взаимодействие между факторами корреляция между факторами!!! 1 год2 года3 года без выводка с 1-м выводком с 2-мя выводками год2 года3 года без выводка с 1-м выводком с 2-мя выводками Взаимодействия факторов НЕТ, при этом между ними есть корреляция Взаимодействие факторов ЕСТЬ У старых самок участие в размножении по-другому сказывается на физическом состоянии, чем у молодых
27 Factorial ANOVA Для разных моделей АНОВы по-разному рассчитываются статистики F.
28 Factorial ANOVA Апостериорные (post hoc) тесты для двухфакторной АНОВы 1.Не используются для Модели 2 (а именно, для random factors); 2.Если взаимодействие между факторами достоверно, бессмысленно проводить пост хок тесты для каждого из факторов по отдельности, нужно сравнивать между собой ячейки.
29 Частный случай Factorial ANOVA - Main effect ANOVA 1.Мы исследуем действие на выборку ДВУХ (трёх, четырёх) категориальных факторов ( independent variables ). 2.Зависимая переменная ОДНА. 3.Факторы НЕЗАВИСИМЫ (то есть, мы откуда-то заранее это уже знаем). Factorial ANOVA Мощность такого теста выше, чем у Factorial ANOVA, но в независимости факторов надо как-то убедиться.
30 Main effect ANOVA Здесь тигры разного пола едят разную пищу
31 Тип еды оказывал достоверное влияние на массу тигров; пол – не оказывал достоверного влияния на массу.
32 даже здесь линии пересекаются Factorial ANOVA суслики
33
34 первые две гипотезы мы отвергаем: и пол, и возраст влияют на массу белок. третью не отвергаем: взаимодействия факторов НЕТ
35 Factorial ANOVA Если факторов не 2 а много, а зависимая переменная ОДНА, анализ называется Multiway ANOVA В этом случае становится много гипотез о взаимодействии факторов (для 3-х факторов 4 гипотезы об их взаимодействии). Не рекомендуется исследовать действие более 4-х факторов, так как затрудняется интерпретация результатов. Расчёт статистик в таких сложных случаях производится с использованием принципов регрессионного анализа.
36 Repeated measures ANOVA Сравнение связанных групп Преподаватель решил узнать, как у его студентов продолжительность занятий зависит от дня недели (он поделил время на 15-минутные блоки).
37 Repeated measures ANOVA Представим, что эти группы независимы и проведём ANOVA. Различия между ними недостоверны. Почему? Из-за большой внутригрупповой изменчивости? Студенты по усердию сильно различаются между собой!\ Как элиминировать межиндивидуальные различия (between-subjects effect)?
38 Repeated measures ANOVA Вычесть из каждого измерения среднее значение для каждого студента! Вот теперь измерения стали независимы («исправленные»), и дальше можно сравнить их ANOVA ( от обычной ANOVA отличается число степеней свободы внутри измерений – )
39 Repeated measures ANOVA Н 1 : нулевая гипотеза не верна F = между оценка дисперсии между группами внутри оценка дисперсии внутри групп Обычная ANOVA: Repeated measures ANOVA: F = оценка дисперсии между измерениями «ошибка» внутри исправленных измерений Изменчивость: 1.Между измерениями; 2.Между особями ( получается из средних значений для особей); 3.«ошибка» ( внутри «исправленных» измерений ) – error, residual
40 Repeated measures ANOVA Теперь Н 0 будет отвергнута, т.е., преподаватель сможет утверждать, что усердие его учеников зависит от дня недели. Мощность дисперсионного анализа для повторных измерений выше, чем обыкновенного дисперсионного анализа (в случае связанных выборок).
41 Другой пример: к тиграм-самцам пришёл новый служитель, а потом – новая уборщица. И возможно, они стали по-другому питаться. Мы хотим узнать, менялась ли их масса. служителямассу тигров-самцов Мы анализируем влияние служителя на массу тигров-самцов. Зависимая переменная Зависимая переменная – масса. Для каждой особи по 3 измерения (3 столбика в таблице). Repeated measures ANOVA
42 Каждый тигр ТРИ раза участвует в наблюдениях. ДО СЛУЖ УБОР 1 тигр тигр тигр тигр тигр тигр F = оценка дисперсии между измерениями «ошибка»
43 В Statistica каждый столбик измерений называется dependent variable
44 между наблюдениями Отвергаем Н 0 : Масса тигров в среднем достоверно изменялась после прихода нового служителя и новой уборщицы. «ошибка» - внутри «исправленных» наблюдений изменчивость между особями
45 Repeated measures ANOVA Отвергаем Н 0 : Масса тигров в среднем достоверно изменилась после прихода нового служителя и новой уборщицы. А теперь можно провести апостериорный (post-hoc) тест. И выяснить, кто и как повлиял на массу тигров.
46 Nested ANOVA Factorial ANOVA: в таблице были представлены все возможные комбинации факторов. Но существуют варианты исследований, которые этого не предполагают. При этом, группы, образованные фактором (группирующей переменной) делятся на подгруппы какой-то другой переменной, значения которой разные для разных групп. Nested = hierarchical design
47 Nested ANOVA Например, представим однофакторную АНОВу, в которой нас интересует действие только одного фактора. Но в силу обстоятельств данные в группах не гомогенны, они делятся на подгруппы каким-то (обычно случайным, random) фактором. (возможно и дальнейшее деление подгрупп на «под-подгруппы» и т.д., т.е., иерархическая классификация) 5 образцов меха с каждого зверька
48 Нас интересует два вопроса: 1) влияет ли основной фактор (цвет меха) на значения переменной; 2) влияет ли случайный фактор (личность крысы) на значения переменной. Взаимодействие факторов обычно не проверяется. Тестируются две гипотезы. Nested ANOVA F= MS subgroups within groups MS error within subgroups F= MS between groups MS subgroups witin groups Проверка действия случайного фактора Проверка действия основного фактора
49 Nested ANOVA Фактор В – фиксированный, фактор С - случайный
50 Nested ANOVA Фактор В – фиксированный, фактор С - случайный
51 Multivariate factorial ANOVA = MANOVA Всё это время мы работали с ОДНОЙ зависимой переменной. что делать в случае, если ЗАВИСИМЫХ переменных две или больше? Например, нам интересно, как вид пищи (фактор) влияет на массу тигров и длину тела тигров (две зависимые переменные).
52 MANOVA Multivariate ANOVA = MANOVA многомерный дисперсионный анализ Multiway ANOVA Многофакторный дисперсионный анализ Предполагается многомерное нормальное распределение.
53 MANOVA Почему бы не провести отдельные дисперсионные анализы для каждой из переменных? 1.Вероятность ошибки 1-го рода превысит 5%; 2.Не будет учтена возможная корреляция между переменными; 3.Средние различия групп по каждой переменной могут быть малы, но по всем переменным совместно различия могут быть очевидными.
54 MANOVA Нулевая гипотеза одна: о равенстве средних значений по одной из переменных И по другой переменной (и по третьей, четвёртой и т.д.) Существует несколько вариантов статистики критерия для MANOVA. Все они считаются на основе: SS total, SS between groups, SS within groups и сумм «векторных произведений» (это понятие уже из регрессионного анализа). В Statistica – Wilks lambda λ. Чем она меньше, тем вероятнее отвергнуть Н 0. Это мера изменчивости, которая не объясняется действием факторов.
55 MANOVA
56 MANOVA
57 1.Для MANOVA особенно важно, чтобы измерения были случайными и не зависели друг от друга. 2.Многомерное нормальное распределение 3.Гомогенность дисперсий в группах 4.Корреляции между зависимыми переменными должны быть одинаковыми между группами 5.Чем больше число переменных, тем меньше мощность теста, т.е., для большого числа переменных необходимы большие выборки 6.После проведения MANOVA допустимо проводить просто ANOVA с последующими пост-хок тестами. MANOVA Требования и рекомендации:
58 1. крыс обучают ставить лесенку и доставать корм. В разных группах крыс используют разный корм: сыр, морковь и мясо. Затем часть крыс помещают в знакомую среду, а часть – в новые условия. Исследователь хочет узнать, как зависит время прохождения лабиринта в разных группах и условиях. Н 0 ? Тип статистического анализа? Статистика критерия? 2. мы хотим изучить, как уровень глюкозы в крови у кошек зависит от времени суток. У нас есть 10 особей, мы берём у них кровь 3 раза в день. Н 0 ? Тип статистического анализа? Статистика критерия? 3. телефонная компания поставила новые телефоны в аэропорты и размышляет, стоит ли оборудовать места для разговоров креслом – не увеличит ли это продолжительность разговоров. В 15 местах она поставила кресла, в 15-и местах говорить можно только стоя. Как проверить влияет ли наличие кресла на длительность разговора? Н 0 ? Тип статистического анализа? Статистика критерия? Задания