ОСНОВЫ ДИСПЕРСИОННОГО АНАЛИЗА Лекция 25
План лекции: Виды дисперсионного анализа и его характеристики Факторная и случайная дисперсия Анализ двухфакторных комплексов Заключение. Роль математики в профессии клинического психолога.
Виды дисперсионного анализа и его характеристики Раздел статистики, изучающий влияние факторов на изменчивость случайной величины, называется дисперсионным анализом. ДИСПЕРСИОННЫЙ АНАЛИЗ МНОГОФАКТОРНЫЙ ОДНОФАКТОРНЫЙ
Условия: изучаемые факторы должны быть независимыми; распределение выборочных данных должно соответствовать нормальному распределению или сводится к нему путем соответствующих преобразований х – =А+е, где – средняя арифметическая генеральной совокупности; х – конкретное значение переменной; А – доля отклонения переменной, связанная с влиянием данного конкретного фактора; е – остаточная часть отклонения, не объяснимая влиянием данного фактора.
Признаки, изменяющиеся под влиянием тех или иных причин, называются результативными. Сами причины называются факторами. Конкретное числовое значение фактора называется градацией (или уровнем) фактора. Степень изменения всех признаков и отклонение их от средней арифметической ряда характеризуется дисперсией D(х):
D общ = D факт + D случ - критерий Фишера Нулевая гипотеза: регулируемый фактор не оказывает систематического действия на признак. Наблюдаемые различия между групповыми средними случайны.
Нулевая гипотеза Если F>Fкр (при вероятности Р=0,95), то влияние фактора существенно. Если F
Этапы дисперсионного анализа: Представить данные в виде таблицы. Номер наблюдения (j) Уровни фактора(i) Ia 1x 11 x 21 x 31 x i1 x a1 2x 12 x 22 x 32 x i2 x a2... jx 1j x 2j x 3j x ij x aj nx 1n x 2n x 3n x in x an Суммы по группам: x 1 x 2 x 3 x i x a Средние по группам: i – индекс уровня фактора (от 1 до а); j – индекс варианты (от 1 до n).
Общее варьирование всех вариант (х ij ), независимо от того, в какой группе они находятся, вокруг общей средней характеризуется дисперсией D общ. где N=an– число всех вариант; df общ. = N–1 – число степеней свободы.
Варьирование групповых средних или средних каждого уровня данного изучаемого фактора вокруг общей средней, характеризуется факторной дисперсией D факт. df факт = a – 1– число степеней свободы. n i – среднее число вариант в каждой группе, n – если число вариант в группах одинаково.
Варьирование вариант х ij внутри каждой группы вокруг каждой групповой средней характеризует случайная или остаточная дисперсия D случ. df случ =N - a – число степеней свободы. Причем: (N – a) + (a – 1) = N – 1
Формулы для однофакторного дисперсионного анализа Источник варьирования Сумма квадратов SS (числитель) Число степеней свободы df (знаменатель) Формулы для дисперсии MS Общее (все варианты) N – 1 Групповые средние (фактор А) a –1 Варианты внутри групп (случайные отклонения) N – a
Пример. Провести однофакторный дисперсионный анализ для выяснения влияния реагентов на синтез лекарственного препарата (выход-усл.ед). F1F1 F2F2 F3F3 F4F4 x 1j x 2j x 3j x 4j = 43,2567,75 Предположения: В генеральной совокупности выборки подчиняются нормальному закону распределения Выборки однородны (дисперсии равны)
F1F1 F2F2 F3F3 F4F4 x 1j x 2j x 3j x 4j =43,2567,75 = = F1F1 F2F2 F3F3 F4F4 x 2 1j x 2 2j x 2 3j x 2 4j Таблица 1 Таблица 2
Вычисления: Сумма квадратов SS общ для общей вариации: Сумма квадратов SS факт для вариации между группами: Средний квадрат, характеризующий факторную дисперсию MS факт.: N x x n SS ij iфак 5,16 3,49.5 фак df SS МS
Сумма квадратов SS случ для вариации внутри групп: SS сл =SS общ – SS фак = 59 – 49,5=9,5 т.к MS случ < MS фак, а F табл =3,49 для Р=0,95 и df сл =12 и df фак =3 ВЛИЯНИЕ ФАКТОРА ДОСТОВЕРНО!
Сила влияния фактора Сила влияния фактора определяется: где В нашем случае... 2 случфакт А DD D
Вывод: 83% от действия всех факторов приходится на вид реагента, 17% – приходится на долю случайных факторов. Для выявления наиболее эффективного реагента построим график
Достоверность влияния фактора Дисперсионный анализ позволяет установить, существуют ли достоверные различия между отдельными уровнями фактора. n – число вариант в каждой группе. Отношение разницы d к ее ошибке S d, т.е. t=, должно быть таким, чтобы оно гарантировало достоверность не менее чем при Р=0,95.
Коэффициент Q, рассчитан для разного количества групп а и степеней свободы df случ. d 12 =4-3,25=0,7; d 23 =6-3,25=2,75; Q=4,2 для df случ =12 и а=4; t 12 < Q, разница не достоверна! t 23 > Q, разница достоверна!
Вывод: Вид реагента достоверно влияет на выход лекарственного препарата. Наибольшую эффективность имеет фактор (реагент), градация которого равна F 4.
Двухфакторный дисперсионный анализ: содержание фосфора (мг/100 г) в органах животных сердцелегкиепеченьпочкивсего Ж1 86,7102,7204,6184,6576,6 Ж2 88,4108,1213,2183,4593,1 Ж3 81,299,8201,1179,0561,1 всего 256,3310,6618,9547,01732,8
Нулевая гипотеза: Компонента дисперсии с.к.с.с.Ср.к. Строки128,375264,188 Столбцы31253, ,7 Остаточная30,36565,061 полная31411,8411- У животных нет различия в уровне содержания фосфора в органах Нулевая гипотеза отклоняется
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА: Основная литература: Павлушков И.В. Основы высшей математики и математической статистики. М., ГЭОТАР-Медиа, 2005, с Учебно–методические пособия: Шапиро Л.А., Шилина Н.Г. Руководство к практическим занятиям по медицинской и биологической статистике Красноярск: ООО «Поликом». – 2003.