Анализ измерений Классификация методов Наследов А. Д, 2012.

Презентация:



Advertisements
Похожие презентации
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Advertisements

АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Основы корреляционного и регрессионного анализа. План лекции: 1.Способы изучения корреляционных зависимостей. 2.Определение коэффициента парной линейной.
Измерения в психологии Измерения в структуре психологического исследования Наследов А. Д, 2012.
Определение. Случайная величина имеет нормальное распределение вероятностей с параметрами и 2, если ее плотность распределения задается формулой:
Общая теория статистики Регрессионно- корреляционный анализ.
Статистическое моделирование экспериментального плана Лекция 3.
Элементы теории корреляции. План: I. Понятие корреляционной зависимости: 1) Коэффициент корелляции 2) Проверка гипотезы о значимости выборочного коэффициента.
Лекция по МОП ТЕМА: Измерение связи двух признаков.
ЛЕКЦИЯ 8 КОРРЕЛЯЦИОННО- РЕГРЕССИОННЫЙ АНАЛИЗ. МОДЕЛИРОВАНИЕ СВЯЗЕЙ.
22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г. Лекция 10. Однофакторный дисперсионный анализ Задача дисперсионного.
Статистическая проверка статистических гипотез.. Нулевая гипотеза - выдвинутая гипотеза. Конкурирующая гипотеза - - гипотеза, которая противоречит нулевой.
Математические методы оценки взаимосвязи
Измерение – это процедура, с помощью которой измеряемый объект сравнивается с некоторым эталоном и получает численное выражение в определенном масштабе.
Регрессионный анализ. Основная особенность регрессионного анализа: при его помощи можно получить конкретные сведения о том, какую форму и характер имеет.
Проверка гипотезы осуществляется с помощью критериев статистической оценки различий. ФОРМУЛИРОВАНИЕ ГИПОТЕЗЫ - систематизация предположения исследователя.
К ПРОБЛЕМЕ ОПРЕДЕЛЕНИЯ ВЕЛИЧИН АТРИБУТИВНЫХ И ТРУДНОДОСТУПНЫХ ПАРАМЕТРОВ В СОВОКУПНОСТИ РАЗНОТИПНЫХ СТАТИСТИЧЕСКИХ НАБЛЮДЕНИЙ Уткин Владимир Александрович.
Лекция 6 Линейная регрессия. Простая линейная регрессия.
СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ НТБ.
Транксрипт:

Анализ измерений Классификация методов Наследов А. Д, 2012

Группы методов анализа данных Статистический вывод: р-уровень значимости Описание: средние, корреляции и т.д. Измерение: Дизайн исследования и измерения АНАЛИЗЧАСТОтАНАЛИЗЧАСТОт КОРРЕЛЯЦИОННЫЙАНАЛИЗКОРРЕЛЯЦИОННЫЙАНАЛИЗ СРАВНИТЕЛЬНЫЙАНАЛИзСРАВНИТЕЛЬНЫЙАНАЛИз АНАЛИЗПАРНЫХ АНАЛИЗПАРНЫХ РАЗЛИЧИЙРАЗЛИЧИЙ Наследов А. Д, 2012

Номинальные измерения: анализ частот Распределение (критерии согласия) Распределение (критерии согласия) Таблица сопряженности Таблица сопряженности Анализ соответствий Анализ соответствий Логлинейный анализ таблиц сопряженности Логлинейный анализ таблиц сопряженности Наследов А. Д, 2012

Содержательная гипотеза: связь X и Y. Измерения: X и Y номинальные переменные Анализ классификации: сравнение эмпирического и теоретического (ожидаемого) распределений Анализ классификации: сравнение эмпирического и теоретического (ожидаемого) распределений Примеры: 1) Кто чаще обращается в службу знакомств: мужчины или женщины? 2) Зависит ли посещаемость занятий от дня недели? 3) Предпочитаются ли некоторые хобби чаще, чем другие? Анализ таблиц сопряженности : связь двух оснований классификации Анализ таблиц сопряженности : связь двух оснований классификации Примеры: 1) Отличаются ли юноши и девушки по предпочитаемым хобби? 2) Зависит ли предпочтение одного из пяти кандидатов на выборах от пола избирателя (от его района проживания и т.п.). 3) Повлияло ли суггестивное воздействие на предпочтение одной из двух альтернатив? Наследов А. Д, 2012

Сравнение эмпирического бинарного и теоретического распределений (2-х долей): критерий согласия 2 (Хи-квадрат, Chi-Square) и биномиальный критерий (с. 125) Р – число ячеек с эмпирическими частотами А если при том же соотношении N = 100? Наследов А. Д, 2012

Критерий согласия Хи-квадрат: более 2-х градаций (с. 129) Наследов А. Д, 2012

Критерий согласия Хи-квадрат (SPSS) Наследов А. Д, 2012

Таблицы сопряженности (с. 132) Наследов А. Д, 2012

Вычисление Хи-квадрат для таблиц сопряженности Теоретическая частота для ячейки ij: p

Таблицы сопряженности 2х2 (с. 135) Наследов А. Д, 2012

Таблица 2х2: независимые выборки (с. 136) ВАЖНО: ДАННЫЕ ПРЕДСТАВЛЯЮТ СОБОЙ ДВЕ ПЕРЕМЕННЫЕ! Критерий Хи-квадрат с поправкой на непрерывность: Теоретические частоты: Альтернатива: 2-сторонняя или 1-сторонняя? Допускается 1-сторонняя альтернатива! Наследов А. Д, 2012

Таблицы 2х2: повторные измерения бинарной переменной (с. 139) Критерий Хи-квадрат не применим! Критерий Мак-Нимара: p - ? Наследов А. Д, 2012

Сравнительный анализ Методы сравнения двух выборок Методы сравнения двух выборок Однофакторный ANOVA и непараметрические аналоги Однофакторный ANOVA и непараметрические аналоги Многофакторный ANOVA Многофакторный ANOVA Многомерный ANOVA Многомерный ANOVA Дискриминантный анализ Дискриминантный анализ ANOVA с повторными измерениями ANOVA с повторными измерениями Наследов А. Д, 2012

Классификация методов сравнения (с. 113) Если Y – метрическая переменная (распределение приблизительно нормальное), то применяются методы сравнения средних. Если Y – порядковая переменная (выбросы, асимметрия распределения…), или N < 20-25, то применяются ранговые методы (критерии) сравнения, предполагающие предварительное ранжирование Y. Наследов А. Д, 2012

Разработал Р.Фишер (1920-е гг.) – для анализа экспериментальных данных Основные понятия: Фактор (X - независимая переменная) – группирующая, номинальная, характеризуется уровнями (градациями). Уровень = группа (выборка). Зависимая переменная – (Y) – метрическая. Т.о. каждому уровню фактора соответствует среднее значение зависимой переменной. Межгрупповые факторы – уровням соответствуют независимые выборки. Внутригрупповые факторы – уровням соответствуют зависимые выборки. Фиксированные и случайные факторы. Ковариата – метрическая независимая переменная, «включаемая» в анализ наряду с фактором. Наследов А. Д, 2012

Принципиальная идея ANOVA В дисперсии зависимой переменной выделяется две составляющие: межгрупповая (D f ) – влияние фактора и внутригрупповая (D e ) – остальные причины. Чем сильнее различаются групповые средние, тем больше D f. Чем выше изменчивость внутри каждой группы, тем выше D e. Статистическая значимость определяется соотношением D f / D e. Величина эффекта: Наследов А. Д, 2012

Виды ANOVA и их специфические проблемы 1. Однофакторный ANOVA: множественные сравнения средних. 2. Многофакторный ANOVA: главные эффекты и взаимодействия факторов. 3. Многомерный ANOVA (MANOVA): применение многомерных критериев. 4. ANOVA с повторными измерениями: межгрупповые и внутригрупповые эффекты. 2 – 4: Общие Линейные Модели - ОЛМ (General Linear Models - GLM) Наследов А. Д, 2012

Коэффициент корреляции r - мера вероятностной связи двух количественных переменных Наследов А. Д, 2012

Связи: функциональные … Наследов А. Д, 2012

…и статистические Коэффициент корреляции r это количественная мера силы (абсолютное значение) и направления (знак) вероятностной взаимосвязи двух переменных. -1 r +1 Наследов А. Д, 2012

Регрессия y i истинное i-значение Y, оценка i-значения Y по значению x i при помощи линии (уравнения) регрессии, e i = – ошибка оценки Линия регрессии (прямая) аппроксимирует точки методом наименьших квадратов: Уравнение регрессии: Коэффициент регрессии: Свободный член: Наследов А. Д, 2012

Коэффициент детерминации Дисперсия оценок зависимой переменной Y – часть её дисперсии, обусловленная влиянием независимой переменной X: - коэффициент детерминации, доля дисперсии переменной Y (от 1), «объясняемая» влиянием переменной X. Наследов А. Д, 2012

Величина корреляции и сила связи 1) выбросы и асимметрии распределений Наследов А. Д, 2012

2) Нелинейные связи Наследов А. Д, 2012

3) Влияние «третьей» переменной Наследов А. Д, 2012

Частная корреляция Корреляция IQ (x) и длины стопы (y) но корреляция IQ с возрастом (z) а корреляция возраста и длины стопы Наследов А. Д, 2012

Ранговые корреляции Вычисляются после замены исходных значений рангами. r-Спирмена, аналог r-Пирсона, основан на разности рангов -Кендалла, вероятностный, основан на подсчете совпадений и инверсий в парах наблюдений.-Кендалла, вероятностный, основан на подсчете совпадений и инверсий в парах наблюдений. Наследов А. Д, 2012

Оцените величину корреляции без вычислений 1) 2)3) 4)5)6) 1 и 2 – чему равен -сопряженности? r-Пирсона? ранговая корреляция? – чему равен r-Пирсона? ранговая корреляция? Варианты ответов: а) = 1; б) = -1; в) отрицательный, но > -1; г) положительный, но < 1. Наследов А. Д, 2012

Последовательность интерпретации корреляций 1. Статистическая значимость (p-уровень). 2. Знак (направление). 3. Величина (по r-квадрат). Числовые показатели: r = …; N = …; p = …. ПРИМЕР. Для проверки гипотезы … применялась корреляция Пирсона. Обнаружена статистически достоверная отрицательная корреляция показателей тревожности и креативности (r = -0,435; N = 32; p = 0,035): чем выше тревожность, тем ниже креативность. Наследов А. Д, 2012

Корреляционная матрица Наследов А. Д, 2012

Поправка Benjamini & Hochberg (1995) для семейства n гипотез 1) Упорядочиваем все p от min до max (i – текущий номер p в ряду); 2) Для каждого i вычисляем: p*n/i = p корр. ; 3) Если p корр. α – результат статистически достоверен! Наследов А. Д, 2012

Корреляционный анализ Корреляционные матрицы, плеяды, частная корреляция и анализ криволинейности Корреляционные матрицы, плеяды, частная корреляция и анализ криволинейности Множественный регрессионный Множественный регрессионный анализ анализ Факторный анализ Факторный анализ Структурное моделирование Структурное моделирование Наследов А. Д, 2012