Математические методы в гуманитарных исследованиях Троценко Алла Анатольевна, к.биол.н., доцент кафедры ФКСиБЖД
1.2 Основные понятия Данные в статистике – это основные элементы, подлежащие анализу.
Продолжение 1.2 Количественные данные – это данные, получаемые при измерениях (например, данные о весе, размерах, температуре, времени, результатах тестирования и т.п.). Количественные данные можно распределить по шкале с равными интервалами.
Продолжение 1.2 Качественные данные представляют собой какие-то свойства элементов выборки или популяции. Их нельзя измерить, и единственной их количественной оценкой служит частота встречаемости.
Продолжение 1.2 Уровень значимости – это вероятность того, что различия сочли существенными, а они случайны. В психологии приняты 5%-ый и 1%-ый уровни значимости.
Тема 2. Распределение признака. Параметры распределения
Содержание темы Нормальное распределение. 2.2 Оценка дисперсии. 2.3 Среднее квадратическое отклонение. 2.4 Показатель асимметрии.
2.1 Нормальное распределение Распределением признака называется закономерность встречаемости разных его значений
Продолжение 2.1 Кривая нормального распределения
Продолжение 2.1 Нормальное распределение выражается следующей формулой:
2.2 Оценка дисперсии Дисперсия показывает разброс значений признака относительно своего среднего арифметического значения, то есть насколько плотно значения признака группируются вокруг
Продолжение 2.2 Формула дисперсии
Продолжение 2.2 Чем больше разброс, тем сильнее варьируются результаты испытуемых в данной группе, тем больше индивидуальные различия между испытуемыми
Продолжение 2.3 Формула среднего квадратического отклонения:
2.4 Показатель асимметрии Асимметрия характеризует степень асимметричности распределения
Продолжение 2.4 Мера асимметрии – коэффициент асимметрии (As), рассчитывается по формуле:
Тема 3. Критерии различий
Содержание темы Статистические гипотезы 3.2 Статистические критерии
3.1 Статистические гипотезы Статистическая гипотеза – утверждение в отношении неизвестного параметра, сформулированное на языке математической статистики.
Продолжение 3.1 Задачей статистической проверки гипотез в исследованиях является репрезентативное выборочное описание свойств генеральных совокупностей.
Продолжение 3.1 Гипотезы различают простые и сложные: простая гипотеза полностью задает распределение вероятностей; сложная гипотеза указывает не одно распределение, а некоторое множество распределений.
Продолжение 3.1 Статистические гипотезы подразделяются на нулевые и альтернативные.
Продолжение 3.1 Нулевая гипотеза – это гипотеза об отсутствии различий. Она обозначается как Н 0 и называется нулевой, потому что содержит 0.
Продолжение 3.1 Альтернативная гипотеза – это гипотеза о значимости различий. Обозначается как Н 1.
Продолжение 3.1 Альтернативная гипотеза – это то, что мы хотим опровергнуть, поэтому её часто называют экспериментальной гипотезой.
3.2 Статистические критерии Статистический критерий – это решающее правило, обеспечивающее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью.
Тема 4. Критерии Манна-Уитни, Крускала-Уоллиса, тенденций Джонкира
Содержание темы Критерий Манна-Уитни 4.2 Критерий Крускала-Уоллиса 4.3 Критерий тенденций Джонкира
4.1 Критерий Манна-Уитни Назначение критерия Манна-Уитни: Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного.
Продолжение 4.1 Ограничения критерия Манна-Уитни: Критерий позволяет выявлять различия между малыми выборками, когда n 1, n 2 >3 или n 1 =2, n 2 >5
Продолжение 4.1 Гипотезы критерия Манна-Уитни: Н0: Уровень признака в группе 2 не ниже уровня признака в группе 1.
Продолжение 4.1 Гипотезы критерия Манна-Уитни: Н1 : Уровень признака в группе 2 ниже уровня признака в группе 1.
4.2 Критерий Крускала-Уоллиса Назначение критерия Крускала-Уоллиса: Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.
Продолжение 4.2 Критерий Крускала-Уоллиса позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.
Продолжение 4.2 Ограничение критерия Крускала- Уоллиса: Минимальный объем выборок составляет 4:2:2. При объеме 3:2:2 различия устанавливаются лишь на низшем уровне значимости (р < 0,05).
Продолжение 4.2 Гипотезы критерия Крускала-Уоллиса: Но : Между выборками 1,2,3 и т.д. существуют лишь случайные различия по уровню исследуемого признака.
Продолжение 4.2 Гипотезы критерия Крускала-Уоллиса: Н1 : Между выборками 1,2,3 и т.д. существуют неслучайные различия по уровню исследуемого признака.
4.3 Критерий тенденций Джонкира Назначение критерия тенденций Джонкира: Критерий предназначен для выявления тенденции изменения признака при переходе от выборки к выборке при сопоставлении трех и более выборок
Продолжение 4.3 Назначение критерия тенденций Джонкира: критерий позволяет упорядочить обследованные выборки по какому-либо признаку
Продолжение 4.3 Ограничения критерия тенденций Джонкира: В каждой выборке должно быть одинаковое число наблюдений. 1) Нижний порог: не менее 3 выборок и не менее 2 наблюдений в каждой выборке.
Продолжение 4.3 Ограничения критерия тенденций Джонкира: 2) Верхний порог: табличные ограничения, не более 6 выборок и не более 10 наблюдений в каждой выборке.
Продолжение 4.3 Гипотезы критерия тенденций Джонкира: Но : Тенденция возрастания значений признака при переходе от выборки к выборке является случайной.
Продолжение 4.3 Гипотезы критерия тенденций Джонкира: Н1: Тенденция возрастания значений признака при переходе от выборки к выборке не является случайной.
Тема 5. Критерии изменений
Содержание темы Временной, ситуативный и умозрительный сдвиги. 5.2 Структурные сдвиги. 5.3 Критерии оценки статистической достоверности.
5.1 Временной, ситуативный и умозрительный сдвиги Сдвиг – это разность между вторым и первым замерами
Продолжение 5.1 Сначала вычисляются разности отдельно для каждой из групп, затем производят сопоставление двух рядов разностей, полученных в разных группах
Продолжение 5.1 Временной сдвиг - это сопоставление показателей, полученный у одних и тех же испытуемых по одним и тем же методикам, но в разное время
Продолжение 5.1 Ситуационный сдвиг - это сопоставление показателей, полученных по одним и тем же методикам, но в разных условиях измерения
Продолжение 5.1 умозрительный сдвиг - это сопоставление показателей измеренных в обычных и воображаемых условиях
5.2 Структурные сдвиги Структурный сдвиг - это сопоставление между собой разных показателей одних и тех же испытуемых, замеренных в одних и тех же единицах, по одной и той же шкале
Продолжение 5.2 Для оценки достоверности структурного сдвига при двух замерах используют: 1) критерий знаков; 2) критерий Вилкоксона
Продолжение 5.2 Для оценки достоверности структурного сдвига при трех и более замерах используют: 1) критерий тенденций Пейджа; 2) критерий Фридмана
5.3 Критерии оценки статистической достоверности Для оценки достоверности временных, ситуационных и умозрительных сдвигов при двух замерах используют: 1) критерий знаков; 2) критерий Вилкоксона
Продолжение 5.3 Для оценки достоверности временных, ситуационных и умозрительных сдвигов при трех и более замерах используют: 1) критерий тенденций Пейджа; 2) критерий Фридмана
Продолжение 5.3 Для оценки достоверности сдвигов под влиянием экспериментальных воздействий при отсутствии контрольной группы для двух замеров используют: 1) критерий знаков; 2) критерий Вилкоксона
Продолжение 5.3 Для оценки достоверности сдвигов под влиянием экспериментальных воздействий при отсутствии контрольной группы для трех и более замеров используют: 1) критерий тенденций Пейджа; 2) критерий Фридмана
Продолжение 5.3 Для оценки достоверности сдвигов под влиянием экспериментальных воздействий при наличии контрольной группы для двух замеров используют: 1) критерий знаков; 2) критерий Вилкоксона 3) критерий Манна-Уитни
Продолжение 5.3 Для оценки достоверности сдвигов под влиянием экспериментальных воздействий при наличии контрольной группы для трех и более замеров используют: 1) критерий тенденций Пейджа; 2) критерий Фридмана
Продолжение 6.1 Алгоритм расчета критерия знаков: Шаг 1. Подсчитать количество нулевых реакций и исключить их из рассмотрения. В результате общее количество n уменьшится на количество n уменьшиться на количество нулевых реакций.
Продолжение 6.1 Алгоритм расчета критерия знаков: Шаг 2. Определить преобладающее направление изменений и считать сдвиги в преобладающем направлении "типичными".
Продолжение 6.1 Алгоритм расчета критерия знаков: Шаг 3. Определить количество "нетипичных'" сдвигов. Считать это число эмпирическим значением G.
Продолжение 6.1 Алгоритм расчета критерия знаков: Шаг 4. Сравнить эмпирическое и критическое значения критерия.
Продолжение 6.2 Критерий Вилкоксона позволяет установить не только направленность изменений, но и их выраженность.
Продолжение 6.2 С помощью Критерий Вилкоксона определяется, является ли сдвиг показателей в каком-то одном направления более интенсивным, чем в другом.
Продолжение 6.2 Ограничения критерия Вилкоксона: Минимальное количество испытуемых, прошедших измерения в двух условиях, - 5 человек; Максимальное количество - 50 человек (табличное ограничение).
Продолжение 6.2 Гипотезы критерия Вилкоксона: Но: Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.
Продолжение 6.2 Гипотезы критерия Вилкоксона: Н1: Интенсивность сдвигов в типичном направлении превосходит интенсивность сдвигов в нетипичном направлении.
Тема 7. Критерии Фридмана и тенденций Пейджа
Содержание темы Критерий Фридмана 7.2 Критерий тенденций Пейджа
7.1 Критерий Фридмана Критерий применяется для сопоставления показателей, измеренных в трех или более условиях на одной и той же выборке испытуемых.
Продолжение 7.1 Критерий позволяет установить, что величины показателей от условия к условию изменяются, но при этом не указывает на направление изменений.
Продолжение 7.1 Ограничение критерия Фридмана: Нижний порог- не менее 2-х испытуемых, каждый из которых прошел не менее 3-х замеров.
Продолжение 7.1 При больших количествах испытуемых или условий полученные эмпирические значения, сопоставляются с критическими значениями.
Продолжение 7.1 Гипотезы критерия Фридмана: Но: Между показателями, полученными (измеренными) в разных условиях, существуют лишь случайные различия.
Продолжение 7.1 Гипотезы критерия Фридмана: Н1 : Между показателями, полученными в разных условиях, существуют неслучайные различия.
7.2 Критерий тенденций Пейджа Критерий Пейджа применяется для сопоставления показателей, измеренных в трех и более условиях на одной и той же выборке испытуемых
Продолжение 7.2 Критерий позволяет выявить тенденции в изменении величин признака при переходе от условия к условию, он не только констатирует различия, но и указывает на направления изменений.
Продолжение 7.2 Ограничения критерия тенденций Пейджа: Нижний порог - 2 испытуемых, каждый из которых прошел не менее 3-х замеров в разных условиях. Верхний порог - 12 испытуемых и 6 условий.
Продолжение 7.2 Гипотезы критерия тенденций Пейджа: Но: Увеличение индивидуальных показателей при переходе от первого условия ко второму, а затем к третьему и далее, случайно.
Продолжение 7.2 Гипотезы критерия тенденций Пейджа: Н1: Увеличение индивидуальных показателей при переходе от первого условия ко второму, а затем к третьему и далее, не случайно.
Тема 8. Критерии согласия распределений
Содержание темы Обоснование задачи сравнения распределений признака 8.2 Случаи применения критерия Пирсона и критерия Колмогорова-Смирнова
8.1 Обоснование задачи сравнения распределений признака Распределения могут различаться по средним, дисперсиям, асимметрии, эксцессу и по сочетаниям этих параметров
Продолжение 8.1 Анализ реально получаемых в исследованиях распределений может позволить нам подтвердить или опровергнуть теоретические предположения
Продолжение 8.1 Сопоставлять полученное эмпирическое распределение с теоретическим распределением лучше с помощью машинных программ обработки данных, особенно при больших объемах выборки
Продолжение 8.1 В практических целях эмпирические распределения должны проверяться на «нормальность» в тех случаях, когда мы намерены использовать параметрические методы и критерии
8.2 Случаи применения критерия Пирсона и критерия Колмогорова-Смирнова Традиционные для математической статистики критерии определения расхождения или согласия распределений – это метод Пирсона и критерий Колмогорова-Смирнова
Продолжение 8.2 Возможность этих критериев в полной мере проявляются на больших выборках (больше 30 испытуемых)
Продолжение 8.2 Критерии незаменимы при решении задач в следующих случаях:
Продолжение В задачах, требующих доказательства неслучайности предпочтений в выборе из нескольких альтернатив
Продолжение В задачах, требующих обнаружения точки максимального расхождения между двумя распределениями, которая затем используется для перегруппировки данных
Тема 9. Критерии Пирсона и Колмогорова-Смирнова
Содержание темы Критерий Пирсона 9.2 Критерий Колмогорова-Смирнова
9.1 Критерий Пирсона Критерий отвечает на вопрос с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.
Продолжение 9.1 Критерий Пирсона применяется для сопоставления эмпирического распределения признака с теоретическим - равномерным, нормальным или каким-то иным.
Продолжение 9.1 Критерий Пирсона применяется для сопоставления двух, трех или более эмпирических распределений одного и того же признака.
Продолжение 9.1 Ограничения критерия Пирсона: Точность критерия повышается при больших объемах выборки п, поэтому объем выборки должен быть достаточно большим: п > 30
Продолжение 9.1 Первый вариант гипотез критерия Пирсона: Но: Полученное эмпирическое распределение признака не отличается от теоретического (например равномерного) распределения.
Продолжение 9.1 Первый вариант гипотез критерия Пирсона: Н1 : Полученное эмпирическое распределение признака отличается от теоретического распределения.
Продолжение 9.1 Второй вариант гипотез критерия Пирсона: Но: Эмпирическое распределение первое не отличается от эмпирического распределения второго.
Продолжение 9.1 Второй вариант гипотез критерия Пирсона: Н1: Эмпирическое распределение первое отличается от эмпирического распределения второго.
Продолжение 9.1 Третий вариант гипотез критерия Пирсона: Н0 : Эмпирические распределения 1,2,3,… не различаются между собой. Н1 : Эмпирические распределения 1,2.3,… различаются между собой.
9.2 Критерий Колмогорова-Смирнова Критерий предназначен для сопоставления двух распределений: а)эмпирического с теоретическим, например, равномерным или нормальным; б)одного эмпирического распределения с другими эмпирическими распределениями.
Продолжение 9.2 Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.
Продолжение 9.2 Выборка должна быть достаточно большой и для сопоставления двух эмпирических распределений необходимо n 1, n 2 > 50.
Продолжение 9.2 Сопоставление эмпирического распределения с теоретическим иногда допускает п > 5.
Продолжение 9.2 Гипотезы критерия Колмогорова-Смирнова: Н0: Различия между двумя распределениями не достоверны (судя по точке максимального накопленного расхождения между ними).
Продолжение 9.2 Гипотезы критерия Колмогорова-Смирнова: Н1: Различия между двумя распределениями достоверны (судя по точке максимального накопленного расхождения между ними).
Тема 10. Многофункциональные критерии
Содержание темы Понятие многофункциональных критериев Применение многофункциональных критериев.
10.1 Понятие многофункциональных критериев Многофункциональные статистические критерии – это критерии, которые могут использоваться по отношению к самым разнообразным данным, выборкам и задачам.
Продолжение 10.1 Данные для многофункциональных критериев могут быть представлены в любой шкале, начиная от номинативной.
Продолжение 10.1 Выборки могут быть как независимыми, так и «связанными»
Продолжение 10.1 Многофункциональные критерии позволяют решать задачи сопоставления уровней исследуемого признака, сдвигов в значениях исследуемого признака и сравнения распределений
Продолжение 10.1 К числу многофункциональных критериев относят критерий Фишера и биномиальный критерий m
Продолжение 10.1 Суть критериев состоит в определении того, какая доля наблюдений в данной выборке характеризуется интересующим эффектом и какая доля этим эффектом не характеризуется.
10. 2 Применение многофункциональных критериев Путем сведения любых данных к альтернативной шкале «Есть эффект – нет эффекта» многофункциональные критерии позволяют решать задачи сопоставлений.
Продолжение 10.2 Три задачи сопоставлений: Сравнение «уровней»; Оценка «сдвигов»; Сравнение распределений.
Продолжение 10.2 В случае, когда обследованы две выборки испытуемых применяется критерий Фишера
Продолжение 10.2 В случае, когда обследована одна выборка испытуемых применяется биномиальный критерий m
Тема 11. Угловое преобразование Фишера и биномиальный критерий
Содержание темы Угловое преобразование Фишера 11.2 Биномиальный критерий
11.1 Угловое преобразование Фишера Критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости исследуемого признака.
Продолжение 11.1 Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий аффект.
Продолжение 11.1 Ограничения критерия углового преобразования Фишера: Ни одна из сопоставляемых долей не должна быть равна 0; верхний предел отсутствует; нижний предел - 2 наблюдения в одной выборке.
Продолжение 11.1 Гипотезы критерия углового преобразования Фишера: Н0 : Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 не больше, чем в выборке 2.
Продолжение 11.1 Гипотезы критерия углового преобразования Фишера: Н1 : Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 больше, чем в выборке 2.
11.2 Биномиальный критерий Критерий предназначен для сопоставления частоты встречаемости какого-либо эффекта с теоретической или заданной частотой его встречаемости.
Продолжение 11.2 Биноминальный критерий позволяет оценить, насколько эмпирическая частота интересующего нас эффекта превышает теоретическую, среднестатистическую или заданную частоту,
Продолжение 11.2 Ограничения биномиального критерия: Критерий применяется, когда обследована лишь одна выборка объемом не более 300 наблюдений, в некоторых задачах - не более 50 наблюдений.
Продолжение 11.2 Ограничения биномиального критерия: В выборке должно быть не менее 5 наблюдений. Критерий чувствителен к значению вероятности и объему выборки и может быть заменен на другие критерии.
Продолжение 11.2 Гипотезы биномиального критерия: Но: Частота встречаемости данного эффекта в обследованной выборке не превышает теоретической (заданной, ожидаемой, предполагаемой).
Продолжение 11.2 Гипотезы биномиального критерия: Н1 : Частота встречаемости данного эффекта в обследованной выборке превышает теоретическую (заданную, ожидаемую, предполагаемую).
Продолжение 11.2 Эмпирическая частота наблюдений, в которых проявляется интересующий нас эффект, обозначается как m. Это и есть эмпирическое значение критерия m.
Продолжение 11.2 Если m эмпир. равен или превышает m критич., то различия достоверны.
Тема 12. Метод ранговой корреляции
Содержание темы Задача исследования согласованных действий Корреляционные связи Формы корреляционных связей.
12.1 Задача исследования согласованных действий Анализ связей между признаками – главный вид задач, встречающийся практически в любом эмпирическом исследовании.
Продолжение 12.1 Изучение связей между переменными, интересует исследователя как отражение соответствующих причинно-следственных отношений.
12.2 Корреляционные связи Корреляционная связь – это согласованные изменения двух признаков или большего количества признаков (множественная корреляционная связь).
Продолжение 12.2 Первоначальное значение термина "корреляции" – взаимная связь
Продолжение 12.2 Корреляционная зависимость – это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.
Продолжение 12.2 Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной связи, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого.
12.3 Формы корреляционных связей Корреляционные связи различаются по форме, направлению, степени (силе).
Продолжение 12.3 По форме корреляционная связь может быть прямолинейной, криволинейной.
Продолжение 12.3 По направлению корреляционная связь может быть положительной ("прямой"), отрицательной ("обратной").
Продолжение 12.3 При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака – низкие значения другого.
Продолжение 12.3 При отрицательной прямолинейной корреляции более высоким значениям одного признака соответствуют более низкие значения другого, а более низким значениям одного признака – высокие значения другого.
Продолжение 12.3 Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.
Продолжение 12.3 Коэффициент корреляции – это величина, которая может варьировать в пределах от +1 до –1.
Продолжение 12.3 В случае если коэффициент корреляции равен 0, обе переменные полностью независимы друг от друга.
Продолжение 12.3
Содержание темы Выбор критерия оценки достоверности различий между независимыми выборками по уровню признака Выбор критерия сравнения распределений Выбор многофункциональных критериев Расчет коэффициента ранговой корреляции.
Литература 1. Гласе Дж., Стенли Дж. Стзтаст Еческие методы в педагогике и психологии.-М., Паповяк С.С. Математические методы в социальной психологии. М, Сидоренко Е.В. Методы математической обработки в психологии. -СПб., Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере. -М., 1998.
Литература 5. Бурлачук Л.Ф., Смирнов Н.В. Словарь-справучник по математической диагностике. - Киев, Захаров В.П. Применение математических методов в социально-психологических исследованиях. Учебное пособие.-Л., Кендалл М. Дж., Стюарт А. Статистические алгоритмы в социологических исследованиях. - Новосибирск, 1985.
Литература 8. Плохинский Н.А. Дисперсионный анализ. - Новосибирск, Рунион Р. Справочник по непараметрической статистике. - М., Справочник по прикладной статистике. Т. 2. Под ред. Э. Алоиза, У. Ледермана. С.А. Айвазяна, Ю.Н. Тюрина. - М., Суходолъский Г.В. Основы математической статистики для психологов.-Л., 2001.