лекция 7 Постникова Ольга Алексеевна 1 Тема. Элементы теории корреляции
лекция 7 Постникова Ольга Алексеевна 2 План: 1. Основные понятия теории корреляции. 2. Коэффициент линейной корреляции и его свойства. 3. Проверка гипотезы о значимости выборочного коэффициента корреляции.
лекция 7 Постникова Ольга Алексеевна 3 1. Основные понятия теории корреляции Корреляционный анализ – это статистический метод, изучающий связь между явлениями, если одно из них входит в число причин, определяющих другое или, если имеются общие причины, воздействующие на эти явления.
лекция 7 Постникова Ольга Алексеевна 4 Основная задача – выявление связи между случайными величинами.
лекция 7 Постникова Ольга Алексеевна 5 Функциональная зависимость – это зависимость вида когда каждому возможному значению случайной величины X соответствует одно возможное значение случайной величины Y.
лекция 7 Постникова Ольга Алексеевна 6 Например, площадь круга S однозначно связана с радиусом окружности R:
лекция 7 Постникова Ольга Алексеевна 7 Корреляционная зависимость – это статистическая зависимость, проявляющаяся в том, что при изменении одной из величин изменяется среднее значение другой:
лекция 7 Постникова Ольга Алексеевна 8 Например, рост и масса. При одном и том же росте масса различных индивидуумов может быть различна, но между средними значениями этих показателей имеется определенная зависимость.
лекция 7 Постникова Ольга Алексеевна 9 Установление взаимосвязи между различными признаками и показателями функционирования организма позволяют по изменениям одних судить о состоянии других.
лекция 7 Постникова Ольга Алексеевна 10 Схема эксперимента следующая: пусть имеется выборка объема n из генеральной совокупности N. На каждом объекте выборки определяют числовые значения признаков, между которыми требуется установить наличие или отсутствие связи. Таким образом, получают два ряда числовых значений.
лекция 7 Постникова Ольга Алексеевна 11 Для изучения корреляционной связи, данные о статистической зависимости удобно задавать в виде корреляционной таблицы или в виде двумерной выборки.
лекция 7 Постникова Ольга Алексеевна 12
лекция 7 Постникова Ольга Алексеевна 13 Для наглядности полученного материала каждую пару можно представить в виде точки на координатной плоскости. По оси абсцисс откладывают значения одного вариационного ряда По оси абсцисс откладывают значения одного вариационного ряда а по оси ординат другого
лекция 7 Постникова Ольга Алексеевна 14 Такое изображение статистической зависимости называется полем корреляции или корреляционным полем точек. Оно создает общую картину корреляции.
лекция 7 Постникова Ольга Алексеевна 15 Если точки группируются вдоль некоторого направления, то это говорит о наличии линейной корреляционной связи между признаками. Если точки группируются вдоль некоторого направления, то это говорит о наличии линейной корреляционной связи между признаками. Если точки распределены равномерно, то линейная корреляционная связь отсутствует. Если точки распределены равномерно, то линейная корреляционная связь отсутствует.
лекция 7 Постникова Ольга Алексеевна 16 0 x y 0 x y ПОЛЕ КОРРЕЛЯЦИИ Рис. А Рис. Б
лекция 7 Постникова Ольга Алексеевна Коэффициент линейной корреляции и его свойства На практике исследователя часто может интересовать не сама зависимость одной переменной от другой, а характеристика тесноты связи между ними, которую можно было бы выразить одним числом. Эта характеристика называется выборочным коэффициентом линейной корреляции r
лекция 7 Постникова Ольга Алексеевна 18 Требования к корреляционному анализу: корреляционный анализ – это метод, используемый, когда данные можно считать случайными и выбранными из совокупности, распределенной по нормальному закону.
лекция 7 Постникова Ольга Алексеевна 19 Выборочный коэффициент линейной корреляции r характеризует тесноту линейной связи между количественными признаками в выборке:
лекция 7 Постникова Ольга Алексеевна 20 Если r > 0, то корреляционная связь между переменными прямая, при r < 0 – связь обратная.
лекция 7 Постникова Ольга Алексеевна 21 Свойства коэффициента корреляции r: 1. Коэффициент корреляции принимает значения на отрезке [-1;1]. В зависимости от того, насколько модуль r приближается к 1, различают связи: r < 0,3 – слабая связь; r = 0,3-0,5 – умеренная связь; r = 0,5-0,7 – значительная; r = 0,7-0,8 – достаточно тесная; r = 0,8 – 0,9 – тесная (сильная); r > 0,9 – очень тесная.
лекция 7 Постникова Ольга Алексеевна При r = 1 - функциональная зависимость. 3. Чем ближе r к 0, тем слабее связь. 4. При r = 0 линейная корреляционная связь отсутствует. 5. Если все значения переменных увеличить (уменьшить) на одно и то же число или в одно и то же число раз, то величина коэффициента корреляции не изменится.
лекция 7 Постникова Ольга Алексеевна Проверка гипотезы о значимости выборочного коэффициента корреляции Эмпирический (опытный) коэффициент корреляции, как и любой другой выборочный показатель, служит оценкой своего генерального параметра.
лекция 7 Постникова Ольга Алексеевна 24 Выборочный коэффициент линейной корреляции r в - величина случайная, так как он вычисляется по значениям переменных, случайно попавших в выборку из генеральной совокупности, а значит, как и любая случайная величина имеет ошибку
лекция 7 Постникова Ольга Алексеевна 25 Чтобы выяснить, находятся ли случайные величины X и Y генеральной совокупности в линейно корреляционной зависимости, надо проверить значимость r в. Для этого проверяют нулевую гипотезу о равенстве нулю коэффициента корреляции генеральной совокупности H 0 : r ген =0, т.е. линейная корреляционная связь между признаками X и Y случайна.
лекция 7 Постникова Ольга Алексеевна 26 Выдвигается альтернативная гипотеза т.е. линейная корреляционная связь не случайна. т.е. линейная корреляционная связь не случайна. Задается уровень значимости, например,
лекция 7 Постникова Ольга Алексеевна 27 Критерием для проверки нулевой гипотезы является отношение выборочного коэффициента корреляции к своей ошибке где - ошибка коэффициента корреляции.
лекция 7 Постникова Ольга Алексеевна 28 Если объем выборки n100, то
лекция 7 Постникова Ольга Алексеевна 29 Число степеней свободы для проверки критерия равно f = n-2. Гипотезу проверяют по таблицам распределения Стьюдента в соответствии с выбранным уровнем значимости.
лекция 7 Постникова Ольга Алексеевна 30 По таблице критических точек распределения Стьюдента находим определенное на уровне значимости определенное на уровне значимости при числе степеней свободы f = n-2, где n – объем двумерной выборки. при числе степеней свободы f = n-2, где n – объем двумерной выборки.
лекция 7 Постникова Ольга Алексеевна 31 Если отвергают нулевую гипотезу и принимают альтернативную отвергают нулевую гипотезу и принимают альтернативную имеется линейная корреляционная связь между признаками.
лекция 7 Постникова Ольга Алексеевна 32 Если то нет оснований отвергать нулевую гипотезу, а r в - статистически незначим. Эта связь случайна. то нет оснований отвергать нулевую гипотезу, а r в - статистически незначим. Эта связь случайна.
лекция 7 Постникова Ольга Алексеевна 33 Пример 1. Проверить значимость коэффициента корреляции r = 0,74 между переменными X и Y для выборки объема n=50, при уровне значимости
лекция 7 Постникова Ольга Алексеевна 34 Проверяется нулевая гипотеза об отсутствии линейной корреляционной связи между переменными X и Y в генеральной совокупности
лекция 7 Постникова Ольга Алексеевна 35 При справедливости этой гипотезы гдеи имеет распределение Стьюдента с имеет распределение Стьюдента с f = n-2 степенями свободы.
лекция 7 Постникова Ольга Алексеевна 36 Поскольку (7,62>2,02) коэффициент корреляции значимо отличается от нуля, а значит корреляционная зависимость - не случайна.
лекция 7 Постникова Ольга Алексеевна 37 Пример 2. По выборке объема n=122, извлеченной из нормальной двумерной совокупности (X,Y) найден выборочный коэффициент линейной корреляции r = 0,4. При уровне значимости проверить нулевую гипотезу, которая заключается в том, что связь между признаками случайна.
лекция 7 Постникова Ольга Алексеевна 38 Решение. При справедливости этой нулевой гипотезы где
лекция 7 Постникова Ольга Алексеевна 39 имеет распределение Стьюдента с f = n-2 степенями свободы. f = n-2 степенями свободы.
лекция 7 Постникова Ольга Алексеевна 40 Поскольку (5,25>1,98), то нулевая гипотеза отвергается и принимается альтернативная гипотеза (5,25>1,98), то нулевая гипотеза отвергается и принимается альтернативная гипотеза Вывод между признаками имеется умеренная линейная корреляционная связь r = 0,4.