Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции

Презентация:



Advertisements
Похожие презентации
Проверка гипотезы о значимости выборочного коэффициента коррелляции.
Advertisements

Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.
5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 6. Сравнение двух выборок 6-1. Гипотеза о равенстве средних. Парные выборки 6-2.Доверительный.
Лекция 3 - Проверка гипотез в одномерном статистическом анализе 3.1. Основные понятия, используемые при проверке гипотез 3.2. Общий алгоритм статистической.
Проверка статистических гипотез Основные понятия и терминология Что такое статистическая гипотеза? Лекция 6.
7 ноября 2012 г.7 ноября 2012 г.7 ноября 2012 г.7 ноября 2012 г. Лекция 4. Проверка статистических гипотез 4-1. Гипотеза о доле признака 4-2. Гипотеза.
Элементы теории корреляции. План: I. Понятие корреляционной зависимости: 1) Коэффициент корелляции 2) Проверка гипотезы о значимости выборочного коэффициента.
Российский университет дружбы народов Институт гостиничного бизнеса и туризма В.И. Дихтяр Теория и методология социально- экономических исследований в.
Типовые расчёты Растворы
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
Теория статистики Описательная статистика и получение статистических выводов Часть 2. 1.
Статистическая проверка статистических гипотез.. Нулевая гипотеза - выдвинутая гипотеза. Конкурирующая гипотеза - - гипотеза, которая противоречит нулевой.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Предмет и методы Лекция 2.
Ребусы Свириденковой Лизы Ученицы 6 класса «А». 10.
Доцент Аймаханова А.Ш.. 1. Статистические гипотезы в медико- биологических исследованиях. 2. Параметрические критерии различий. 3. Непараметрические критерии.
Урок повторения по теме: «Сила». Задание 1 Задание 2.
Игра «Русское лото» Тема: «Алгебраические выражения, уравнения, степень с натуральным показателем, одночлены, сумма и разность многочленов». Алгебра 7.
23 сентября 2012 г.23 сентября 2012 г.23 сентября 2012 г.23 сентября 2012 г. Лекция 9. Непрерывные распределения 9-1. Функция распределения 9-2. Плотность.
22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г. Лекция 10. Однофакторный дисперсионный анализ Задача дисперсионного.
Транксрипт:

лекция 7 Постникова Ольга Алексеевна 1 Тема. Элементы теории корреляции

лекция 7 Постникова Ольга Алексеевна 2 План: 1. Основные понятия теории корреляции. 2. Коэффициент линейной корреляции и его свойства. 3. Проверка гипотезы о значимости выборочного коэффициента корреляции.

лекция 7 Постникова Ольга Алексеевна 3 1. Основные понятия теории корреляции Корреляционный анализ – это статистический метод, изучающий связь между явлениями, если одно из них входит в число причин, определяющих другое или, если имеются общие причины, воздействующие на эти явления.

лекция 7 Постникова Ольга Алексеевна 4 Основная задача – выявление связи между случайными величинами.

лекция 7 Постникова Ольга Алексеевна 5 Функциональная зависимость – это зависимость вида когда каждому возможному значению случайной величины X соответствует одно возможное значение случайной величины Y.

лекция 7 Постникова Ольга Алексеевна 6 Например, площадь круга S однозначно связана с радиусом окружности R:

лекция 7 Постникова Ольга Алексеевна 7 Корреляционная зависимость – это статистическая зависимость, проявляющаяся в том, что при изменении одной из величин изменяется среднее значение другой:

лекция 7 Постникова Ольга Алексеевна 8 Например, рост и масса. При одном и том же росте масса различных индивидуумов может быть различна, но между средними значениями этих показателей имеется определенная зависимость.

лекция 7 Постникова Ольга Алексеевна 9 Установление взаимосвязи между различными признаками и показателями функционирования организма позволяют по изменениям одних судить о состоянии других.

лекция 7 Постникова Ольга Алексеевна 10 Схема эксперимента следующая: пусть имеется выборка объема n из генеральной совокупности N. На каждом объекте выборки определяют числовые значения признаков, между которыми требуется установить наличие или отсутствие связи. Таким образом, получают два ряда числовых значений.

лекция 7 Постникова Ольга Алексеевна 11 Для изучения корреляционной связи, данные о статистической зависимости удобно задавать в виде корреляционной таблицы или в виде двумерной выборки.

лекция 7 Постникова Ольга Алексеевна 12

лекция 7 Постникова Ольга Алексеевна 13 Для наглядности полученного материала каждую пару можно представить в виде точки на координатной плоскости. По оси абсцисс откладывают значения одного вариационного ряда По оси абсцисс откладывают значения одного вариационного ряда а по оси ординат другого

лекция 7 Постникова Ольга Алексеевна 14 Такое изображение статистической зависимости называется полем корреляции или корреляционным полем точек. Оно создает общую картину корреляции.

лекция 7 Постникова Ольга Алексеевна 15 Если точки группируются вдоль некоторого направления, то это говорит о наличии линейной корреляционной связи между признаками. Если точки группируются вдоль некоторого направления, то это говорит о наличии линейной корреляционной связи между признаками. Если точки распределены равномерно, то линейная корреляционная связь отсутствует. Если точки распределены равномерно, то линейная корреляционная связь отсутствует.

лекция 7 Постникова Ольга Алексеевна 16 0 x y 0 x y ПОЛЕ КОРРЕЛЯЦИИ Рис. А Рис. Б

лекция 7 Постникова Ольга Алексеевна Коэффициент линейной корреляции и его свойства На практике исследователя часто может интересовать не сама зависимость одной переменной от другой, а характеристика тесноты связи между ними, которую можно было бы выразить одним числом. Эта характеристика называется выборочным коэффициентом линейной корреляции r

лекция 7 Постникова Ольга Алексеевна 18 Требования к корреляционному анализу: корреляционный анализ – это метод, используемый, когда данные можно считать случайными и выбранными из совокупности, распределенной по нормальному закону.

лекция 7 Постникова Ольга Алексеевна 19 Выборочный коэффициент линейной корреляции r характеризует тесноту линейной связи между количественными признаками в выборке:

лекция 7 Постникова Ольга Алексеевна 20 Если r > 0, то корреляционная связь между переменными прямая, при r < 0 – связь обратная.

лекция 7 Постникова Ольга Алексеевна 21 Свойства коэффициента корреляции r: 1. Коэффициент корреляции принимает значения на отрезке [-1;1]. В зависимости от того, насколько модуль r приближается к 1, различают связи: r < 0,3 – слабая связь; r = 0,3-0,5 – умеренная связь; r = 0,5-0,7 – значительная; r = 0,7-0,8 – достаточно тесная; r = 0,8 – 0,9 – тесная (сильная); r > 0,9 – очень тесная.

лекция 7 Постникова Ольга Алексеевна При r = 1 - функциональная зависимость. 3. Чем ближе r к 0, тем слабее связь. 4. При r = 0 линейная корреляционная связь отсутствует. 5. Если все значения переменных увеличить (уменьшить) на одно и то же число или в одно и то же число раз, то величина коэффициента корреляции не изменится.

лекция 7 Постникова Ольга Алексеевна Проверка гипотезы о значимости выборочного коэффициента корреляции Эмпирический (опытный) коэффициент корреляции, как и любой другой выборочный показатель, служит оценкой своего генерального параметра.

лекция 7 Постникова Ольга Алексеевна 24 Выборочный коэффициент линейной корреляции r в - величина случайная, так как он вычисляется по значениям переменных, случайно попавших в выборку из генеральной совокупности, а значит, как и любая случайная величина имеет ошибку

лекция 7 Постникова Ольга Алексеевна 25 Чтобы выяснить, находятся ли случайные величины X и Y генеральной совокупности в линейно корреляционной зависимости, надо проверить значимость r в. Для этого проверяют нулевую гипотезу о равенстве нулю коэффициента корреляции генеральной совокупности H 0 : r ген =0, т.е. линейная корреляционная связь между признаками X и Y случайна.

лекция 7 Постникова Ольга Алексеевна 26 Выдвигается альтернативная гипотеза т.е. линейная корреляционная связь не случайна. т.е. линейная корреляционная связь не случайна. Задается уровень значимости, например,

лекция 7 Постникова Ольга Алексеевна 27 Критерием для проверки нулевой гипотезы является отношение выборочного коэффициента корреляции к своей ошибке где - ошибка коэффициента корреляции.

лекция 7 Постникова Ольга Алексеевна 28 Если объем выборки n100, то

лекция 7 Постникова Ольга Алексеевна 29 Число степеней свободы для проверки критерия равно f = n-2. Гипотезу проверяют по таблицам распределения Стьюдента в соответствии с выбранным уровнем значимости.

лекция 7 Постникова Ольга Алексеевна 30 По таблице критических точек распределения Стьюдента находим определенное на уровне значимости определенное на уровне значимости при числе степеней свободы f = n-2, где n – объем двумерной выборки. при числе степеней свободы f = n-2, где n – объем двумерной выборки.

лекция 7 Постникова Ольга Алексеевна 31 Если отвергают нулевую гипотезу и принимают альтернативную отвергают нулевую гипотезу и принимают альтернативную имеется линейная корреляционная связь между признаками.

лекция 7 Постникова Ольга Алексеевна 32 Если то нет оснований отвергать нулевую гипотезу, а r в - статистически незначим. Эта связь случайна. то нет оснований отвергать нулевую гипотезу, а r в - статистически незначим. Эта связь случайна.

лекция 7 Постникова Ольга Алексеевна 33 Пример 1. Проверить значимость коэффициента корреляции r = 0,74 между переменными X и Y для выборки объема n=50, при уровне значимости

лекция 7 Постникова Ольга Алексеевна 34 Проверяется нулевая гипотеза об отсутствии линейной корреляционной связи между переменными X и Y в генеральной совокупности

лекция 7 Постникова Ольга Алексеевна 35 При справедливости этой гипотезы гдеи имеет распределение Стьюдента с имеет распределение Стьюдента с f = n-2 степенями свободы.

лекция 7 Постникова Ольга Алексеевна 36 Поскольку (7,62>2,02) коэффициент корреляции значимо отличается от нуля, а значит корреляционная зависимость - не случайна.

лекция 7 Постникова Ольга Алексеевна 37 Пример 2. По выборке объема n=122, извлеченной из нормальной двумерной совокупности (X,Y) найден выборочный коэффициент линейной корреляции r = 0,4. При уровне значимости проверить нулевую гипотезу, которая заключается в том, что связь между признаками случайна.

лекция 7 Постникова Ольга Алексеевна 38 Решение. При справедливости этой нулевой гипотезы где

лекция 7 Постникова Ольга Алексеевна 39 имеет распределение Стьюдента с f = n-2 степенями свободы. f = n-2 степенями свободы.

лекция 7 Постникова Ольга Алексеевна 40 Поскольку (5,25>1,98), то нулевая гипотеза отвергается и принимается альтернативная гипотеза (5,25>1,98), то нулевая гипотеза отвергается и принимается альтернативная гипотеза Вывод между признаками имеется умеренная линейная корреляционная связь r = 0,4.