Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1
Задача изучения зависимостей Исследование объективно существующих связей между явлениями и их показателями – одна из важнейших задач анализа Различают классы статистических признаков: - независимые (факторные) - и зависимые (результативные) Причинность, корреляция, регрессия 2
Виды зависимости Зависимости бывают функциональными и нет, т.е. с элементом случайности При Функциональной зависимости каждому значению независимой переменной соответствует определенное значение зависимой 3
Балансовая зависимость Пример функциональной связи – балансовая: 0 н – остаток средств на начало изучаемого периода; П – поступление средств в течении данного периода; Р – расход средств за период; 0 к – остаток средств на конец периода 4
Статистическая зависимость В социально-экономических исследованиях в большинстве случаев наблюдается связь, при которой каждому значению одной переменной соответствует некоторое множество возможных значений другой переменной Такая зависимость называется статистической 5
Корреляционная связь – частный случай статистической зависимости Корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и средним значением другой Поле корреляции – графическое изображение взаимосвязи двух признаков 6
Поле корреляции 7
Классификация статистических связей Связи между явлениями и их признаками классифицируются: По тесноте: сильная, умеренная, слабая или отсутствует По направлению: прямая или обратная По аналитическому выражению: линейная или нелинейная 8
Виды корреляционной зависимости Парная корреляция – линейная зависимость между двумя переменными Частная корреляция – линейная зависимость между двумя переменными при исключении влияния других Множественная корреляция - линейная зависимость между набором переменных 9
Этапы статистического изучения связи 1.Качественный анализ на наличие объективной зависимости 2.Построение модели связи: Метод приведения параллельных данных и построение поля корреляции Корреляционный анализ Регрессионный анализ 3.Содержательная интерпретация полученных результатов моделирования 10
Характеристика тесноты и направления связи Цель состоит в количественном описание тесноты и направления связи В качестве характеристики используется коэффициент корреляции (r): 11
Регрессионный анализ Регрессионный анализ заключается в аналитическом выражении связи: Нахождение функциональной зависимости среднего (математического ожидания) признака (y) от значений независимой переменной (x): 12
Определение параметров регрессии Определение класса функций для выражения функциональной зависимости среднего признака (y) от значений переменной (x) Оценка параметров функции регрессии: метод наименьших квадратов Проверка случайности остатков и адекватности модели связи 13
Пример Пусть имеются данные по 9 студентам: Признак (x) – количество пропущенных студентом занятий по дисциплине Признак (y) – полученная студентом оценка на экзамене 14
Пример Исследуем зависимость среднего значения (y) от признака (x) 1.Ясно, что такая объективная зависимость может существовать (хотя и не функциональная) 15
Пример 2.Построение модели связи Метод приведения параллельных данных 16
Пример Поле корреляции 17
Пример Теснота и направление связи между количественными переменными измеряются с помощью коэффициента корреляции Пирсона: 18
Пример 19
Пример Делать выводы о тесноте и направлении связи пока преждевременно: нужно проверить значимость коэффициента корреляции (r) Гипотеза H 0 : истинное значение коэффициента корреляции (R) равно «0» Для проверки значимости коэффициента корреляции (r) применяется T-критерий Стьюдента 20
Пример По выборке рассчитываем значение статистики: 21
Вывод Корреляционная связь: Обратная - коэффициент корреляции (r) отрицательный Умеренная, но близкая к сильной 22
Регрессионный анализ Наблюдается существенная линейная корреляционная зависимость, поэтому аналитическое выражение связи будем искать в линейной форме: 23
Регрессионный анализ Необходима проверка значимости полученного уравнения регрессии - в целом - каждого коэффициента в отдельности Тем не менее, пользуясь полученным уравнением регрессии, находим, что, например, при x = 3, оценка ожидается 4: 24
Регрессионный анализ Значимость полученного уравнения регрессии (в целом) проверяется по F-критерию Фишера: Гипотеза H 0 : все коэффициенты регрессии равны «0» 25
Регрессионный анализ Уравнение регрессии в целом значимо, если выполняется условие: 26
Регрессионный анализ Так как то объясненное регрессией отклонение от среднего уровня: Полное отклонение от среднего уровня: Отклонение, необъясненное регрессией: 27
Регрессионный анализ Значение F-статистики: Вывод: так как вычисленное значение F-критерия: то уравнение регрессии значимо 28
Регрессионный анализ: коэффициент детерминации В силу правила сложения дисперсий для R 2 имеем В примере коэффициент детерминации: Вывод: предсказанные по регрессии значения объясняют вариацию результативного признака (y) на 58% 29