Анализ связи между атрибутивными признаками. Взаимосвязь между атрибутивными признаками анализируют­ся посредством таблиц взаимной сопряженности. Они.

Презентация:



Advertisements
Похожие презентации
Исследование взаимосвязей социально- экономических явлений.
Advertisements

Тема Статистическое изучение взаимосвязи социально- экономических явлений.
Статистическая оценка взаимосвязи явлений и процессов в социальной статистике.
Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
С ТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ СОЦИАЛЬНО - ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ Л ЕКЦИЯ 8. Клобертанц Е.П. Красноярск, 2013 г. ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ.
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Измерение – это процедура, с помощью которой измеряемый объект сравнивается с некоторым эталоном и получает численное выражение в определенном масштабе.
Показатели вариации признака 1. Абсолютные показатели вариации; 1.1 Размах вариации; 1.2 Среднее линейное отклонение; 1.3 Среднее квадратическое отклонение;
Элементы теории корреляции. План: I. Понятие корреляционной зависимости: 1) Коэффициент корелляции 2) Проверка гипотезы о значимости выборочного коэффициента.
Основы корреляционного и регрессионного анализа. План лекции: 1.Способы изучения корреляционных зависимостей. 2.Определение коэффициента парной линейной.
Расчет оптимальной численности выборки. Статистическое наблюдение сплошное Обследование всех единиц изучаемой совокупности не сплошное Обследование части.
Общая теория статистики Регрессионно- корреляционный анализ.
ЛЕКЦИЯ 8 КОРРЕЛЯЦИОННО- РЕГРЕССИОННЫЙ АНАЛИЗ. МОДЕЛИРОВАНИЕ СВЯЗЕЙ.
Лекция 1 «Введение». Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов. Специфической.
«Технико-экономический анализ деятельности предприятия» Гиндуллина Тамара Камильевна, к.т.н., доцент кафедры АСУ.
Математические методы оценки взаимосвязи
Формула ПИРСОНА. Критерий корреляции Пирсона – это метод параметрической статистики, позволяющий определить наличие или отсутствие линейной связи между.
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Ковариация. Коэффициент корреляции. Корреляционный момент Работу выполнила: Студентка группы 2У00 Нагорнова Е.А.
Транксрипт:

Анализ связи между атрибутивными признаками

Взаимосвязь между атрибутивными признаками анализируют­ся посредством таблиц взаимной сопряженности. Они описыва­ют комбинационные распределения совокупности по факторному признаку х и результативному у.

При наличии стохастической связи оценка его тесноты бази­руется на отклонениях фактических частот f ij от F ij, пропорцио­ нальных итоговым частотам: где f io - суммарные частоты по признаку х; f 0j - суммарные частоты по признаку y; n - объем совокупности.

Очевидно, что где m x и m y – количество групп по x и y соответственно.

Абсолютную величину отклонений фактических частот f ij от пропорциональных F ij (f ij -F ij ) характеризуют статистическим критерием χ 2 (хи-квадрат или критерий Пирсона)

При отсутствии стохастической связи

Для вывода о тес­ноте связи теоретическое значение критерия Пирсона по формуле слайда 5 сравнива­ется с табличным. Табличное значение критерия Пирсона находят по справочным математическим таблицам для критерия «хи»-квадрат в зависимости от принятого уровня значимости α (0,01 или 0,05), и степеней свобо­ды к = (т х - 1)(т y -1).

Относительной мерой тесноты стохастической связи между признаками служат также: коэффициент взаимной сопряженности Чупрова

Коэффициент взаимной сопряженности Крамера (при т х т y ) где т min минимальное число групп (т x или т y ).

Значение коэффициента С колеблется от 0 до 1 и теснота связи тем сильнее, чем более близко С к 1.

Достаточно часто в практике статистических исследований анализируются связи между альтернативными признаками, кото­рые представлены группами с противоположными (взаимоисклю­ чающими) характеристиками.

Тесноту связи в этом случае мож­но оценивать посредством коэффициента ассоциации Д. Юла коэффициента контингенции К Пирсона.

Для расчета указанных коэффициентов измерения тесноты свя­зи между альтернативными признаками используется таблица вза­имной сопряженности в виде корреляционной таблицы, которая носит название «четырехклеточной таблицы»

а b a+b сdc+d а + сb + da+b + c +d

При использовании четырехклеточной таблицы с частотами а, Ь, с, d коэффи­циент ассоциации (К а ) вычисляется по формуле: При К а > 0,3 между изучаемыми качественными признаками существует корреляционная связь.

В случаях, когда один из показателей четырех клеточной таб­лицы отсутствует, величина коэффициента ассоциации будет рав­ няться единице, что дает завышенную оценку тесноты связи меж­ду признаками. В этом случае необходимо рассчитывать коэффи­циент контингенции (K k ):

Коэффициент контингенции находится в диапазоне от -1 к +1. Чем более близко К к к (+1) или (-1), тем теснее связь между изуча­емыми признаками. Коэффициент контингенции всегда меньше коэффициента ассоциации.

Для определения связи как между количественными, так и ка­чественными признаками при условии, что значения этих призна­ков упорядочены по степени уменьшения или увеличения (ранжи­ рованные), может быть использован коэффициент корреляции рангов Спирмена.

Рангами называют числа натурального ряда, которые представляются в баллах по определенным критериям элементов совокупности. При этом ранжирование проводится по каждому признаку отдельно: первый ранг предоставляется наименьшему значению признака, последний - наибольшему. Количество рангов равняется объему совокупности.

Преиму­ществом этого подхода является то, что при отсутствии требо­вания нормального распределения ранговые оценки тесноты связи целесообразно использовать для совокупности небольшо­ го объема.

Показатель ранговой корреляции - коэффициент корреляции рангов Спирмена рассчитывается по формуле: где d j разность между рангами по одному и другому признаку d j =R xj -R ii ; n - количество единиц в ряду.

Если d j = 0 ρ=1 существует тесная прямая связь. Если первому рангу по размеру одного признака соответствует последний ранг по размеру вто­рого признака, второму рангу - предпоследний ранг второго при­знака и т. п., то ρ=-1 и существует тесная обратная связь. Если значение ρ близко к нулю, то связь слабая или ее вообще нет.

Для предварительной оценки тесноты связи между атрибутив­ными признаками используются также такие характеристики, как коэффициенты конкордации Фехнера и Кендэла