Анализ связи между атрибутивными признаками
Взаимосвязь между атрибутивными признаками анализируются посредством таблиц взаимной сопряженности. Они описывают комбинационные распределения совокупности по факторному признаку х и результативному у.
При наличии стохастической связи оценка его тесноты базируется на отклонениях фактических частот f ij от F ij, пропорцио нальных итоговым частотам: где f io - суммарные частоты по признаку х; f 0j - суммарные частоты по признаку y; n - объем совокупности.
Очевидно, что где m x и m y – количество групп по x и y соответственно.
Абсолютную величину отклонений фактических частот f ij от пропорциональных F ij (f ij -F ij ) характеризуют статистическим критерием χ 2 (хи-квадрат или критерий Пирсона)
При отсутствии стохастической связи
Для вывода о тесноте связи теоретическое значение критерия Пирсона по формуле слайда 5 сравнивается с табличным. Табличное значение критерия Пирсона находят по справочным математическим таблицам для критерия «хи»-квадрат в зависимости от принятого уровня значимости α (0,01 или 0,05), и степеней свободы к = (т х - 1)(т y -1).
Относительной мерой тесноты стохастической связи между признаками служат также: коэффициент взаимной сопряженности Чупрова
Коэффициент взаимной сопряженности Крамера (при т х т y ) где т min минимальное число групп (т x или т y ).
Значение коэффициента С колеблется от 0 до 1 и теснота связи тем сильнее, чем более близко С к 1.
Достаточно часто в практике статистических исследований анализируются связи между альтернативными признаками, которые представлены группами с противоположными (взаимоисклю чающими) характеристиками.
Тесноту связи в этом случае можно оценивать посредством коэффициента ассоциации Д. Юла коэффициента контингенции К Пирсона.
Для расчета указанных коэффициентов измерения тесноты связи между альтернативными признаками используется таблица взаимной сопряженности в виде корреляционной таблицы, которая носит название «четырехклеточной таблицы»
а b a+b сdc+d а + сb + da+b + c +d
При использовании четырехклеточной таблицы с частотами а, Ь, с, d коэффициент ассоциации (К а ) вычисляется по формуле: При К а > 0,3 между изучаемыми качественными признаками существует корреляционная связь.
В случаях, когда один из показателей четырех клеточной таблицы отсутствует, величина коэффициента ассоциации будет рав няться единице, что дает завышенную оценку тесноты связи между признаками. В этом случае необходимо рассчитывать коэффициент контингенции (K k ):
Коэффициент контингенции находится в диапазоне от -1 к +1. Чем более близко К к к (+1) или (-1), тем теснее связь между изучаемыми признаками. Коэффициент контингенции всегда меньше коэффициента ассоциации.
Для определения связи как между количественными, так и качественными признаками при условии, что значения этих признаков упорядочены по степени уменьшения или увеличения (ранжи рованные), может быть использован коэффициент корреляции рангов Спирмена.
Рангами называют числа натурального ряда, которые представляются в баллах по определенным критериям элементов совокупности. При этом ранжирование проводится по каждому признаку отдельно: первый ранг предоставляется наименьшему значению признака, последний - наибольшему. Количество рангов равняется объему совокупности.
Преимуществом этого подхода является то, что при отсутствии требования нормального распределения ранговые оценки тесноты связи целесообразно использовать для совокупности небольшо го объема.
Показатель ранговой корреляции - коэффициент корреляции рангов Спирмена рассчитывается по формуле: где d j разность между рангами по одному и другому признаку d j =R xj -R ii ; n - количество единиц в ряду.
Если d j = 0 ρ=1 существует тесная прямая связь. Если первому рангу по размеру одного признака соответствует последний ранг по размеру второго признака, второму рангу - предпоследний ранг второго признака и т. п., то ρ=-1 и существует тесная обратная связь. Если значение ρ близко к нулю, то связь слабая или ее вообще нет.
Для предварительной оценки тесноты связи между атрибутивными признаками используются также такие характеристики, как коэффициенты конкордации Фехнера и Кендэла