Формула ПИРСОНА
Критерий корреляции Пирсона – это метод параметрической статистики, позволяющий определить наличие или отсутствие линейной связи между двумя количественными показателями, а также оценить ее тесноту и статистическую значимость. Другими словами, критерий корреляции Пирсона позволяет определить, есть ли линейная связь между изменениями значений двух переменных. В статистических расчетах и выводах коэффициент корреляции обычно обозначается как r xy или R xy.
История разработки критерия корреляции Критерий корреляции Пирсона был разработан командой британских ученых во главе с Карлом Пирсоном ( ) в 90-х годах 19-го века, для упрощения анализа ковариации двух случайных величин. Помимо Карла Пирсона над критерием корреляции Пирсона работали также Фрэнсис Эджуорт и Рафаэль Уэлдон.
Для чего используется критерий корреляции Пирсона? Критерий корреляции Пирсона позволяет определить, какова теснота (или сила) корреляционной связи между двумя показателями, измеренными в количественной шкале. При помощи дополнительных расчетов можно также определить, насколько статистически значима выявленная связь.корреляционной связи
Как рассчитать коэффициента корреляции Пирсона? Расчет коэффициента корреляции Пирсона производится по следующей формуле:
Абсолютное значение r xy Теснота (сила) корреляционной связи менее 0.3 слабая от 0.3 до 0.5 умеренная от 0.5 до 0.7 заметная от 0.7 до 0.9 высокая более 0.9 весьма высокая
Оценка статистической значимости коэффициента корреляции r xy осуществляется при помощи t-критерия, рассчитываемого по следующей формуле:
Пример расчета коэффициента корреляции Пирсона NСодержание тестостерона в крови, нг/дл (X)Процент мышечной массы, % (Y)
Вычислим суммы анализируемых значений X и Y: Σ(X) = = 4769 Σ(Y) = = 441 Найдем средние арифметические для X и Y: M x = Σ(X) / n = 4769 / 5 = M y = Σ(Y) / n = 441 / 5 = 82.2 Рассчитаем для каждого значения сопоставляемых показателей величину отклонения от среднего арифметического d x = X - M x и d y = Y - M y : N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y) Отклонение содержания тестостерона от среднего значения (d x ) Отклонение % мышечной массы от среднего значения (d y )
Возведем в квадрат каждое значение отклонения d x и d y : N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y) Отклонение содержания тестостерона от среднего значения (d x ) Отклонение % мышечной массы от среднего значения (d y ) dx2dx2 dy2dy , ,
Рассчитаем для каждой пары анализируемых значений произведение отклонений d x x d y : N Содержание тестостерона в крови, нг/дл (X) Процент мышечной массы, % (Y) Отклонение содержания тестостерона от среднего значения (d x ) Отклонение % мышечной массы от среднего значения (d y ) dx2dx2 dy2dy2 d x x d y , ,
Определим значения суммы квадратов отклонений Σ(d x 2 ) и Σ(d y 2 ):Σ(d x 2 ) = Σ(d y 2 ) = 98.8 Найдем значение суммы произведений отклонений Σ(d x x d y ):Σ(d x x d y ) = Рассчитаем значение коэффициента корреляции Пирсона r xy по приведенной выше формуле:
Найдем значение t-критерия для оценки статистической значимости корреляционной связи:
делаем статистический вывод:Значение коэффициента корреляции Пирсона составило 0.97, что соответствует весьма высокой тесноте связи между уровнем тестостерона в крови и процентом мышечной массы. Данная корреляционная связь является статистически значимой (p<0.01).