Проверка гипотезы о значимости выборочного коэффициента коррелляции.
Коэффициент корреляции – это мера интенсивности линейной связи между признаками. Вычисляют по формуле:
Свойства коэффициента корреляции: 1. 2.Если r = 1, то зависимость между признаками Х и У является функциональной 3.Если r = 0, то признаки Х и У не связаны линейной корреляционной зависимостью, но зависимость может иметь криволинейный характер.
Пусть двумерная генеральная совокупность (X;Y) распределена нормально, из той совокупности извлечена выборка объема n и по ней найден выборочный коэффициент корелляции rв, который оказался отличным от нуля.
Т.к. выборка отобрана случайно, то еще нельзя заключить, что коэффициент генеральной совокупности rв также отличен от нуля. В конечном счете нас интересует именно этот коэффициент поэтому возникает необходимость при заданном уровне значимости α проверить нулевую гипотезу: о равенстве генерального коэффициента корелляции при конкурирующей гипотезе.
Если нулевая гипотеза отвергается, то это означает, что выборочный коэффициент корелляции значимо отличается от нуля (кратко говоря, значим), а X и Y корелированы, т.е. связаны линейной зависимостью. Если нулевая гипотеза будет принята, то выборочный коэффициент корелляции незначим, а X и Y некорелированны, т.е. не связаны линейной зависимостью.
В качестве критерия проверки нулевой гипотезы примем случайную величину:
Величина T при справедливости нулевой гипотезы имеет распределение Стьюдента с k = n – 2 степенями свободы. Поскольку конкурирующая гипотеза имеет вид, критическая область – двусторонняя. Обозначим значение критерия, вычисленное по данным наблюдений, через T набл. и сформулируем правило проверки гипотезы.
Правило. Для того, чтобы при заданном уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корелляции нормальной двумерной случайной величины при конкурирующей гипотезе, надо вычислить наблюдаемое значение критерия:
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости и числу степеней свободы k = n – 2 найти критическую точку t кр. (α, k) для двусторонней критической области. Если |T набл. | < t кр. – нет оснований отвергнуть нулевую гипотезу. Если |T набл. | > t кр. – нулевую гипотезу отвергают.
Принимается нулевая гипотеза при. Проверка нулевой гипотезы проводится по t-критерию:, где t вычисляют по исходным данным.
Находятиз условия: задан уровень значимости α и известно число степеней свободы k = n - 2. По таблице распределения Стьюдента определяют:.
Если, то нулевая гипотеза отвергается, поэтому коэффициент корреляции существенно отличен от нуля в генеральной совокупности, а между признаками Х и У существует корреляционная связь.