«Линейная регрессия и корреляция: смысл и оценка параметров»
F критерий Фишера - оценивает качество уравнения регрессии - состоит в проверке гипотезы Н о (о том, что коэффициент регрессии равен нулю, т.е. b=0, т.е. фактор х не оказывает влияния на результат у ).
Расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений на две части «объясненную» и «необъясненную». Общая объясненная остаточная (необъясненная)
Любая сумма квадратов отклонений связана с числом степеней свободы – df, т.е. с числом свободы независимого варьирования признака. Для общей суммы квадратов требуется (n-1) число отклонений.
Для расчета df объясненной суммы квадратов имеем: Число степеней свободы равно 1.
Число степеней свободы остаточной суммы квадратов = число степ. свободы для общей суммы квадратов – число степ. свободы для объясненной регрессии.
дисперсии на одну степень свободы
Значение F-критерия признается достоверным, если оно больше табличного. В этом случае гипотеза H 0 отклоняется.
Если F табл <F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F факт, то гипотеза Н о не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.
Таблица значений F-критерия Фишера при уровне значимости α =0,05 k k2k ,45 199,50 215,72 224,57 230,17 233,97 238,89 243,91 249,04 254, ,51 19,00 19,16 19,25 19,30 19,33 19,37 19,41 19,45 19, ,13 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,64 8,53 4 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,91 5,77 5,63 5 6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,68 4,53 4,36 6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,00 3,84 3,67 7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,57 3,41 3,23 8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,28 3,12 2,93
ПРИМЕР (количество факторов – 1) Дисперсионный анализ результатов регрессии Вариация результата Число степеней свободы Сумма квадратов отклонений Дисперсия на одну степень свободы,D Общая 6, Факторная 5,116 ??? Остаточная 1,200 ? --
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t- критерий Стьюдента каждого из показателей и доверительные интервалы. Оценка значимости коэффициентов регрессии и корреляции с помощью t- критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:
Сравнивая фактическое и критическое (табличное) значения t-статистики - t табл и t факт - принимаем или отвергаем гипотезу Н о. Если t табл < t факт то гипотеза H o - о незначимости параметра отклоняется, т.е. a, b и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл > t факт то гипотеза Н о не отклоняется и признается случайная природа формирования а, b или r xy.
доверительный интервал для расчета доверительного интервала определяем предельную ошибку для каждого показателя для коэффициентов регрессии границы доверительного интервала составят:
Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, так как он не может одновременно принимать и положительное, и отрицательное значения.
Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических (дает оценку качества построенной модели ): Допустимый предел значений - не более 8-10%.