Статистическая проверка статистических гипотез. Эмпирический вариационный ряд и его график - вариационная кривая - не позволяют с полной уверенностью судить о законе распределения совокупности, из которой взята выборка. На величине любого варьирующего признака оказывается влияние многочисленных, в том числе и случайных, факторов, искажающих чёткую картинку варьирования. Если закон распределения неизвестен, но имеются основания предположить,что он имеет определённый вид (назовём его А), выдвигают гипотезу: генеральная совокупность распределена по закону А..Таким образом,в этой гипотезе речь идёт о виде предполагаемого распределения.Есть гипотезы о предполагаемой величине параметра.Есть и другие гипотезы: о равенстве параметров двух или нескольких распределений, о независимости выборок и.т.д.
1.Статистической называют гипотезу о виде неизвестного распре- деления, или о параметрах известных распределений. Наряду с выдвинутой гипотезой рассматривают и противореча- щую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая гипотеза. По этой причине эти гипо- тезы целесообразно различать. Def: Нулевой (основной) называют выдвинутую гипотезу Н о Def: Конкурирующей (альтернативной) называют гипотезу Н 1, которая противоречит Н о Различают гипотезы, которые содержат только одно и более одного предложений. Def: Простой называют гипотезу, содержащую только одно предпо- ложение. Def: Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость её проверки. Поскольку проверку проводят статистическими методами её называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т.е. могут быть допущены оши- бки двух родов. Ошибка первого рода состоит в том, что будет отвергнута правиль- ная гипотеза. Ошибка второго рода состоит в том, что будет принята неправиль- ная гипотеза. Замечание: Вероятность совершить ошибку первого рода принято обозначать через α; Её называют уровнем значимости.
Наиболее часто уровень значимости принимают равным 0,05 v 0,01. Если, п-р, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста есть риск пропустить ошибку первого рода (отвергнуть правильную гипотезу) Статистический критерий проверки нулевой гипотезы. Наблюдаемое значение критерия. Для проверки нулевой гипотезы используют специально подобран- ную случайную величину, точное или приближённое распределение которой известно. Эту величину обозначают через Т или Z, если она распределена нормально, F или V 2 - по закону Фишера-Спедекора, Т – по закону Стьюдента, χ 2 – по закону кси - квадрат и.т.д. Поскольку при изложении материала вид распределения во внимание приниматься не будет, обозначим эту величину в целях общности через К. Def: Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки нулевой гипо- тезы.
Для проверки гипотезы по данным выборок вычисляют частичные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия. Def: Наблюдаемым значением К набл называют значение критерия, вычисленное по выборкам. Критическая область. Область принятия гипотезы. Критические точки После выбора определённого критерия множество всех его возможных значений разбивают на два непересекающихся подмножества:одно из них содержит значения критерия,при которых нулевая гипотеза отвергается, а другая - при которых она принимается. Def: Критической областью называют совокупность значений критерия, при которых нулевая гипотеза отвергается.
Def: Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипо- тезу принимают. Основной принцип проверки статистических гипотез можно сформу- лировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значе- ние критерия принадлежит области принятия гипотезы – гипотезу принимают. Поскольку критерий К – одномерная случайная величина, все её значения (возможные) принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также является интервалами и, следовательно, существуют точки, которые их разде- ляют. Def: Критическими точками (границами) К кр называют точки, отде- ляющие критическую область от области принятия гипотезы.
Def: Правосторонней называют критическую область определя- емую неравенством К>k кр, где k кр – положительное число 0 k кр Def: Левосторонней называют критическую область, определяемую неравенством Кk 1
В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенства- ми (в предположении, что k кр >0): К k пр, или равносильным неравенством К > k кр. -k кр 0 k кр К Как найти критическую область? Для отыскания правосторонней критической области достаточно найти критическую точку. Для её нахождения задаются достаточно малой вероятностью- уровнем значимости α. Затем ищут критическую точку k кр, исходя из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий К примет значение, больше k кр,была равна принятому уровню значимости. Р (К>k кр )= α ( )
Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку,удовлетворяющую этому требованию. Замечание 1. Когда критическая точка уже найдена,вычисляют по данным выборок наблюдаемое значение критерия и, если окажется, что К набл > k кр, то нулевую гипотезу отвергают, если же К набл
В этом случае, отвергнув правильную нулевую гипотезу, совершают ошибку первого рода. Вероятность этой ошибки равна уровню зна- чимости α. Итак, пользуясь требованием ( ), мы с вероятностью α рискуем совершить ошибку первого рода. Заметим кстати, что в книгах по контролю качества продукции веро- ятность признать негодной партию годных изделий называют риском производителя, а вероятность принять негодную партию – риском потребителя. Замечание 3 Пусть нулевая гипотеза принята; ошибочно думать, что тем самым она доказана. Действительно, известно, что один пример, подтвер- ждающий справедливость некоторого общего утверждения, ещё не доказывает его. Поэтому более правильно говорить: данные наблю- дений, согласуются с нулевой гипотезой, и, следовательно, не даёт оснований её отвергнуть. На практике для большей уверенности принятия гипотезы её прове- ряют другими способами или проверяют экспериментом, увеличив объём выборки.
Левосторонняя критическая область определяется неравенством К