Статистические оценки параметров распределения Доверительные интервалы
1.Виды статистических ошибок 2.Интервальные оценки 3.Доверительные интервалы
Виды статистических ошибок Def: Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. Для того, чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным требованиям.
Def: Несмещенной называют статистическую оценку Θ*, математическое ожидание которой равно оцениваемому параметру Θ при любом объеме выборки, т.е. M(Θ*) = Θ. Смещенной, если M(Θ*) Θ. Def: Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.
Def: Состоятельной называют статистическую оценку, которая при n стремится по вероятности к оцениваемому параметру. Оценки бывают точечными, которые определяются одним числом. Все оценки, рассмотренные выше – точечные.
Точечные оценки
При выборке малого объема точечная оценка может разительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальные оценки Интервальные оценки позволяют установить точность и надежность оценок. Пусть найденная по данным выборки статистическая характеристика Θ* служит оценкой неизвестного параметра Θ. Если δ > 0 и Θ – Θ*< δ, то чем меньше δ, тем оценка точнее.
Т.о., положительное число δ характеризует точность оценки. Однако статистические методы не позволяют категорически утверждать, что оценка Θ* удовлетворяет неравенству Θ – Θ*< δ; можно лишь говорить о вероятности γ, с которой это неравенство осуществляется.
Def: Надежностью (доверительной вероятностью) оценки Θ по Θ* называют вероятность γ, с которой осуществляется неравенство Θ – Θ*< δ. γ = 0,95; 0,99; 0,999.
Заменив неравенство Θ – Θ*< δ равносильным уме двойным неравенством Вероятность того, что интервал (Θ* - δ; Θ* + δ) заключает в себе (покрывает) неизвестный параметр Θ, равна γ.
Доверительный интервал Def: Доверительным интервалом называется случайный интервал (Q* - δ; O* + δ), в пределах которого с вероятностью γ находится неизвестный оцениваемый параметр. Доверительные интервалы находят по различным формулам, в зависимости от исходных данных.
Доверительный интервал для математического ожидания нормально распределенного признака с известным средним квадратическим отклонением находят по формуле: где - среднее квадратическое отклонение, t – параметр, величину которого находят по таблицам Лапласа из соотношения γ=2Φ(t).
Приведенная формула позволяет решать следующие задачи: 1) По заданным надежности γ и объеме выборки n находить точность δ и доверительный интервал. 2) По заданным надежности γ и точности δ находить объем выборки n. 3) По заданным точности δ и объеме выборки n находить надежность γ.
В случае большой выборки при n > 30 и неизвестном среднем квадратическом отклонении σ(X) доверительный интервал находят по формуле: где S – исправленное выборочное среднее квадратическое отклонение, то есть оценка σ(X).
Исследование большой выборки может оказаться невозможным по различным признакам. Кроме этого, с уменьшением n доверительный интервал увеличивается. При определении доверительного интервала в случае нормального распределения при неизвестном σ признака X в генеральной совокупности применяют случайную величину:
Эта величина соответствует закону t – распределения Стьюдента. Дифференциальная функция распределения T обозначается S(tγ; n) и зависит только от объема выборки n.
Вероятность попадания случайной величины в соответствующий интервал равна:
Доверительный интервал для оценки математического ожидания при неизвестном σ. где tγ = t(γ; n) – числа, приведенные в специальных таблицах.
Примечание: при большом объеме выборки (n 30) значения tγ таблицы Стьюдента и t таблицы Лапласа практически равны. Поэтому выбор формулы, по которой определяют доверительный интервал, диктуется исходными данными.
Пример Для определения средней живой массы трехмесячного теленка определенной породы были взвешены 100 животных и результаты сведены в таблицу Масса, кг Число телят, гол
Найти: 1)величины, которые следует принять за среднюю массу и среднее квадратическое отклонение; 2)ошибку средней и коэффициетнт вариаций; 3)доверительный интервал, в котором с вероятностью 0,95 заключена средняя масса.
Решение 1) В качестве приближенного значения средней массы принимаем выборочную среднюю, а за значение признака – середины интервалов
Вычисляем выборочную исправленную дисперсию
Находим исправленное выборочное среднее квадратичное отклонение
2) Ошибка средней равна Коэффициент вариации показывает, что изменчивость признака средняя.
3) Поскольку n = 100 > 30 и у нас случай нормального распределения, то доверительный интервал находим по формуле
Из условия 2Φ(tγ) = 0.95 определяем Φ(tγ) = 0,475, а по таблице приложений находим tγ = 1,96. Поэтому или 31,32 < x < 32,68 кг – доверительный интервал для заданной вероятности.
Замечание: если требуется оценить математическое ожидание с наперед заданной точностью δ и надежностью γ, то максимальный объем выборки, который обеспечит эту точность, находится по формуле
Объем выборочной совокупности при повторном способе отбора находят по формуле: где параметр t определяют из по таблицам Лапласа;
Доверительный интервал для оценки среднего квадратического отклонения σ нормального распределения.
q находят по приложению 4 руководства Гмурмана В.С.