Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко
Содержание Тема 3. Точность и надежность оценки. Доверительные интервалы 1.Основные понятия 2.Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ 3.Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ
3.1 Основные понятия Точечной называют оценку, которая определяется одним числом. При небольшом объеме выборки используются интервальные оценки, так как точечная оценка статистического параметра по данным выборки может значительного отличаться от оценки статистического параметра генеральной совокупности. Интервальной называют оценку, которая определяется двумя числами – концами интервала, который заключает в себе оценку статистического параметра. Интервальные оценки характеризуются параметрами точности и надежности оценок.
3.1 Основные понятия Точность оценки характеризуется положительным числом δ, которое характеризует величину расхождения между оценками выборки и генеральной совокупности: Надежностью (доверительной вероятностью) оценки θ по θ * называют вероятность γ, с которой осуществляется неравенство, т.е.: В качестве параметров надежности наиболее часто используют величины, близкие к единице: 0,95; 0,99 и 0,999. Доверительным называют интервал, который покрывает неизвестный параметр с заданной надежностью γ.
3.2 Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ Пусть математическое ожидание выборочной средней нормального распределения равно a и среднее квадратическое отклонение – σ Требуется найти доверительные интервалы, покрывающие параметр a с надежностью γ, т.е. Для решения воспользуемся формулой вычисления вероятности заданного отклонения из теории вероятностей:
3.2 Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ Проведя замены X на и σ на, получим Найдя из последнего равенства, можем написать Приняв во внимание, что доверительная вероятность задана и равна γ, и заменив выборочную среднюю на окончательно имеем
3.2 Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ Смысл полученного равенства: С надежностью γ можно утверждать, что доверительный интервал покрывает неизвестный параметр a, точность оценки Число t определяется из соотношения По таблице функции Лапласа находят аргумент t, которому соответствует значение функции Лапласа
3.2 Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ Пример: Случайная величина X распределена нормально с известным средним квадратическим отклонением σ = 3. Требуется найти доверительные интервалы для оценки неизвестного математического ожидания a по выборочным средним, если объем выборки n = 36 и задана надежность оценки γ = 0,95.
3.2 Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ Решение: Найдем t. Из соотношения получим По таблице функции Лапласа находим t = 1,96 Найдем точность оценки: Доверительный интервал: Надежность γ = 0,95 указывает, что если произведено достаточно большое число выборок, то 95% из них определяет такие доверительные интервалы, в которых параметр действительно заключен. Лишь в 5% случаев он может выйти за границы доверительного интервала.
3.2 Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ Замечание 1. Оценку называют классической. Из формулы точности оценки следуют выводы: 1)При возрастании объема выборки n число δ убывает, следовательно точность увеличивается 2)Увеличение надежности оценки приводит к увеличению t. Как следствие, возрастает δ и уменьшается точность оценки Замечание 2. Как следует из равенства точности оценки, минимальный объем выборки, который обеспечит заданную точность оценки математического ожидания, равен:
3.3 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ Требуется оценить неизвестное математическое ожидание a c помощью доверительных интервалов. Поскольку среднее квадратическое отклонение σ неизвестно, то требуется воспользоваться распределением Стьюдента, которое определяется параметром n - объем выборки – и не зависит от неизвестных нам значений a и σ. По данным выборки строится случайная величина t, имеющая распределение Стьюдента с k = n – 1 степенями свободы: где – выборочная средняя S – «исправленное» среднее квадратическое отклонение n – объем выборки
3.3 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ Поскольку функция плотности распределения Стьюдента четная, то вероятность попадания случайной величины в заданный интервал равна или применительно к функции плотности распределения Стьюдента Та же формула с двойным неравенством:
3.3 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ Смысл полученного равенства: С надежностью γ можно утверждать, что доверительный интервал покрывает неизвестный параметр a, точность оценки равна Используя заданные значения n и γ, по таблице функции плотности распределения Стьюдента находим t γ и далее доверительные границы
3.3 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ Пример: Случайная величина X генеральной совокупности распределена нормально. По выборке объема n = 16 найдены выборочная средняя и «исправленное» среднее квадратическое отклонение s = 0,8 Требуется оценить неизвестное математическое ожидание при помощи доверительного интервала с надежностью 0,95
3.3 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ Решение: Найдем t γ. По таблице функции плотности распределения Стьюдента при γ = 0,95 и n = 16 находим t γ = 2,13 Найдем точность оценки: Нижняя доверительная граница: Верхняя доверительная граница: С надежностью 0,95 неизвестный параметр a заключен в доверительном интервале 19,774 < a < 20,626
3.3 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ Замечание. При неограниченном возрастании объема выборки n распределение Стьюдента стремится к нормальному. Поэтому практически при n > 30 можно вместо распределения Стьюдента пользоваться нормальным распределением Однако, для малых выборок (n < 30) использование нормального распределения приводит к ошибочному сужению доверительного интервала. Широкий доверительный интервал, получаемый в результате использования распределения Стьюдента, свидетельствует о том, что малая выборка, безусловно, содержит малую информацию об интересующем нас признаке