Статистические оценки параметров распределения Доверительные интервалы.

Презентация:



Advertisements
Похожие презентации
Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.
Advertisements

Интервальное оценивание Лекция 4 для студентов 2 курса, обучающихся по специальности – Медицинская кибернетика доц. Шапиро Л.А. Красноярск, 2015.
Расчет оптимальной численности выборки. Статистическое наблюдение сплошное Обследование всех единиц изучаемой совокупности не сплошное Обследование части.
Элементы математической статиститки. Статистика – дизайн информации.
Выборочное наблюдение. Понятие выборочного наблюдения. Выборочное наблюдение – это такой вид статистического наблюдения, при котором обследованию подвергается.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Визуализация данных Визуализация данных Точечные оценки Точечные оценки Групповые характеристики Групповые характеристики Метод.
{ интервальные оценки параметров - некоторые распределения СВ связанные с нормальным распределением - доверительный интервал для выборочного среднего при.
Анализ вариационных рядов. Анализ вариационных рядов. Основные понятия и определения Генеральная совокупность – множество всех значений, характеризующих.
Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.
Доверительный интервал и доверительная вероятность.
Российский университет дружбы народов Институт гостиничного бизнеса и туризма В.И. Дихтяр Теория и методология социально- экономических исследований в.
6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.
Элементы математической статистики Основные понятия.
Обработка и представление результатов измерений. Оценка случайной погрешности измерений Полученные при непосредственном измерении величины неизбежно содержат.
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ НТБ.
Лекция 2 – Идентификация закона распределения вероятностей одномерной случайной величины 2.1. Основные определения 2.2. Этапы обработки данных одномерной.
Российский университет дружбы народов Институт гостиничного бизнеса и туризма В.И. Дихтяр Теория и методология социально- экономических исследований в.
Статистические гипотезы Лекция 2.
ЛЕКЦИЯ 2 по дисциплине «Физика, математика» на тему: «Основы математической статистики» для курсантов и студентов I курса ФПВ, ФПиУГВ, спецфакультета.
Транксрипт:

Статистические оценки параметров распределения Доверительные интервалы

1.Виды статистических ошибок 2.Интервальные оценки 3.Доверительные интервалы

Виды статистических ошибок Def: Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. Для того, чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным требованиям.

Def: Несмещенной называют статистическую оценку Θ*, математическое ожидание которой равно оцениваемому параметру Θ при любом объеме выборки, т.е. M(Θ*) = Θ. Смещенной, если M(Θ*) Θ. Def: Эффективной называют статистическую оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.

Def: Состоятельной называют статистическую оценку, которая при n стремится по вероятности к оцениваемому параметру. Оценки бывают точечными, которые определяются одним числом. Все оценки, рассмотренные выше – точечные.

Точечные оценки

При выборке малого объема точечная оценка может разительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальные оценки Интервальные оценки позволяют установить точность и надежность оценок. Пусть найденная по данным выборки статистическая характеристика Θ* служит оценкой неизвестного параметра Θ. Если δ > 0 и Θ – Θ*< δ, то чем меньше δ, тем оценка точнее.

Т.о., положительное число δ характеризует точность оценки. Однако статистические методы не позволяют категорически утверждать, что оценка Θ* удовлетворяет неравенству Θ – Θ*< δ; можно лишь говорить о вероятности γ, с которой это неравенство осуществляется.

Def: Надежностью (доверительной вероятностью) оценки Θ по Θ* называют вероятность γ, с которой осуществляется неравенство Θ – Θ*< δ. γ = 0,95; 0,99; 0,999.

Заменив неравенство Θ – Θ*< δ равносильным уме двойным неравенством Вероятность того, что интервал (Θ* - δ; Θ* + δ) заключает в себе (покрывает) неизвестный параметр Θ, равна γ.

Доверительный интервал Def: Доверительным интервалом называется случайный интервал (Q* - δ; O* + δ), в пределах которого с вероятностью γ находится неизвестный оцениваемый параметр. Доверительные интервалы находят по различным формулам, в зависимости от исходных данных.

Доверительный интервал для математического ожидания нормально распределенного признака с известным средним квадратическим отклонением находят по формуле: где - среднее квадратическое отклонение, t – параметр, величину которого находят по таблицам Лапласа из соотношения γ=2Φ(t).

Приведенная формула позволяет решать следующие задачи: 1) По заданным надежности γ и объеме выборки n находить точность δ и доверительный интервал. 2) По заданным надежности γ и точности δ находить объем выборки n. 3) По заданным точности δ и объеме выборки n находить надежность γ.

В случае большой выборки при n > 30 и неизвестном среднем квадратическом отклонении σ(X) доверительный интервал находят по формуле: где S – исправленное выборочное среднее квадратическое отклонение, то есть оценка σ(X).

Исследование большой выборки может оказаться невозможным по различным признакам. Кроме этого, с уменьшением n доверительный интервал увеличивается. При определении доверительного интервала в случае нормального распределения при неизвестном σ признака X в генеральной совокупности применяют случайную величину:

Эта величина соответствует закону t – распределения Стьюдента. Дифференциальная функция распределения T обозначается S(tγ; n) и зависит только от объема выборки n.

Вероятность попадания случайной величины в соответствующий интервал равна:

Доверительный интервал для оценки математического ожидания при неизвестном σ. где tγ = t(γ; n) – числа, приведенные в специальных таблицах.

Примечание: при большом объеме выборки (n 30) значения tγ таблицы Стьюдента и t таблицы Лапласа практически равны. Поэтому выбор формулы, по которой определяют доверительный интервал, диктуется исходными данными.

Пример Для определения средней живой массы трехмесячного теленка определенной породы были взвешены 100 животных и результаты сведены в таблицу Масса, кг Число телят, гол

Найти: 1)величины, которые следует принять за среднюю массу и среднее квадратическое отклонение; 2)ошибку средней и коэффициетнт вариаций; 3)доверительный интервал, в котором с вероятностью 0,95 заключена средняя масса.

Решение 1) В качестве приближенного значения средней массы принимаем выборочную среднюю, а за значение признака – середины интервалов

Вычисляем выборочную исправленную дисперсию

Находим исправленное выборочное среднее квадратичное отклонение

2) Ошибка средней равна Коэффициент вариации показывает, что изменчивость признака средняя.

3) Поскольку n = 100 > 30 и у нас случай нормального распределения, то доверительный интервал находим по формуле

Из условия 2Φ(tγ) = 0.95 определяем Φ(tγ) = 0,475, а по таблице приложений находим tγ = 1,96. Поэтому или 31,32 < x < 32,68 кг – доверительный интервал для заданной вероятности.

Замечание: если требуется оценить математическое ожидание с наперед заданной точностью δ и надежностью γ, то максимальный объем выборки, который обеспечит эту точность, находится по формуле

Объем выборочной совокупности при повторном способе отбора находят по формуле: где параметр t определяют из по таблицам Лапласа;

Доверительный интервал для оценки среднего квадратического отклонения σ нормального распределения.

q находят по приложению 4 руководства Гмурмана В.С.