{ интервальные оценки параметров - некоторые распределения СВ связанные с нормальным распределением - доверительный интервал для выборочного среднего при известной дисперсии - доверительный интервал для дисперсии при известном математическом ожидании - доверительный интервал для дисперсии при неизвестном среднем - доверительный интервал для среднего при неизвестной дисперсии }
Статистика ã i, используемая в приближенном равенстве ã i = a i называется точечной оценкой неизвестного параметра по выборке. Пример: x f(x) Точечные оценки ã i не совпадают (за исключение редких случаев) с истинным значением неизвестных параметров a i.
Всегда имеется некоторая погрешность при замене неизвестного параметра его оценкой, т.е. | ã (x 1, x 2, …, x n ) – a| < : ãa Если эта вероятность близка к единице то диапазон практически возможных значений ошибки, возникающей при замене ã на a равен. Чем меньше будет, тем точнее оценка ã. Вероятность того, что интервал ( ã - ; ã + ) со случайными границами накроет неизвестный параметр a, равна =. Эта вероятность называется доверительной вероятностью. l x
Доверительным интервалом уровня для параметра ã выборки X = ( x 1, x 2, …, x n ) из генеральной совокупности F ( x, a ) называется интервал ( ã (1), ã (2) ) со случайными границами, такой что: Найти оптимальное решение по всем объектам как правило невозможно. Один из способов: задаться надежностью (обычно это число близкое единице: 0.9; 0.95; 0.99) и затем попытаться найти из всех интервалов уровня такой, у которого длина L будет наименьшей, то есть оценка будет наиболее точной. Число называется доверительным уровнем интервала. Оно характеризует надежность этого интервала. Увеличивая длину интервала, мы увеличиваем надежность. Но при этом уменьшается точность оценки.
Пусть 1, 2, …, n есть независимые СВ, имеющие стандартное нормальное распределение. Распределение суммы квадратов этих величин называется распределением Хи-квадрат с n степенями свободы. x f(x) n = 2 n = 1 n > Мах в точке x = n - 2 Гамма функция Эйлера Плотность распределения Charles Pearson ( )
Гамма функция Эйлера Плотность распределения Пирсона
Пусть 1, 2, …, n, 0 есть независимые СВ, со стандартным нормальным распределением. Распределением Стьюдента с n степенями свободы называют распределение x f(x) n = 1 1 Плотность распределения William Gosset (1876 – 1937) Сходится к СНЗ
Пусть даны случайные величины 1, 2, …, n, n+1, n+2, …, n+m - независимые СВ, имеющие стандартное нормальное распределение и величины, имеющие распределение хи-квадрат с n и m степенями свободы соответственно. Распределением Фишера со степенями свободы ( n, m ) – называется распределение F n, m Плотность распределения x f(x) 1 x = (n-2)m/n(m+2) Ronald Fisher (1890 – 1962)
Предположим, что параметр m неизвестен, а дисперсия 2 известна. F G (t) = (t) Используется таблица
Предположим, что параметр m неизвестен, а дисперсия 2 известна. F G (t) = (t) Выбираем Решаем неравенства и получаем :
Функция G(x норм. ) имеет хи-квадрат распределение с n – степенями свободы, не зависящее от неизвестного параметра 2 Обозначая h (n) - квантили этого распределения и фиксируя = 1 - приходим к неравенству, выполняемому с вероятностью
Обозначая h (n-1) - квантили этого распределения и фиксируя = 1 - приходим к неравенству, выполняемому с вероятностью Оба параметра неизвестны. m – мешающий параметр. Функция G (x норм. ) имеет хи-квадрат распределение с (n-1) – степенями свободы, не зависящее от неизвестного параметра 2
Обозначая t (n) - квантили этого распределения и фиксируя = 1 - приходим к неравенству, выполняемому с вероятностью Выбирается функция G имеющая распределение Стьюдента с (n-1) – степенями свободы.
@ Найти доверительный инервал для среднего значения генеральной совокупности при больших объемах выборки (n > 30) Это точечные оценки По выборочным данным находим выборочные cреднее арифметическое для m и стандартное отклонение S
@ Задаемся доверительной вероятностью : = 0,95. Находим значение t, соответствующее заданной доверительной вероятности t 0,05 = 1,96.
@ Для контроля качества в 40 пробах стали GS50 определялось содержание углерода x (%С) и прочность на разрыв z (Н/мм ). Данные оформлены в виде таблицы чисел: X: 0.3, 0.33, 0.37, 0.36, 0.31, 0.29, 0.34, 0.39, 0.37, 0.38, 0.35, 0.32, 0.39, 0.3, 0.32, 0.32, 0.38, 0.37, 0.38, 0.33, 0.37, 0.33, 0.34, 0.33, 0.3, 0.34, 0.36, 0.33, 0.34, 0.36, 0.29, 0.3, 0.33, 0.32, 0.32, 0.38, 0.37, 0.34, 0.35, 0.36 X = X ( x 1, x 2, …, x 40 ) – выборка объемом n = 40 Z: 589, 614, 612, 572, 548, 537, 574, 570, 540, 575, 535, 593, 582, 538, 566, 562, 601, 587, 587, 614, 602, 544, 545, 562, 576, 596, 605, 575, 570, 550, 572, 555, 555, 518, 539, 557, 558, 587, 580, 560 Z = Z (z 1, z 2, …, z 40 ) – выборка объемом n = 40
@ Найти доверительные интервалы для m x и m z, теоретических значений содержания углерода и прочности на разрыв стали GS50. По таблице распределения Стьюдента определим приближенно: Напомним, что объем каждой из выборок : n = 40. Зафиксируем доверительную вероятность, близкую к единице : = 0.95.