Основы математической статистики Лекция 19
План лекции: 1.Задачи математической статистики. 2.Дискретные и интервальные ряды распределения. Числовые характеристики. 3.Точечные и интервальные оценки.
Что такое математическая статистика? математическая статистика – это одновременно искусство и наука извлечения полезной информации из данных, полученных в результате наблюдений или экспериментов
Объекты, изучаемые математической статистикой Генеральная совокупность – конечное или бесконечное множество объектов, обладающих определенными математическими свойствами. Выборка - некоторое число случайным образом выбранных объектов из конечной или бесконечной генеральной совокупности; число выбранных объектов называют объемом выборки.
Какие задачи нас интересуют? - определение закона распределения случайной величины по выборочным данным; - задача проверки правдоподобия гипотез (отличия характеристик выборки от некоторых неслучайных величин; отличия характеристик нескольких выборок; связь случайных величин из разных выборок); - Задача нахождения неизвестных параметров распределения.
Статистическая функция распределения Пусть имеется некоторая случайная величина Х, закон распределения которой неизвестен и требуется проверить гипотезу о том, что эта случайная величина подчиняется тому или иному закону. С этой целью над случайной величиной проводится ряд независимых опытов. В каждом из них случайная величина Х принимает определенное значение. Первичный статистический материал: совокупность найденных значений Х (простой статистический ряд). Эти данные необходимо обрабатывать, но как?
Статистическая функция распределения случайной величины Х Рассмотрим эксперимент, который поможет понять смысл этой функции: Дана некоторая группа людей, мы измеряем их рост и пытаемся определить закономерности распределения людей по росту.
Результаты эксперимента Эмпирическая функция распределения Эмпирическая функция плотности распределения
Математическая статистика (числовые данные) Статистика случайных величин (одномерная статистика ) Многомерная статистика (факторный анализ) Временные ряды
Задачи одномерной статистики Описательная статистика (представление экспериментальных данных, определение точечных и интервальных оценок) Проверка статистических гипотез (о законе распределения, параметрах распределения)
Значения изучаемого признака называются вариантами Последовательность вариант, расположенных в возрастающем порядке называется вариационным рядом Например: 172, 179, 158, 186, 164 Вариационный ряд: 158, 164, 172, 179, 186
Непараметрические характеристики Me-медиана Варианта, которая делит ряд пополам 158, 164, 172, 175, 175, 179, 186 при n- нечетном Ме= , 164, 168, 172, 174, 175, 179, 186 при n- четном
Непараметрические характеристики Mo-наиболее часто встречающаяся варианта 158, 164, 172, 175, 175, 175, 179, 186 Мо= , 164, 173, 173, 175, 175, 179, 186 бимодальные выборки- если два несмежных значения имеют одинаковые частоты
Вариационные ряды дискретныенепрерывные Статистическим рядом распределения называется набор вариант и соответствующих им абсолютных и относительных частот
Статистический ряд распределения ХX1X1 X2X2 …XnXn mm1m1 m2m2 …mnmn m/nm 1 /nm 2 /n…m n /n
Да Нет М σ, М m, M (95% ДИ) Сравнение 2-х выборок по критерию Стьюдента Корреляция по Пирсону Параметрическая статистика Ме [25%-75%], Мo, Min-Max Сравнение 2-х выборок по критериям Манна- Уитни, Вилкоксона Корреляция по Спирмену Непараметрическая статистика
Основные этапы исследования: Сгруппировать исследуемый ряд по классам. Подсчитать середины интервалов и частоты попадания в интервал. Построить гистограмму и полигон распределения. Найти эмпирическую функцию распределения и построить ее график. Вычислить числовые (точечные) характеристики распределения. Проверить гипотезу о том, что генеральная совокупность, из которой извлечена выборка, распределена по нормальному закону, используя критерии асимметрии и эксцесса. Проверить гипотезу о том, что генеральная совокупность, из которой извлечена выборка, распределена по нормальному закону, используя критерий Пирсона 2
Ряд распределения студентов по росту
Размах распределения Из имеющихся значений признака Х выбирают наименьшее (Хmin), наибольшее (Хmax), определяют размах распределения (Хmax – Хmin) =39
X m m/n4/50 0,08 14/50 0,28 20/50 0,4 9/50 0,18 3/50 0,06 0,08/10 0,0080,0280,040,0180,006 Статистический ряд распределения студентов по росту
Гистограмма распределения студентов по росту (m, m/n, f(x))
Функция распределения вероятностей X
График F(x)
Точечные характеристики
Интервал mip=mi/n *p ( - M) 2 ( - M) 2 * p ,0811,6345,9627, ,2843,473,9620, ,4661,960, ,1831,5129,9623, ,0611,1457,9627, ,6100,04 Числовые характеристики
D(X)=100 σ=10 см
Числовые характеристики статистического распределения Среднее Свойства точечных оценок: дисперсия Оценка называется несмещённой, если ее математическое ожидание равно оцениваемому параметру генеральной совокупности Оценка называется эффективной, если она обладает минимальной дисперсией среди всех возможных несмещенных точечных оценок. Оценка называется состоятельной, если она по вероятности с увеличением объема выборки n стремится к параметру генеральной совокупности
Доверительный интервал для роста студентов с вероятностью p=0,95 ( =0,05); M(x)=163,6 см, σ=10 см Δх=1, см Следовательно, рост студентов находится в интервале: 163,6-20
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА: Основная литература: Павлушков И.В. Основы высшей математики и математической статистики. М., ГЭОТАР-Медиа, 2005, с Ремизов А.Н., Максина А.Г. Сборник задач по медицинской и биологической физике. М., Дрофа, Учебно–методические пособия: Шапиро Л.А., Шилина Н.Г. Руководство к практическим занятиям по медицинской и биологической статистике Красноярск: ООО «Поликом». – 2003.