МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Предмет и методы Лекция 2
2 ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ Что общего и чем отличаются ТВ и МС? ТВ: разработка методов нахождения вероятностей сложных событий, исходя из известных вероятностей более простых событий. МС: прикладная дисциплина, базируется на понятиях и методах теории вероятностей, но решает задачи, обратные теории вероятностей восстанавливает по данным измерений или наблюдений неизвестные вероятности событий или неизвестные законы распределения случайных величин.
3 разрабатывает методы, позволяющие по статистическим данным делать выбор одного из нескольких, противоречащих друг другу, предположений (гипотез) относительно законов распределения случайных величин или о значениях параметров распределений. разрабатывает методы получения, описания и обработки опытных данных для изучения закономерностей случайных массовых явлений
4 Особенность идей и методов математической статистики универсальность, возможность использования в различных приложениях.
5 ОСНОВНЫЕ ПОНЯТИЯ МС Генеральная совокупность Выборка Вариационный ряд Теоретическая функция распределения
6 ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ Пусть исследуется некоторая совокупность объектов, каждому из которых ставится в соответствие некоторая числовая функция случайная величина X распределенная по некоторому неизвестному закону.
7 Практически, мы отождествляем наблюдаемые объекты и сопоставляемые им случайные величины, абстрагируясь от физической природы объектов. Поэтому генеральной совокупностью будем считать множество значений, которые может принимать случайная величина X.
8 Выборка В ходе каждого из испытаний мы случайным образом выбираем один из элементов генеральной совокупности и находим соответствующее ему значение X. Набор чисел будем называть выборкой объема n из генеральной совокупности, а числа X i элементами выборки.
9 ВЫБОРКИ ДОЛЖНЫ БЫТЬ РЕПРЕЗЕНТАТИВНЫМИ Т.Е. Представительными, должны давать обоснованное представление о генеральной совокупности. Чтобы обеспечить представительность, выборка должна быть случайной.
10 Теоретическая функция распределения Рассмотрим выборку единичного объема X 1. Поскольку выбор случаен, то X 1 – случайная величина и, как всякая случайная величина, имеет функцию распределения F(x) = P(X 1 < x). Для выборки произвольного объема n каждый элемент будет иметь точно такую же функцию распределения, если выборка с возвращением или генеральная совокупность бесконечного объема.
11 С точки зрения теории вероятностей выборку можно трактовать как совокупность независимых, одинаково распределенных случайных величин с функцией распределения F(x) = P( X < x). Функция F(x) называется теоретической функцией распределения. Совместная функция распределения выборки задается формулой:
Простейшие статистические преобразования
13 Вариационный и статистический ряды Вариационный ряд X (1),…, X (n) представляет собой ту же выборку X 1,…,X n, но расположенную в порядке возрастания элементов: Такое преобразование выборки не приводит к потере информации относительно теоретической функции распределения
Выборка Вариационный ряд РАНГ элемента выборки -- порядковый номер элемента в вариационном ряду
15 ВЫБОРКА И ВАРИАЦИОННЫЙ РЯД
16 Если среди элементов выборки (вариационного ряда) есть одинаковые, то наряду с ВАРИАЦИОННЫМ рядом используется СТАТИСТИЧЕСКИЙ РЯД --- таблица, в которой указаны все различные значения вариационного ряда ( ВАРИАНТЫ ) и их количество. Статистический ряд характерен для выборок из дискретных распределений, а также и для выборок из непрерывных распределений, полученных при измерениях с округлением.
17 Статистический ряд Z 1 < Z 2 < … < Z k
18 ВЫБОРКА ИЗ БИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ
19 СТАТИСТИКИ Статистика S --- это произвольная измеримая k -мерная функция от выборки, не содержащая неизвестных параметров распределений.
20 Достаточные статистики --- такие, которые содержат всю ту информацию о теоретической функции распределения, что и выборка
21 ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ (ЭФР)--- аналог теоретической функции: F e (x) = m x / n где m x --- число элементов выборки, значения которых не превышает данное x n ---объем выборки.
22 Теоретическая функция распределения и её оценка n = 10n = 500
23 Гистограмма и полигон
24 Гистограмма и полигон
25 Предельное поведение