Дисциплина «Статистика» АЛТУХОВА АЛТУХОВА Ирина Анатольевна dvi_mmit@mail.ru.

Презентация:



Advertisements
Похожие презентации
Элементы математической статиститки. Статистика – дизайн информации.
Advertisements

Вариационные ряды распределения и их числовые определения Преподаватель математики МИПК им. И. Федорова Епихина Е.В.
Анализ вариационных рядов. Анализ вариационных рядов. Основные понятия и определения Генеральная совокупность – множество всех значений, характеризующих.
Лекция 2 – Идентификация закона распределения вероятностей одномерной случайной величины 2.1. Основные определения 2.2. Этапы обработки данных одномерной.
Теория статистики Описательная статистика и получение статистических выводов Часть 2. 1.
1 Элементы математической статистики Задача математической статистики – создание методов сбора и обработки статистических данных для получения научных.
Российский университет дружбы народов Институт гостиничного бизнеса и туризма В.И. Дихтяр Теория и методология социально- экономических исследований в.
Средние величины Средняя величина обобщает качественно однородные значения признака.
ОСНОВНЫЕ СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ, ИСПОЛЬЗУЕМЫЕ В ГЕОЛОГИИ Лекция 3 по дисциплине «Математические методы моделирования в геологии» 1Грановская Н.В.
Статистические показатели План темы 1.Абсолютные и относительные величины 2.Средние величины 3.Структурные средние.
СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ НТБ.
ЛЕКЦИЯ 5 § 1. ОСНОВНЫЕ ПОНЯТИЯ Ме Медиана (Ме) - значение варьирующего признака, приходящееся на середину ряда, варианта, делящая ряд на две равные частиМедиана.
Минаева Татьяна Александровна Демьяненко Ирина Николаевна.
Т ЕМА 7. «Р ЯДЫ РАСПРЕДЕЛЕНИЯ В СТАТИСТИКЕ ». Ц ЕЛЬ : ИЗУЧИТЬ ПОНЯТИЕ СТАТИСТИЧЕСКОГО РЯДА РАСПРЕДЕЛЕНИЯ, ЕГО ВИДЫ ; НАУЧИТЬСЯ ОПРЕДЕЛЯТЬ И ОТЛИЧАТЬ СПОСОБЫ.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Визуализация данных Визуализация данных Точечные оценки Точечные оценки Групповые характеристики Групповые характеристики Метод.
1 Описательная статистика. 2 Основные понятия Переменная = одна характеристика объекта или события Количественные: возраст, ежегодный доход Качественные:
Элементы математической статистики Основные понятия.
Техника построения вариационных рядов. Пример:На основании многолетних клинических наблюдений, проводившихся в Сухумском питомнике обезьян, составлена.
Описательная статистика Параметры распределения. Асимметрия, эксцесс, модальность Распределение оценок студентов по разным разделам дисциплины: А – отрицательная.
Средние величины. Средняя величина – обобщающая характеристика совокупности однотипных явлений по какому-либо количественно изменяющемуся признаку.
Транксрипт:

Дисциплина «Статистика» АЛТУХОВА АЛТУХОВА Ирина Анатольевна

Описательная статистика

Описательная статистика Описательная статистика позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте.

Основные понятия Генеральная совокупностьГенеральная совокупность – совокупность всех элементов, соответствующих некоторому явлению ВыборкаВыборка – часть генеральной совокупности ПараметрыПараметры – характеристики генеральной совокупности ОценкаОценка – приближенное значение параметра генеральной совокупности, полученное на основе выборки

Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.

Ряды распределения Атрибутивный - если за основу группировки взят качественный признак (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.). Вариационный - если ряд распределения построен по количественному признаку.

Построить вариационный ряд – значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать число единиц совокупности с этими значениями (построить групповую таблицу).

Формы вариационного ряда Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Дискретный ряд - это вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). Интервальный ряд – ряд, в основе которого признак имеет непрерывное изменение.

Превышение разрешенной скорости движения (км/ч) Кол-во нарушений Больше 605

Экзаменационная оценкаКол-во студентов

Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается f i, сумма частот, равная объему исследуемой совокупности, обозначается где k - число вариантов значений признака

Очень часто таблица дополняется графой c накопленными частотами S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение.

Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме

Ряды распределения и методы их графического изображения Пример. При опросе 20 слушателей курсов по вождению автомобилей были получены следующие данные: 82, 58, 87, 63, 53, 38, 77, 97, 82, 76, 34, 68, 95, 64, 78, 66, 25, 93, 53,73 (в 100-бальной шкале). Задание. 1.Построить дискретный вариационный ряд. 2. Построить ряд распределения частот, относительных и накопленных частот (для 7 интервалов). 3. Построить гистограмму, полигон частот и полигон накопленных частот.

1.Построим дискретный вариационный ряд. 25, 34, 38, 53, 53, 58, 63, 64, 66, 68, 73, 76, 77, 78, 82, 82, 87, 93, 95, 97 – дискретный вариационный ряд.

2. Построим интервальный ряд частот, относительных и накопленных частот (для 7 интервалов). - размах вариации. k=7 – количество интервалов ряда.

Построение интервального ряда 1. Формула Стерджесса: к=1+3,322lgN, где к – число групп; N – число единиц совокупности. 2., где - максимальное значение признака; - минимальное значение признака.

Интер- валы ЧастотаОтносит. частота Накопл. частота Средняя точка (24-35] (35-46] (46-57] (57-68] (68-79] (79-90] (90-101]

Интер- валы ЧастотаОтносит. частота Накопл. частота Средняя точка (24-35]2 (35-46]1 (46-57]2 (57-68]5 (68-79]4 (79-90]3 (90-101]3 20

Интер- валы ЧастотаОтносит. частота Накопл. частота Средняя точка (24-35]20,1 (35-46]10,05 (46-57]20,1 (57-68]50,25 (68-79]40,2 (79-90]30,15 (90-101]30,15 201

Интер- валы ЧастотаОтносит. частота Накопл. частота Средняя точка (24-35]20,12 (35-46]10,053 (46-57]20,15 (57-68]50,2510 (68-79]40,214 (79-90]30,1517 (90-101]30,1520 1

Интер- валы ЧастотаОтносит. частота Накопл. частота Средняя точка (24-35]20,1229,5 (35-46]10,05340,5 (46-57]20,1551,5 (57-68]50,251062,5 (68-79]40,21473,5 (79-90]30,151784,5 (90-101]30,152095,5 201

Графическое изображение рядов распределения: 1. Гистограмма – это график, представляющий собой ряд столбцов. Ширина каждого столбца равна величине интервала, а высота – частоте. По горизонтальной оси откладывают границы группы, а по вертикальной – частоты.

2. Полигон частот - это ломаная линия, соединяющая точки с координатами: - для дискретного ряда; - для интервального ряда.

3. Полигон накопленных частот (кумулятивный полигон) – это ломаная линия, соединяющая точки с координатами, где - варианта для дискретного ряда и граница группы для интервального ряда.

Характеристики ряда распределения

1. Характеристики центра распределения Среднее арифметическое Определение. Средней арифметической вариационного ряда называется сумма произведений всех вариант на соответствующие частоты, деленная на сумму частот: где - варианты дискретного ряда или - середины интервалов; - соответствующие им частоты; k – число неповторяющихся вариант или число интервалов;

Для несгуппированного ряда все частоты, а есть «невзвешенная» средняя арифметическая.

Медиана Определение. Медианой (Ме) вариационного ряда называется значение признака, приходящееся на середину ранжированного ряда наблюдений. Для дискретного вариационного ряда с нечетным числом членов медиана равна средней варианте, а для ряда с четным числом членов–полусумме двух средних значений ряда.

Для интервального вариационного ряда находится медианный интервал, а значение медианы на этом интервале находят по следующей формуле: где - нижняя граница медианного интервала; n/2–порядковый номер медианы; k – порядковый номер интервала, где находится медиана; - накопленная частота до медианного интервала; - частота медианного интервала; h – длина медианного интервала. Медианный интервал определяется по полусумме частот интервального ряда n/2.

Мода Определение. Модой (Мо) вариационного ряда называется варианта, имеющая наибольшую частоту. Для дискретного вариационного ряда модой будет варианта, имеющая наибольшую частоту.

Для интервального вариационного ряда сначала определяют модальный интервал, а затем мода вычисляется по следующей формуле: где - нижняя граница модального интервала; - частоты соответственно предмодального, модального, послемодального интервалов; h – длина модального интервала. Для интервальных вариационных рядов модальный интервал находится по наибольшей частоте.

2. Характеристики вариации Дисперсия Определение. Дисперсией вариационного ряда называется средняя арифметическая квадратов отклонений вариант от их средней арифметической:

Для несгруппированного ряда формула имеет вид: В случае интервального вариационного ряда:

Вычисление дисперсии можно упростить, используя следующую теорему. Теорема 1. Дисперсия равна разности между средней арифметической квадратов вариант и квадратом средней арифметической: где

Среднее квадратическое отклонение Среднее квадратическое отклонение рассчитывается по формуле:

Коэффициент вариации Коэффициент вариации является относительной величиной, характеризующей однородность значений признака, и вычисляется по формуле: Считается, что совокупность однородная, если V 100%.

Выборочный метод и статистическое оценивание

Центральная предельная теорема статистики Известно, что если V (объем) достаточно велик ( ), то независимо от закона распределения исходной совокупности, имеющей генеральную среднюю и стандартное отклонение, выборочная совокупность имеет нормальный закон распределения с характеристиками и, где - стандартное отклонение выборочных средних от генеральной средней или стандартная ошибка в выборке. При этом: - центральная предельная теорема статистики.

Точечное оценивание Оценка: точечная и интервальная. Оценка – это приближенное значение параметра генеральной совокупности, полученное на основе выборки. Оценка называется точечной, если она выражается одним числом.

Значение параметра генеральной совокупности ОценкаВыборочное значение

Значение параметра генеральной совокупности Название параметра Генеральное среднее Генеральная дисперсия Среднее квадратическое отклонение Стандартное отклонение средней

Выборочная дисперсия Выборочная дисперсия – смещенная оценка генеральной дисперсии. Оценка называется несмещенной, если

Интервальное оценивание Доверительный интервал – это интервал, который с заданной вероятностью накрывает истинное значение параметра генеральной совокупности.

Доверительный интервал для средней где - стандартизированная случайная величина, имеющая нормальный закон распределения ; - доверительная вероятность; - вероятность ошибки.

Рассмотрим случай, когда - неизвестна.

Если нельзя использовать z-распределение г. – английский статистик В. Госсет (Стьюдент). Плотность вероятностей распределения Стьюдента имеет вид: где t – текущая переменная; n – объем выборки; В – некоторая величина, зависящая от n.

Распределение Стьюдента имеет один параметр: d.f. – число степеней свободы (k): Итак, если то доверительный интервал имеет вид: Если - неизвестна, то

Доверительный интервал для разности средних где - стандартная ошибка разности средних.