Описательная статистика Параметры распределения. Асимметрия, эксцесс, модальность Распределение оценок студентов по разным разделам дисциплины: А – отрицательная.

Презентация:



Advertisements
Похожие презентации
ОСНОВНЫЕ СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ, ИСПОЛЬЗУЕМЫЕ В ГЕОЛОГИИ Лекция 3 по дисциплине «Математические методы моделирования в геологии» 1Грановская Н.В.
Advertisements

Описательные характеристики распределения тестовых результатов 1.Меры среднего положения (меры центральной тенденции). Мода, медиана, среднее 2.Меры вариации.
Минаева Татьяна Александровна Демьяненко Ирина Николаевна.
Статистическая таблица Вариационный ряд X i F i
СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ НТБ.
Лекция 2 – Идентификация закона распределения вероятностей одномерной случайной величины 2.1. Основные определения 2.2. Этапы обработки данных одномерной.
Нормальное распределение: свойства и следствия из них
Теория статистики Описательная статистика и получение статистических выводов Часть 2. 1.
Основы статистики Краткий конспект.. 1. Статистика (лат.status – государство, его состояние, определяемое по результатам наблюдения) – наука, изучающая.
Оценка вариативности Л.Е.Федорова. Признак Признак это свойство, проявлением которого один предмет отличается от другого. Характерным свойством признака.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА (озвученная интерактивная презентация) РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ФИЗИЧЕСКОЙ КУЛЬТУРЫ, СПОРТА, МОЛОДЕЖИ И ТУРИЗМА.
Российский университет дружбы народов Институт гостиничного бизнеса и туризма В.И. Дихтяр Теория и методология социально- экономических исследований в.
Статистические показатели План темы 1.Абсолютные и относительные величины 2.Средние величины 3.Структурные средние.
Расчет оптимальной численности выборки. Статистическое наблюдение сплошное Обследование всех единиц изучаемой совокупности не сплошное Обследование части.
1 Описательная статистика. 2 Основные понятия Переменная = одна характеристика объекта или события Количественные: возраст, ежегодный доход Качественные:
Случайные величины: законы распределения. Что было: понятие о случайной величине СЛУЧАЙНОЙ ВЕЛИЧИНОЙ называется величина, которая в результате испытания.
Проверка статистических гипотез Лекция 20. План лекции: 1.Проверка статистических гипотез. 2.Критерии асимметрии и эксцесса. 3.Критерий Пирсона.
АРИФМЕТИЧЕСКОЕ СРЕДНЕЕ, МЕДИАНА И МОДА. Основные характеристики величин можно разбить на две группы: 1) характеристики расположения, или средние; 2) характеристики.
ЭЛЕМЕНТЫ СТАТИСТИКИ Сбор и группировка статистических данных.
Сбор и группировка статистических данных Частота.
Транксрипт:

Описательная статистика Параметры распределения

Асимметрия, эксцесс, модальность Распределение оценок студентов по разным разделам дисциплины: А – отрицательная асимметрия, В – положительная асимметрия, С – симметричное распределение, D – отрицательный эксцесс, E – положительный эксцесс, F – бимодальное распределения

Параметры главной тенденции: «Каково типичное значение признака для данного распределения?» Среднее значение Мода Медиана

Среднее значение

Медиана (Ме) Для нахождения медианы необходимо упорядочить выборку по возрастанию и найти элемент, стоящий посередине вариационного ряда Если n – нечетное число, то медианой будет элемент с номером i= (n+1)/2 в упорядоченном по возрастанию ряду. Например, в выборке объемом 7 медианой будет 4 элемент вариационного ряда: 3,1 3,8 4,2 5,7 6,3 7,2 7,9 Ме = х 4 = 5,7 Если n – четное число, то медианой будет среднее значение двух элементов вариационного ряда с номерами i=n/2 и j=n/2+1. Например, при n=10 медианой будет среднее арифметическое 5 и 6 элементов вариационного ряда: 3,1 3,8 4,2 5,7 6,3 7,5 7,9 8,4 8,5 9,2 Ме = (х 5 + х 6 )/2 = (6,3+7,5)/2 = 6,9

Параметры разброса Определяют различия в значениях признака у разных объектов Размах вариации Дисперсия Стандартное отклонение Коэффициент вариации

Дисперсия Выборочная дисперсия: Дисперсия генеральной совокупности:

Стандартное отклонение Коэффициент вариации V<33% выборка однородная

Стандартная ошибка среднего Разные выборки дают разные оценки параметров распределения. Для характеристики точности выборочных оценок используют стандартную ошибку среднего: Не является параметром разброса, только показывает точность оценки среднего. Чем больше выборка, тем меньше ошибка и выше точность

Процентили 25-ый и 75-ый процентили (квартили) отсекают от распределения по четверти, т.е. одна четверть значений распределения будет не больше 25-го процентиля, а одна четверть – больше 75-го процентиля. Медиана – это 50-ый процентиль. 3,1 3,8 4,2 5,7 6,3 7,5 7,9 8,4 8,5 9,2 25% = 4,2 75% = 8,4

Нормальное распределение

Свойства нормального распределения Полностью определяется средним значением и стандартным отклонением Мода, медиана и среднее значение совпадают Среднее значение характеризует положение кривой распределения и место ее максимума Стандартное отклонение характеризует форму кривой Зная среднее и стандартное отклонение, ориентировочно можно указать интервал практически всех значений изучаемой величины.

Распределение по росту

Симметричное и асимметричные распределения

Способы проверки соответствия распределения нормальному закону 1) Способы, основанные на визуальной оценке близости распределения признака к нормальному: – построение гистограммы распределения признака – построение графика функции распределения признака 2) Вычисление коэффициентов асимметрии и эксцесса. Для нормального распределения эти показатели равны 0. 3) Вычисление среднего, моды, медианы и процентилей 4) Статистические критерии для проверки нормальности распределения (Пирсона, Колмогорова-Смирнова, Лиллиефорса (Lilliefors), Шапиро-Уилка (Shapiro–Wilk).

Проверка соответствия распределения нормальному закону 1) выборочные среднее, медиана и мода должны быть близки по значению и находиться примерно посередине между 25 и 75 процентилями; 2) интервал среднее ± два стандартных отклонения должен включать примерно 95% значений выборки и не должен содержать много значений, которых не может быть в данном распределении (например, отрицательных, если речь идет о данных, которые могут принимать только положительные значения).

Часто ли встречается нормальное распределение? Можно сказать, что из всех распределений в природе чаще всего встречается именно нормальное распределение – отсюда и произошло его название. Но для данных биомедицинских исследований это не всегда верно. Нормальное распределение встречается в биомедицинских признаках примерно в 20-25% (???). До тех пор пока выборка достаточно большая (например, 30 (100) или больше наблюдений), можно считать, что выборочное распределение нормально (???).

Как правильно использовать параметры распределения для описания данных? Купе 1: пассажиры возраста 19, 20, 21 год Купе 2: пассажиры возраста 54, 2 и 4 года Каков средний возраст пассажиров каждого купе?

Пример: распределение возраста пациентов, заболевших менингитом, вызванным гемофильной палочкой 1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,20,50,71 n=23 Среднее = 7, Стандартное отклонение = 17,6 Медиана = 1, Мода = 1, 25 процентиль = 1, 75 процентиль = 1.

Описание количественных данных в зависимости от вида их распределения Для описания выборочного нормального распределения количественных признаков необходимо указывать: число наблюдений, среднее значение, стандартное отклонение. Для описания выборочного распределения количественных признаков, которое отличается от нормального, рекомендуется указывать: число наблюдений, медиану, 25 и 75 процентили (нижний и верхний квартили).

1: 21, 22, 22, 23, 23, 24, 24, 24, 25, 25, 25, 25, 26, 26, 26, 26, 27, 27, 28, 29, 30 2: 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21, 21, 21, 21, 21, 33, 34, 34, 36, 37, 42 n 1 =n 2 =21 Среднее 1 = 25,14; Ст. отклон. 1 = 2,31; Медиана = 25; Мода=25 и 26 Среднее 2 = 25,00; Ст. отклон. 2 = 7,32; Медиана = 21; Мода 21

Визуальное представление 1 и 2 распределения

Примеры взаимного расположения параметров для разных видов распределений

Пример Найти параметры следующего выборочного распределения (клинические оценки тяжести серповидноклеточной анемии): Можно ли считать, что выборка извлечена из совокупности с нормальным распределением?

Таблица для расчета параметров распределения Значе- ния x i Частоты p i Накоплен- ные частотыxipixipi x i - X(x i – X ) 2 p i(x i - X) ,099,5528, ,094,3748, ,091,194, ,090,010, ,910,831, ,913,6514, ,918, ,9115, ,9134, ,9147, ,9162,57 n=p i =33 =102 =266,8

n= 33 Mo=1 (p=11) Me=x (33+1)/2 =x 17 = 2 n/4=33/4=8,258 25%=x 8 = 1 3/4=3*33/4=24, %=x 25 =5 3,09-2*2,89=-2,69; 3,09+2*2,89=8,87 Интервал: -2,69 8,87

Проверка нормальности 1) Среднее, медиана и мода не совпадают, не находятся посередине между 25 и 75-м процентилями 2)Около четверти значений интервала среднее ± два стандартных отклонения имеют отрицательный знак, а в исходной выборке по самой природе изучаемого признака не может быть отрицательных значений Выборка вряд ли извлечена из совокупности с нормальным законом распределения