Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 6 лет назад пользователемАКБОТА ЕСПЕРОВА
1 Описательная статистика Параметры распределения
2 Асимметрия, эксцесс, модальность Распределение оценок студентов по разным разделам дисциплины: А – отрицательная асимметрия, В – положительная асимметрия, С – симметричное распределение, D – отрицательный эксцесс, E – положительный эксцесс, F – бимодальное распределения
3 Параметры главной тенденции: «Каково типичное значение признака для данного распределения?» Среднее значение Мода Медиана
4 Среднее значение
5 Медиана (Ме) Для нахождения медианы необходимо упорядочить выборку по возрастанию и найти элемент, стоящий посередине вариационного ряда Если n – нечетное число, то медианой будет элемент с номером i= (n+1)/2 в упорядоченном по возрастанию ряду. Например, в выборке объемом 7 медианой будет 4 элемент вариационного ряда: 3,1 3,8 4,2 5,7 6,3 7,2 7,9 Ме = х 4 = 5,7 Если n – четное число, то медианой будет среднее значение двух элементов вариационного ряда с номерами i=n/2 и j=n/2+1. Например, при n=10 медианой будет среднее арифметическое 5 и 6 элементов вариационного ряда: 3,1 3,8 4,2 5,7 6,3 7,5 7,9 8,4 8,5 9,2 Ме = (х 5 + х 6 )/2 = (6,3+7,5)/2 = 6,9
6 Параметры разброса Определяют различия в значениях признака у разных объектов Размах вариации Дисперсия Стандартное отклонение Коэффициент вариации
7 Дисперсия Выборочная дисперсия: Дисперсия генеральной совокупности:
8 Стандартное отклонение Коэффициент вариации V<33% выборка однородная
9 Стандартная ошибка среднего Разные выборки дают разные оценки параметров распределения. Для характеристики точности выборочных оценок используют стандартную ошибку среднего: Не является параметром разброса, только показывает точность оценки среднего. Чем больше выборка, тем меньше ошибка и выше точность
10 Процентили 25-ый и 75-ый процентили (квартили) отсекают от распределения по четверти, т.е. одна четверть значений распределения будет не больше 25-го процентиля, а одна четверть – больше 75-го процентиля. Медиана – это 50-ый процентиль. 3,1 3,8 4,2 5,7 6,3 7,5 7,9 8,4 8,5 9,2 25% = 4,2 75% = 8,4
11 Нормальное распределение
12 Свойства нормального распределения Полностью определяется средним значением и стандартным отклонением Мода, медиана и среднее значение совпадают Среднее значение характеризует положение кривой распределения и место ее максимума Стандартное отклонение характеризует форму кривой Зная среднее и стандартное отклонение, ориентировочно можно указать интервал практически всех значений изучаемой величины.
13 Распределение по росту
14 Симметричное и асимметричные распределения
15 Способы проверки соответствия распределения нормальному закону 1) Способы, основанные на визуальной оценке близости распределения признака к нормальному: – построение гистограммы распределения признака – построение графика функции распределения признака 2) Вычисление коэффициентов асимметрии и эксцесса. Для нормального распределения эти показатели равны 0. 3) Вычисление среднего, моды, медианы и процентилей 4) Статистические критерии для проверки нормальности распределения (Пирсона, Колмогорова-Смирнова, Лиллиефорса (Lilliefors), Шапиро-Уилка (Shapiro–Wilk).
16 Проверка соответствия распределения нормальному закону 1) выборочные среднее, медиана и мода должны быть близки по значению и находиться примерно посередине между 25 и 75 процентилями; 2) интервал среднее ± два стандартных отклонения должен включать примерно 95% значений выборки и не должен содержать много значений, которых не может быть в данном распределении (например, отрицательных, если речь идет о данных, которые могут принимать только положительные значения).
17 Часто ли встречается нормальное распределение? Можно сказать, что из всех распределений в природе чаще всего встречается именно нормальное распределение – отсюда и произошло его название. Но для данных биомедицинских исследований это не всегда верно. Нормальное распределение встречается в биомедицинских признаках примерно в 20-25% (???). До тех пор пока выборка достаточно большая (например, 30 (100) или больше наблюдений), можно считать, что выборочное распределение нормально (???).
19 Как правильно использовать параметры распределения для описания данных? Купе 1: пассажиры возраста 19, 20, 21 год Купе 2: пассажиры возраста 54, 2 и 4 года Каков средний возраст пассажиров каждого купе?
20 Пример: распределение возраста пациентов, заболевших менингитом, вызванным гемофильной палочкой 1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,20,50,71 n=23 Среднее = 7, Стандартное отклонение = 17,6 Медиана = 1, Мода = 1, 25 процентиль = 1, 75 процентиль = 1.
21 Описание количественных данных в зависимости от вида их распределения Для описания выборочного нормального распределения количественных признаков необходимо указывать: число наблюдений, среднее значение, стандартное отклонение. Для описания выборочного распределения количественных признаков, которое отличается от нормального, рекомендуется указывать: число наблюдений, медиану, 25 и 75 процентили (нижний и верхний квартили).
22 1: 21, 22, 22, 23, 23, 24, 24, 24, 25, 25, 25, 25, 26, 26, 26, 26, 27, 27, 28, 29, 30 2: 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21, 21, 21, 21, 21, 33, 34, 34, 36, 37, 42 n 1 =n 2 =21 Среднее 1 = 25,14; Ст. отклон. 1 = 2,31; Медиана = 25; Мода=25 и 26 Среднее 2 = 25,00; Ст. отклон. 2 = 7,32; Медиана = 21; Мода 21
23 Визуальное представление 1 и 2 распределения
24 Примеры взаимного расположения параметров для разных видов распределений
25 Пример Найти параметры следующего выборочного распределения (клинические оценки тяжести серповидноклеточной анемии): Можно ли считать, что выборка извлечена из совокупности с нормальным распределением?
26 Таблица для расчета параметров распределения Значе- ния x i Частоты p i Накоплен- ные частотыxipixipi x i - X(x i – X ) 2 p i(x i - X) ,099,5528, ,094,3748, ,091,194, ,090,010, ,910,831, ,913,6514, ,918, ,9115, ,9134, ,9147, ,9162,57 n=p i =33 =102 =266,8
27 n= 33 Mo=1 (p=11) Me=x (33+1)/2 =x 17 = 2 n/4=33/4=8,258 25%=x 8 = 1 3/4=3*33/4=24, %=x 25 =5 3,09-2*2,89=-2,69; 3,09+2*2,89=8,87 Интервал: -2,69 8,87
28 Проверка нормальности 1) Среднее, медиана и мода не совпадают, не находятся посередине между 25 и 75-м процентилями 2)Около четверти значений интервала среднее ± два стандартных отклонения имеют отрицательный знак, а в исходной выборке по самой природе изучаемого признака не может быть отрицательных значений Выборка вряд ли извлечена из совокупности с нормальным законом распределения
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.