А БСОЛЮТНЫЕ И ОТНОСИТЕЛЬНЫЕ ВЕЛИЧИНЫ В СТАТИСТИКЕ Л ЕКЦИЯ 7. Клобертанц Е.П. Красноярск, 2013 г. ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «КРАСНОЯРСКИЙ ГОСУДАРСТВЕННЫЙ МЕДИЦИНСКИЙ УНИВЕРСИТЕТ ИМЕНИ ПРОФЕССОРА В.Ф. ВОЙНО-ЯСЕНЕЦКОГО» МИНИСТЕРСТВА ЗДРАВООХРАНЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ ФАРМАЦЕВТИЧЕСКИЙ КОЛЛЕДЖ
План: 1.Вариационный ряд. 2.Средние величины. 3.Понятие вариационных признаков. 4.Нормальное распределение вариационного ряда и его значение при внутрилабораторном контроле качества.
1.Вариационный ряд Варианты – это числовые значения количественного признака в вариационном ряду распределения (положительные, отрицательные, относительные, абсолютные) Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. числа, показывающие насколько часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и равна числу элементов всей совокупности Частости – это частоты, выраженные в виде относительных величин (долях или процентах). Сумма частостей равна 1 или 100%. Замена частот частостями позволяет сравнивать ряды с разным числом наблюдений.
Основные обозначения вариационного ряда: V варианта, отдельное числовое выражение изучаемого признака; р частота ("вес") варианты, число ее повторений в вариационном ряду; n общее число наблюдений (т.е. сумма всех частот, n = Σр); Vmax и Vmin крайние варианты, ограничивающие вариационный ряд (лимиты ряда); А амплитуда ряда (т.е. разность между максимальной и минимальной вариантами, А = Vmax Vmin) Виды вариаций: а) простой это ряд, в котором каждая вариата встречается по одному разу (р=1); б) взвешенный ряд, в котором отдельные варианты встречаются неоднократно (с разной частотой). Назначение вариационного рядя: Вариационный ряд необходим для определения средней величины (М) и критериев разнообразия признака, подлежащего изучению (σ, Сv).
2.Средние величины Средняя величина это обобщающая характеристика размера изучаемого признака. Она позволяет одним числом количественно охарактеризовать качественно однородную совокупность. Математикой доказано, что большую часть средних, которыми мы пользуемся, можно выразить в общем виде формулой средней степенной
Средние величины применяются: для оценки состояния здоровья например, параметров физического развития (средний рост, средняя масса тела, среднее значение жизненной емкости легких и др.), соматических показателей (средний уровень сахара в крови, средняя величина пульса, средняя СОЭ и др.); для оценки организации работы лечебно-профилактических и санитарно-противоэпидемических учреждений, а также деятельности отдельных врачей и других медицинских работников (средняя длительность пребывания больного на койке, среднее число посещений на 1 ч приема в поликлинике и др.); для оценки состояния окружающей среды.
Степенные средние величины Методика расчета простой средней арифметической: 1.Суммировать варианты: V1+V2+V3+...+Vn = Σ V; 2.Сумму вариант разделить на общее число наблюдений: М = Σ V / n Методика расчета взвешенной средней арифметической: 1.Получить произведение каждой варианты на ее частоту Vp 2.Найти сумму произведений вариант на частоты: V 1 p 1 + V 2 p 2 + V 3 p V n p n = Σ Vp Полученную сумму разделить на общее число наблюдений: М = Σ Vp / n
Средние величины, применяемые в статистике, относятся к классу степенных средних. Общая формула степенной средней имеет следующий вид: _ где x k – степенная средняя k-ого порядка; k – показатель степени, определяющий форму средней; х – варианты; n – количество вариант
Если k =1, получается средняя арифметическая:
если k =2, получается средняя квадратическая:
если k =0, получается средняя геометрическая:
если k = (-1), получается средняя гармоническая:
С УЩЕСТВУЮТ ДВЕ ФОРМУЛЫ СРЕДНЕЙ АРИФМЕТИЧЕСКОЙ : ГДЕ F - ВЕСА
С РЕДНЯЯ АРИФМЕТИЧЕСКАЯ ПРОСТАЯ Средняя арифметическая простая применяется, когда есть перечисление вариант и нет никаких группировок. В числителе мы собираем сумму вариант, в знаменателе – количество вариант
С РЕДНЯЯ АРИФМЕТИЧЕСКАЯ ВЗВЕШЕННАЯ Средняя арифметическая взвешенная используется при появлении группировок.
М ОДИФИКАЦИЯ ФОРМУЛЫ Если f – частость (дается удельный вес в совокупности), то классическая формула средней арифметической взвешенной не применяется, используют ее модификацию:
С РЕДНЯЯ ГАРМОНИЧЕСКАЯ Средняя гармоническая - это обратная величина средней арифметической. Бывает простая и взвешенная средняя гармоническая. Чаще используется взвешенная формула.
С УЩЕСТВУЮТ ДВЕ ФОРМУЛЫ ДЛЯ РАСЧЕТА СРЕДНЕЙ ГАРМОНИЧЕСКОЙ ВЕЛИЧИНЫ : ГДЕ W- СЛОЖНЫЙ ВЕС, ОБЪЕМ СОБЫТИЯ ПО ГРУППЕ, ПО КОНКРЕТНОМУ ЗНАЧЕНИЮ
А РИФМЕТИЧЕСКАЯ ИЛИ ГАРМОНИЧЕСКАЯ ? Подсказка: Если по исходной информации дается осредняемая величина (варианта) и знаменатель логической формулы, то используется САВ. Если дается варианта и числитель логической формулы, то используется СГВ
Структурные средние величины Структурные средние применяются для первоначального анализа распределения признаков в совокупности. Из многочисленного множества структурных средних мы рассмотрим моду, медиану.
Мода – значение признака, встречающееся в совокупности наибольшее число раз. Статистическая мода - это наиболее часто повторяющееся значение величины X в статистической совокупности.
Для интервального ряда с равными интервалами мода определяется при помощи следующей формулы: где x M о - начало модального интервала; h М о - величина модального интервала; f 2 - частота модального интервала; f 1 - частота предмодального интервала; f 3 - частота послемодального интервала
М ОДА Если модальный интервал первый или последний, то недостающая частота (предмодальная или послемодальная) берется равной нулю
М ОДА В интервальном ряду как по формуле, так и графически мода вычисляется точнее
М ОДА Для определения моды дискретного ряда строится полигон распределения. Расстояние от оси ординат до наивысшей точки графика есть мода
М ОДА Если в дискретном ряду несколько вариант имеют наибольшую частоту (что встречается достаточно редко), то говорят о бимодальном или многомодальном распределении
М ЕДИАНА Это центральное, серединное значение ряда. Ме - значение признака у единицы, находящейся в середине ранжированной (упорядоченной) совокупности Статистическая медиана – это значение величины X, которое делит упорядоченную по возрастанию или убыванию статистическую совокупность на 2 равных по численности части.
М ЕДИАНА В дискретном ряду Ме находится по определению, а в интервальном ряду – по формуле.
М ЕДИАНА Если дискретный ряд содержит нечетное количество вариант, то находится та единственная варианта, справа и слева от которой находится одинаковое число вариант:
М ЕДИАНА Если дискретный ряд содержит четное количество вариант, то находятся две варианты, справа и слева от которых располагается одинаковое количество вариант. Ме равна средней арифметической из двух значений:
Для дискретного ряда медианой является та варианта, для которой накопленная частота впервые превышает половину от суммы частот
Д ЛЯ ИНТЕРВАЛЬНОГО РЯДА МЕДИАНА ОПРЕДЕЛЯЕТСЯ ПО СЛЕДУЮЩЕЙ ФОРМУЛЕ : ГДЕ X М Е - НАЧАЛО МЕДИАННОГО ИНТЕРВАЛА ; H М Е - ВЕЛИЧИНА МЕДИАННОГО ИНТЕРВАЛА ; F М Е - ЧАСТОТА МЕДИАННОГО ИНТЕРВАЛА ; S М Е -1 - НАКОПЛЕННАЯ ЧАСТОТА ПРЕДМЕДИАННОГО ИНТЕРВАЛА
Для графического определения медианы последнюю ординату кумуляты делят пополам. Через полученную точку проводят прямую, параллельную оси x до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой представленного на графике распределения.
Для графического определения медианы по огиве выполняют обратные действия, поскольку в огиве накопленные частоты помещают на оси абсцисс, а значения признака – на оси ординат
3.Понятие вариационных признаков «Вариация» произошел от лат. variatio – «изменение, колеблемость, различие». Вариация - это различие значений величин X у отдельных единиц статистической совокупности.
Н ЕОБХОДИМОСТЬ ИЗМЕРЕНИЯ ВАРИАЦИИ Средняя величина характеризует совокупность по изучаемому признаку, такой характеристики совокупности будет достаточно, если разброс индивидуальных значений невелик Когда ряд характеризуется значительным рассеиванием индивидуальных значений, то применение средней величины ограничено
Н ЕОБХОДИМОСТЬ ИЗМЕРЕНИЯ ВАРИАЦИИ При значительном рассеивании индивидуальных значений необходимо рассчитать специальную систему показателей, характеризующих средний размер отклонений индивидуальных значений от средней величины и степень колеблемости признака в совокупности, т.е. показателей вариации
П ОКАЗАТЕЛИ ВАРИАЦИИ Используются две группы показателей вариации: - абсолютные: размах вариации, среднее линейное отклонение, дисперсия, среднеквадратическое отклонение - относительные: коэффициент осцилляции, линейный коэффициент и коэффициент вариации
1. Р АЗМАХ ВАРИАЦИИ РВ – разность между экстремальными значениями признака в совокупности. РВ имеет единицу измерения, совпадающую с единицей измерения признака у единиц совокупности
Р АЗМАХ ВАРИАЦИИ Недостаток РВ: он учитывает только крайние значения и не учитывает промежуточные значения
С РЕДНЕЕ ЛИНЕЙНОЕ ОТКЛОНЕНИЕ Недостаток РВ устраняет показатель СЛО. Он рассчитывается по двум формулам: а) для несгруппированных данных (по формуле средней арифметической простой) б) для сгруппированных данных (по формуле средней арифметической взвешенной)
С РЕДНЕЕ ЛИНЕЙНОЕ ОТКЛОНЕНИЕ а) для несгруппированных данных б) для сгруппированных данных
С РЕДНЕЕ ЛИНЕЙНОЕ ОТКЛОНЕНИЕ У СЛО есть единица измерения. Он обладает серьезным недостатком: в числителе нет минуса, а сам показатель – положительное число. Эта проблема решается третьим и четвертым показателями вариации – дисперсией и среднеквадратическим отклонением
Дисперсия - средний квадрат отклонений индивидуальных значений от средней величины. Это средняя арифметическая величина, полученная из квадратов отклонений значений признака от их средней. Она рассчитывается по простой и взвешенной формулам. Для ее обозначения используется греческая буква сигма.
Дисперсия а) для несгруппированных данных б) для сгруппированных данных
Недостаток дисперсии состоит в том, что она имеет размерность вариант, возведенную в квадрат. Чтобы устранить этот недостаток, используется среднее квадратическое отклонение.
Среднее квадратическое отклонение а) для несгруппированных данных
б) для сгруппированных данных σ представляет собой среднее квадратическое отклонение вариант ряда от средней величины
Среднее квадратическое отклонение имеет единицы измерения, а также может принимать положительные и отрицательные значения, поскольку получается в результате извлечения квадратного корня. С помощью СКО можно утверждать, что i-тое значение признака в совокупности находится в пределах:
Коэффициент вариации Характеризует долю усредненного значения отклонений от средней величины. При этом совокупность считается однородной, если V не превышает 33%
Правило трех сигм
В условиях нормального распределения существует зависимость между величиной σ и количеством наблюдений: располагается 68,3 % наблюдений; располагается 94,5 % наблюдений; располагается 99,7 % наблюдений. в пределах
На практике почти не встречаются отклонения, которые превышают 3σ. Отклонение в 3σ может считаться максимальным При помощи этого правила можно получить примерную оценку σ:
4.Нормальное распределение вариационного ряда и его значение при внутрилабораторном контроле качества Рис.1. Колокол Гаусса
Контрольные вопросы для закрепления: 1.Дайте определение ряда распределения, вариационного ряда. 2.Для чего используются средние величины? 3.По каким критериям можно оценить разнообразие признака? 4.В каких случаях применяют среднеквадратическое отклонение? 5.Каково назначение коэффициента вариации? 6.Как оценить величину коэффициента вариации? 7.Что означает «нормальное» распределение вариационного ряда? 8.Каково значение нормального распределения вариационного ряда при внутрилабораторном контроле качества
Литература: 1.Внутрилабораторный контроль качества клинических лабораторных исследований [электронный ресурс] : Докипедия. URL full&nid= &scroll_to=502debdb661f36130dd10886http:// full&nid= &scroll_to=502debdb661f36130dd Лекции по статистике [электронный ресурс] URL: Применение методов статистического анализа для изучения общественного здоровья и здравоохранения: учебное пособие для практических занятий/ под ред. В. З. Кучеренко. -4-е изд., перераб.и доп. –М.: ГЭОТАР-Медиа, с. 4.Статистика. Учебное пособие. [электронный ресурс] URL: