Средние величины
Общее понятие о средних величинах
Средняя величина – это обобщающая количественная характеристика совокупности по изучаемому признаку в конкретных условиях места и времени. Средняя величина отражает то общее и типичное, что присуще единицам данной совокупности
В средних величинах погашаются индивидуальные отклонения, соответствующие отдельным единицам совокупности. Чтобы средняя величина имела смысл, она должна рассчитываться для однородной совокупности
Используя среднюю, мы можем одним числом охарактеризовать изучаемое явление. По уточненным данным Всероссийской переписи населения 2002 года, средний размер семьи составляет 2,7 чел. В городских населенных пунктах – 2,7. В сельских – 2,8. Подробную информацию найдете на oc/TOM_06_01.xls
Самое малое значение этого показателя 2,2 в сельской местности Псковской области, самый большой – 7,4 выявлен в сельской местности Республики Ингушетия
Получив результат 2,7 в среднем по России, мы можем сделать вывод, что наибольший удельный вес занимают семьи, состоящие из двух, но чаще из трех человек. Безусловно, есть семьи, состоящие из 1 человека (поэтому в статистике говорят не о семье, а о домохозяйстве), из 4, 5, из 6 и более человек. Но вы не найдете ни одной семьи, состоящей из 2,7 человек, потому что число членов домохозяйства – показатель целочисленный
Необходимые условия для расчета СВ – качественная однородность совокупности: все единицы совокупности должны обладать изучаемым признаком. Если изучают средний размер стипендии, то каждая единица должна обладать свойством – получением стипендии
Нельзя, например, подсчитать среднюю стипендию в Бишкеке, потому что не все жители Бишкека, и даже не все студенты, проживающие в городе, эту самую стипендию получают
То же можно сказать о пенсии, к примеру, в Москве или зарплате в Белграде. Поэтому в отношении такой статистической совокупности, как население некоторого населенного пункта, правильнее говорить о среднем доходе на одного жителя
Средняя величина Среднюю стипендию можно подсчитать среди тех, кто получает стипендию, то же относится к пенсии и зарплате
Логическая формула Расчет средней начинается с определения логической формулы. Прежде чем что-то умножать, делить или складывать, необходимо составить исходное соотношение средней, иначе называемое логической формулой
Исходное соотношение средней
где А – объем изучаемого события в совокупности: это суммарная абсолютная величина; В – объем совокупности: это число единиц совокупности. ИСС дает нам уровень изучаемого события в расчете на единицу совокупности
Примеры средних Средняя зарплата показывает, сколько получает один работник. Что же мы возьмем в числителе и знаменателе ИСС? А – сумма начисленных средств всем работникам = фонд зарплаты; В – численность работников
Примеры средних Зарплата индивидуального работника – это индивидуальная величина. Фонд зарплаты – суммарная величина, а средняя зарплата – средняя величина
Примеры средних Средняя цена показывает, сколько в среднем стоит данный товар. Что же мы возьмем в числителе и знаменателе ИСС? А – выручка от реализации всего товара = товарооборот; В – сколько единиц товара продано всего = количество проданного товара
Примеры средних Средняя себестоимость показывает, сколько в среднем стоит производство единицы продукции. Что же мы возьмем в числителе и знаменателе ИСС? А – затраты на производство продукции = в экономической теории это называется издержками производства; В – выпуск продукции = количество произведенной продукции
Примеры средних Средний возраст показывает, сколько в среднем лет исследуемой совокупности единиц, не обязательно одушевленных - это может быть средний возраст автомобилей, студентов, зданий, куриц. Что же мы возьмем в числителе и знаменателе ИСС? А – суммарное количество лет; В – количество обследуемых единиц
Примеры средних Средняя продолжительность жизни, или средний срок службы показывает, сколько в среднем лет живет одушевленная единица совокупности и служит неодушевленная. Что же мы возьмем в числителе и знаменателе ИСС? А – суммарное количество лет жизни (службы); В – количество обследуемых единиц
Логическая формула Для конкретного экономического показателя может быть составлена ТОЛЬКО ОДНА ИСТИННАЯ логическая формула
Виды средних величин Математикой доказано, что большую часть средних, которыми мы пользуемся, можно выразить в общем виде формулой средней степенной
Средние величины, применяемые в статистике, относятся к классу степенных средних. Общая формула степенной средней имеет следующий вид: _ где x k – степенная средняя k-ого порядка; k – показатель степени, определяющий форму средней; х – варианты; n – количество вариант
Если k =1, получается средняя арифметическая:
если k =2, получается средняя квадратическая:
если k =0, получается средняя геометрическая:
если k = (-1), получается средняя гармоническая:
Правило мажорантности Чем выше показатель степени в формуле степенной средней, тем больше значение средней
Средняя арифметическая
Существуют две формулы средней арифметической: где f - веса
Средняя арифметическая простая Средняя арифметическая простая применяется, когда есть перечисление вариант и нет никаких группировок. В числителе мы собираем сумму вариант, в знаменателе – количество вариант
Производительность труда 5-и рабочих составляет: 58, 50, 46, 44, 42 изделий за смену. Определить среднюю производительность труда 5-и рабочих. В этом случае решение имеет следующий вид:
Средняя арифметическая взвешенная Средняя арифметическая взвешенная используется при появлении группировок. Это самая распространенная степенная средняя
Расчет средней арифметической для вариационного ряда
Модификация формулы Если f – частость (дается удельный вес в совокупности), то классическая формула средней арифметической взвешенной не применяется, используют ее модификацию:
Модификация формулы где
Модификация формулы
По существу, мы умножаем варианту на ОВСтруктуры в коэффициентах, в долях
Свойства средней арифметической
1. Произведение средней арифметической и суммы частот равно общему объему изучаемого события в совокупности (см. формулу ИСС):
2. Сумма отклонений всех вариант от средней величины всегда равна 0:
2. Сумма отклонений всех вариант от средней величины всегда равна 0. Это значит, что в средней арифметической взаимопогашаются отклонения от средней
2. В нашем примере со средним размером домохозяйства средняя равна 2,7 чел. Однако есть конкретные значения количества членов каждой конкретной семьи, варианта х=1,2,3,4,5,6 и более. (1-2,7)*f i =- (2-2,7)*f i =- (3-2,7)*f i =+ (4-2,7)*f i =+ (5-2,7)*f i =+ (6-2,7)*f i =+ Итого:0
Свойства САВ Свойства 3-5 используются для упрощения расчета, когда нужно подсчитать среднюю из неудобных чисел
3. Если каждую варианту уменьшить на постоянную величину а, расчет средней возможен, но полученная средняя будет меньше на а:
4. Если все варианты уменьшить в одно и то же число раз, то средняя арифметическая уменьшится в то же число раз:
5. Если все веса разделить на какую- либо константу а, то новая средняя от этого не изменится:
5. При расчете средней весовой показатель берется на том же уровне и в числителе, и в знаменателе
Свойства САВ Если при расчете САВ были использованы ее свойства, то в результате получаем не нормальную, а преобразованную САВ. Чтобы перейти к нормальной САВ, необходимо произвести обратные операции в обратном порядке
Упрощенный расчет средней арифметической для вариационного ряда
Основан на свойствах средней величины. h – величина интервала; c – одна из вариант ряда, близкая к середине (лежащая в середине); А – целое число, на которое без остатка сокращаются все частоты
h=20; c=250; f=f'; A=1
Средняя гармоническая
СГ- это обратная величина средней арифметической. Бывает простая и взвешенная СГ. Чаще используется взвешенная формула
Существуют две формулы для расчета средней гармонической величины: где W- сложный вес, объем события по группе, по конкретному значению
Сложный (мнимый) вес:
Средняя гармоническая применяется в том случае, когда в качестве весов выступают объемы изучаемого признака. Иногда возникает проблема: какую формулу использовать – среднюю гармоническую или среднюю арифметическую? Подходит та формула, у которой и в числителе и знаменателе будут величины, обладающие смыслом
Арифметическая или гармоническая? Подсказка: Если по исходной информации дается осредняемая величина (варианта) и знаменатель логической формулы, то используется САВ. Если дается варианта и числитель логической формулы, то используется СГВ
Арифметическая или гармоническая? Иными словами: Если в ИСС неизвестен числитель, то используется САВ. Если в ИСС неизвестен знаменатель, то используется СГВ
Средняя хронологическая Эта формула средней применяется для ряда моментных показателей
Средняя хронологическая Необходимо взять половину первого и последнего показателя, плюс моментные показатели, находящиеся в середине ряда, полученную сумму разделить на (количество моментных показателей минус 1)
Средняя хронологическая Широко применяется в рядах динамики, в социально-экономической статистике для определения средней численности населения и среднего размера остатков, а также для других показателей, исчисляемых на определенные моменты времени
Средняя хронологическая Если необходимо подсчитать среднюю для двух моментных показателей, то формула средней хронологической превращается в формулу средней арифметической простой
Структурные средние Обычно средней степенной для анализа распределения недостаточно. Структурные средние применяются для первоначального анализа распределения признаков в совокупности
Структурные средние Из многочисленного множества структурных средних мы рассмотрим моду, медиану, квартиль, дециль и перцентиль
Мода
Мода – значение признака, встречающееся в совокупности наибольшее число раз. В быту слово «мода» фактически имеет обратный смысл
Мода – это наиболее часто встречающаяся варианта вариационного ряда. Для дискретного ряда это та варианта, которой соответствует наибольшая частота
Для интервального ряда с равными интервалами мода определяется при помощи следующей формулы: где x M о - начало модального интервала; h М о - величина модального интервала; f 2 - частота модального интервала; f 1 - частота предмодального интервала; f 3 - частота послемодального интервала
Мода Если модальный интервал первый или последний, то недостающая частота (предмодальная или послемодальная) берется равной нулю
Мода В интервальном ряду как по формуле, так и графически мода вычисляется точнее
Мода Для определения моды дискретного ряда строится полигон распределения. Расстояние от оси ординат до наивысшей точки графика есть мода
Мода Если в дискретном ряду несколько вариант имеют наибольшую частоту (что встречается достаточно редко), то мода определяется как средняя арифметическая из всех модальных вариант
Медиана
Это центральное, серединное значение ряда. Ме - значение признака у единицы, находящейся в середине ранжированной (упорядоченной) совокупности
Это варианта, лежащая в середине вариационного ряда и делящая его на две равные части
Медиана В дискретном ряду Ме находится по определению, а в интервальном ряду – по формуле
Медиана Если дискретный ряд содержит нечетное количество вариант, то находится та единственная варианта, справа и слева от которой находится одинаковое число вариант:
Медиана Если дискретный ряд содержит четное количество вариант, то находятся две варианты, справа и слева от которых располагается одинаковое количество вариант. Ме равна средней арифметической из двух значений:
Для дискретного ряда медианой является та варианта, для которой накопленная частота впервые превышает половину от суммы частот
Для интервального ряда медиана определяется по следующей формуле: где x М е - начало медианного интервала; h М е - величина медианного интервала; f М е - частота медианного интервала; S М е -1 - накопленная частота предмедианного интервала
Это означает, что у половины рабочих производительность труда меньше м, а у другой половины больше
Для графического определения медианы последнюю ординату кумуляты делят пополам. Через полученную точку проводят прямую, параллельную оси x до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой представленного на графике распределения
Для графического определения медианы по огиве выполняют обратные действия, поскольку в огиве накопленные частоты помещают на оси абсцисс, а значения признака – на оси ординат
Мо и Ме В практических расчетах Мо и Ме могут быть величинами, далеко отстоящими друг от друга. Для более четкой фиксации характера распределения используют другие структурные средние
Квартили
Это варианты, которые делят ранжированную совокупность на четыре равные части: Q 1 1:3; Q 2 2:2 (Q 2 =Ме); Q 3 3:1
Квартили Первый (нижний) квартиль отсекает от совокупности ¼ часть единиц с минимальными значениями, а третий (верхний) отсекает ¼ часть единиц с максимальными значениями
Квартили Мы как бы отбрасываем нетипичные, случайные значения признака. С помощью квартилей мы определяем границы, где находятся 50% единиц, наиболее характерные для этой совокупности
Для расчета Q 1 (первого квартиля) используется следующая формула: где x Q 1 - начало интервала, содержащего 1-й квартиль; h Q 1 - величина интервала, содержащего 1-й квартиль; S Q накопленная частота предшествующего интервала; f Q 1 - частота интервала, содержащего Q 1
Интервалом, содержащим Q 1, является тот интервал, для которого накопленная частота впервые превышает ¼ от суммы частот
Это означает, что ¼ рабочих имеет производительность труда меньше, чем 234м., а ¾ имеет производительность труда больше
Для расчета Q 3 используется формула: Все обозначения аналогичны Q 1. Интервалом, содержащим Q 3, является тот интервал, для которого накопленная частота впервые превышает ¾ от суммы частот
Децили
Децили - это варианты, которые делят ранжированную совокупность на 10 равных частей
Общая формула для расчета децилей: где x D i - начало интервала,содержащего i-й дециль; h D i - величина интервала, содержащего i-й дециль; f D i - частота интервала, содержащего D i ; S D i -1 - накопленная частота предшествующего интервала
Интервалом, содержащим D i,является тот интервал, для которого накопленная частота впервые превышает i/10 от суммы частот
Пример: Это означает что, 60% рабочих имеют производительность труда меньше 259,6м, а 40% - больше
Применение децилей Пример - децильный коэффициент дифференциации населения. Население делится на 10 частей по уровню дохода. Берут первые 10% и последние 10%. Считают, что средний доход последней группы не должен быть больше, чем в 10 раз среднего дохода первой группы. В России официально это превышение составляет раз, неофициально – 20 и более раз
Перцентиль П делит ранжированную совокупность на 100 равных частей. Формулы аналогичны формулам медианы, квартиля и дециля
The end Спасибо за внимание