Все закончили свои дела? Приготовьте ручки и тетрадки. Продолжим удивлять друг друга.
Т ема Выборочное наблюдение Общая теория статистики
Контактный телефон моб. 8(925) Анатолий Викторович Интернет помощь
План 1.Определение выборочного наблюдения 2. Виды и схемы отбора 3.Характеристики генеральной и выборочной совокупности 4. Ошибка выборочного наблюдения 5. Распространение выборочных результатов на генеральную совокупность 6. Необходимый объем выборки 7. Примеры решения задач
1.Определение выборочного наблюдения Выборочное наблюдение это способ несплошного статистического наблюдения, при котором обследуются не все единицы изучаемой (генеральной) совокупности, а лишь часть ее (выборка), отобранная по определенным правилам и обеспечивающая получение данных, характеризующих совокупность в целом.
Под выборочным методом понимается обследование части совокупности (выборочной совокупности), после чего, на основании полученных результатов, делаются выводы относительно всей совокупности (генеральной совокупности).
1.Определение выборочного наблюдения Из генеральной совокупности отбирается часть единиц. По ним проводится исследование, а затем результаты обследования распространяются на всю совокупность с достаточно высокой степенью достоверности, вероятности.
Причины применения: Экономия Невозможность проведения сплошного исследования
Основные обозначения N – объем, численность, число единиц ГС n – объем ВС
Основная идея выборочного метода состоит в том, что в результате обследования части совокупности можно судить с определенной вероятностью о характеристиках всей изучаемой совокупности (генеральной совокупности) Часть генеральной совокупности, которая подвергается обследованию – называется выборочной совокупностью (выборкой).
Для того, чтобы выборочная совокупность давала объективные результаты, она должна быть репрезентативной (каждая единица генеральной совокупности должна иметь равную возможность попасть в выборку). Только тогда с увеличением объема выборки характеристики выборочной совокупности будут приближаться к характеристикам генеральной совокупности.
Основной предпосылкой применения выборочного метода является обеспечение равной возможности каждой единице генеральной совокупности попасть в выборку. Только при этом условии с увеличением объема выборки (числа выбираемых единиц) характеристики выборочной совокупности стремятся к характеристикам генеральной совокупности – т.е. выборка должна быть репрезентативной.
Теоретической основой выборки являются теоремы закона больших чисел (Чебышева, Ляпунова, Бернулли и др.)
Теоремы Чебышева, Ляпунова и закон больших чисел доказывают сходство генеральной ГС и выборочных ВС совокупностей. Различия между Г и В характеристиками объясняются различием структур ГС и ВС.
Задачи выборочного метода Определение доверительного интервала, в котором находится характеристика генеральной совокупности Определение минимального объема выборки Определение доверительной вероятности того, что разность между характеристиками выборочной и генеральной совокупностей не превзойдет наперед заданного числа
Пример. Имеются данные о зарплате рабочих в у. е. Группы по з/пл.ГС - человекИз них попали в выборку Итого
1.Определение выборочного наблюдения Как видим, зарплату от 100 до 130 в ГС получают 10%, в ВС – 5%. Доля этой группы в ВС ниже, чем в ГС, ВС неточно представляет ГС. Зарплату от 190 до 220 в ГС получают 20%, а в выборку получающих такую зарплату попало 45%. Снова налицо проблема репрезентативности.
Сходство ГС и ВС Из теорем Чебышева, Ляпунова и закона больших чисел следует: 1-Хотя каждая выборочная средняя отличается от генеральной, среднее значение по ним равно генеральной:
1.Определение выборочного наблюдения Реально наблюдаемая совокупность объектов, статистически представленная рядом наблюдений x 1, x 2,…, x n случайной величины Х, является выборкой, а гипотетически существующая (домысливаемая) – генеральной совокупностью.
Основные обозначения: N – объем генеральной совокупности (количество единиц генеральной совокупности). n – объем выборочной совокупности (количество единиц выборочной совокупности) - генеральное среднее (средняя величина, которая имеет место в генеральной совокупности) - среднее выборки где - частота - генеральная дисперсия, где 0 – признак генеральной совокупности
В основе решения задач на выборочный метод лежат формулы предельных ошибок выборки
Обозначения t - число, связанное с вероятностью через табл. закона нормального распределения - средняя ошибка выборки - предельная ошибка
Ошибки выборки - генеральная средняя - генеральная доля - ошибка средней - ошибка доли
Характеристики выборочной совокупности - выборочная средняя - выборочная дисперсия - выборочная доля
1.1. Объем выборки Число наблюдений n, образующих выборку, называется объемом выборки. Если объем выборки n достаточно велик (n ), выборка считается большой, в противном случае она называется выборкой ограниченного объема.
Малая выборка
Малой считается выборка, в которую входит
Рассмотрим особенности малой выборки. 1) Если мы работаем с обычной выборкой, то используется таблица «Интеграла вероятностей закона нормального распределения». В случае малой выборки необходимо пользоваться таблицей «Распределение Стьюдента», при этом число степеней свободы равно:
2) При малой выборке из формул исключается т. е. получается: м.в. = n t м.в. 2
1.1. Объем выборки Выборка считается малой, если при измерении одномерной случайной величины X объем выборки не превышает 30 (n
1.2. Вариационный ряд Выборка образует вариационный ряд, если ее члены являются порядковыми статистиками, т. е. выборочные значения случайной величины Х упорядочены по возрастанию (ранжированы), значения же признака называются вариантами.
1.3.Условия проведения выборки Выборка будет представлять всю совокупность с приемлемой точностью при выполнении двух условий.
1.3.Условия проведения выборки Во-первых, она должна быть достаточно многочисленной, чтобы в ней могли проявиться закономерности, существующие в генеральной совокупности.
1.3.Условия проведения выборки Во-вторых, элементы выборки должны быть отобраны объективно, независимо от воли исследователя, чтобы каждый из них имел одинаковые шансы быть отобранным или чтобы эти шансы были известны исследователю.
1.Определение выборочного наблюдения Генеральная совокупность может быть конечной (число наблюдений N = const) или бесконечной (N = ), а выборка из генеральной совокупности – это всегда результат ограниченного ряда n наблюдений.
1.Определение выборочного наблюдения Одна и та же случайно отобранная совокупность объектов – парикмахерских одного административного округа Мурманска, может рассматриваться как выборка из генеральной совокупности всех парикмахерских этого округа, как выборка из генеральной совокупности всех парикмахерских Мурманска, как выборка из парикмахерских страны, Европы или всего мира.
Способы отбора По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе – группы единиц, а комбинированный отбор предполагает сочетание группового и индивидуального отбора.
2.Виды и схемы отбора Процесс образования выборочной совокупности называется отбором. Он осуществляется в порядке беспристрастного, случайного отбора единиц из генеральной совокупности. Существуют пять основных способов отбора
1. Простой случайный отбор при котором n объектов случайно извлекаются из генеральной совокупности N объектов (например с помощью таблицы или датчика случайных чисел), причем каждая из возможных выборок имеют равную вероятность. Такие выборки называются собственно-случайными.
Случайная выборка Случайная выборка - основа всех других способов отбора. Случайная выборка осуществляется методом жеребьевки: все единицы совокупности нумеруются, номера записываются на карточки, а потом отбираются. На практике осуществляется с помощью таблиц случайных чисел.
Пример 1. Нужно отобрать 50 единиц из 500 (десятипроцентная выборка) Отбор может быть повторным и бесповторным
Формулы предельных ошибок выборки Повторный отбор Бесповторный отбор Для средней Для доли
Обозначения: - выборочная дисперсия; W - выборочная доля; n - объем выборочной совокупности; N - объем генеральной совокупности; t - число, связанное с вероятностью, которая берется из таблицы интеграла вероятностей закона нормального распределения.
Пример 2. Для определения среднего срока службы изделий было обследовано 250 изделий. При этом средний срок службы был установлен на уровне 41,9 месяца. Среднее квадратическое отклонение равно 6,2 месяцам. С вероятностью 0,9973 определить, в каких пределах находится средний срок службы всех изделий
Решение: Р=0,9973, t=3 (из таблицы интеграла вероятностей закона нормального распределения). При этом вероятность делится на 2.
Пример 3. Определить вероятность того, что предельная ошибка средней службы не превысит 1 месяц. Решение:
Пример 4. Определение минимального объема выборки. Сколько следует прохронометрировать операций, чтобы с вероятностью 0,9973 можно было бы утверждать, что разность между средней продолжительностью операций в выборочной и генеральной совокупности не превысит 1 секунды, если по результатам предыдущего испытания установлено, что средняя продолжительность операции равна 30 секундам, а среднее квадратическое отклонение равно 7 секундам?
Решение : Ответ: нужно прохронометрировать не менее 441 операции.
2. Простой отбор с помощью регулярной процедуры осуществляется с применением механической составляющей (номера квартиры, даты, дня недели, буквы алфавита) и полученные таким способом выборки называются механическими.
3. Стратифицированный отбор заключается в том, что генеральная совокупность объема N подразделяется на части совокупности или слои (страты) объема N 1, N 2, …, N r, так что N 1 + N 2 + … + N r = N.
3. Стратифицированный отбор Страты - однородные объекты с точки зрения статистических характеристик (например, население по возрасту делится на две страты – в трудоспособном и нетрудоспособном возрасте; банки – по размеру капитала). В этом случае выборки называются стратифицированными (расслоенными, типическими, районированными).
4.Серийный отбор Приемы серийного отбора используются для формирования серийных или гнездовых выборок. Они удобны в том случае, если необходимо обследовать сразу "блок" или серию объектов (например, партию товара, продукцию определенной серии или предприятия территориально- административной единицы).
Вся совокупность делится на серии, после чего механическим или собственно случайным способом отбирается некоторое количество серий. Все единицы совокупности, входящие в отобранные серии, подвергаются сплошному контролю.
ПовторныйБесповторный для средней для долидля среднейдля доли Серийная (гнездовая) tttt Метод отбора Выборка
r – количество отобранных серий R – общее число серий - межсерийная дисперсия - межсерийная выборочная дисперсия для доли - доля изучаемого признака в i-той группе - средняя выборочная доля изучаемого признака
Пример: На предприятии 10 бригад. Изучается производительность труда. Отбираются 2 бригады. Средняя производительность труда 1-й бригады – 4,6 тонны, а 2-й – 3 тонны. С вероятностью 0,9973 определить пределы в кот. будет находиться средняя производительность труда рабочих данного предприятия. t = 3
ОТВЕТ:
Типическая выборка
способ проведения типической выборки: 1. вся совокупность делится на типические группы население сельское городское пример 2. из каждой типической группы отбирается некоторое количество единиц пропорциональным непропорциональным Отбор может быть как пропорциональным объёму типических групп, так и непропорциональным
Объем выборки При отборе, пропорциональном объему типических групп, число наблюдений по каждой группе определяется по формуле: - объем выборки из -й типической группы. -общий объем выборки. -объем -й типической группы в генеральной совокупности. -объем генеральной совокупности.
Типическая выборка: формулы Метод отбора Выборка ПовторныйБесповторный Для среднейДля долиДля среднейДля доли Типическая (при отборе пропорциональном объему групп)
Типическая выборка: пример соц. группачисло мужчин средний возраст ср. кв. отклонение доля мужчин, вступающих во второй брак. рабочие служащие Задача. Определим средний возраст мужчин, вступающих в брак, произведя 5%-ю типическую выборку: С вероятностью 0,954 определить 1)пределы, в которых будет находиться средний возраст мужчин, вступающих в брак 2)долю мужчин, вступающих в брак во второй раз.
Типическая выборка: пример Решение. 1) Средний возраст вступления в брак мужчин находится в пределах
Таким образом, с вероятностью 0,954 можно утвердить, что средний возраст мужчин, вступающих в брак, принимает значения 25,2 ± 1,2 года, или Решение примера типической выборки
Типическая выборка: пример Решение. 2) Доля мужчин, вступающих в брак во второй раз, находится в пределах
Таким образом, с вероятностью 0,954 можно утверждать, что доля мужчин, вступающих в брак во второй раз, принимает значения 14% ± 6%, или Вывод по примеру типической выборки
5. Комбинированный (ступенчатый ) отбор может сочетать в себе сразу несколько способов отбора (например, стратифицированный и случайный или случайный и механический); такая выборка называется комбинированной.
2.1.Виды отбора По виду различаются индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе – качественно однородные группы (серии) единиц, а комбинированный отбор предполагает сочетание первого и второго видов.
2.2. Методы отбора По методу отбора различают повторную и бесповторную выборку. Бесповторным называется отбор, при котором попавшая в выборку единица не возвращается в исходную совокупность и в дальнейшем выборе не участвует; при этом численность единиц генеральной совокупности N сокращается в процессе отбора.
повторном отборе При повторном отборе попавшая в выборку единица после регистрации возвращается в генеральную совокупность и таким образом сохраняет равную возможность наряду с другими единицами быть использованной в дальнейшей процедуре отбора; при этом численность единиц генеральной совокупности N остается неизменной (метод в социально-экономических исследованиях применяется редко). Однако, при большом N (N ) формулы для бесповторного отбора приближаются к аналогичным для повторного отбора и практически чаще используются последние (N = const).
Механическая выборка При механической выборке вся совокупность делится на группы по числу единиц, которые должны войти в выборку, после чего из каждой группы отбирается 1 единица. Таким образом механическая выборка может быть бесповторной. Для механической выборки применяются формулы собственно-случайного, бесповторного отбора
Механическая выборка. При механической выборке вся совокупность разбивается на столько групп, сколько единиц должно войти в выборку, затем из каждой группы выбирается 1 единица, следовательно механическая выборка может быть только бесповторной. Применяются формулы для собственно- случайной бесповторной выборки. На практике механическая выборка осуществляется при помощи шага отбора.
На практике механическая выборка обычно осуществляется при помощи так называемого шага отбора 1) Все единицы совокупности нумеруются 2) Определяется шаг отбора
3.Характеристики генеральной и выборочной совокупности В основе статистических выводов проведенного исследования лежит распределение случайной величины Х, наблюдаемые же значения (х 1, х 2, …, х n ) называются реализациями случайной величины Х (n – объем выборки).
3.Характеристики генеральной и выборочной совокупности Распределение случайной величины Х в генеральной совокупности носит теоретический, идеальный характер, а ее выборочный аналог является эмпирическим распределением.
3.Характеристики генеральной и выборочной совокупности Некоторые теоретические распределения заданы аналитически, т.е. их параметры определяют значение функции распределения F(x) в каждой точке пространства возможных значений случайной величины Х.
3.Характеристики генеральной и выборочной совокупности Для выборки же функцию распределения определить трудно, а иногда невозможно, поэтому параметры оценивают по эмпирическим данным, а затем их подставляют в аналитическое выражение, описывающее теоретическое распределение.
3.1. Нормальное распределение По своей природе распределения бывают непрерывными и дискретными. Наиболее известным непрерывным распределением является нормальное распределение. Выборочными аналогами параметров и 2 для него являются: среднее значение x и эмпирическая дисперсия s 2.
3.Характеристики генеральной и выборочной совокупности Среди дискретных в социально- экономических исследованиях наиболее часто применяется альтернативное (дихотомическое) распределение.
3.2. Альтернативное (дихотомическое) распределение. Параметр математического ожидания этого распределения выражает относительную величину (или долю) единиц совокупности, которые обладают изучаемым признаком х (она обозначена буквой р ); доля совокупности, не обладающая этим признаком, обозначается буквой q ( q = 1 – p ). Дисперсия же 2 альтернативного распределения также имеет эмпирический аналог s 2.
3.Характеристики генеральной и выборочной совокупности В зависимости от вида распределения и от способа отбора единиц совокупности по-разному вычисляются характеристики параметров распределения.
3.3.Доля выборки Долей выборки k n называется отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности: k n = n/N.
3.4.Выборочная доля Отношение числа единиц, обладающих данным признаком или данным его значением m, к общему числу единиц выборочной совокупности n называется выборочной долей w: w = m/n.
Пример В партии товара, содержащей 10 тыс. штук, при 4% выборке доля выборки k n в абсолютной величине составляет 400 шт. (n = N 0,04); если же в этой выборке обнаружено 12 бракованных изделий, то выборочная доля брака w составит 0,03 (w = 12/400 = 0,03 или 3%).
-генеральная доля W – выборочная доля
4.Ошибка выборочного наблюдения Поскольку выборочная совокупность отлична от генеральной, то возникают ошибки выборки. При сплошном и выборочном наблюдении могут произойти ошибки двух видов: регистрации и репрезентативности.
4.Ошибка выборочного наблюдения Ошибки регистрации могут иметь случайный и систематический характер. Случайные ошибки складываются из множества различных неконтролируемых причин, носят непреднамеренный характер и обычно по совокупности уравновешивают друг друга (например, изменения показателей прибора при температурных колебаниях или магнитных бурях).
4.Ошибка выборочного наблюдения Систематические ошибки тенденциозны, так как нарушают правила отбора объектов в выборку (например, отклонения в измерениях при изменении настройки измерительного прибора или отбор каждой четвертой квартиры при 25% выборке в доме с четырьмя квартирами на лестничной площадке).
4.Ошибка выборочного наблюдения Ошибки репрезентативности присущи только выборочному наблюдению. Их невозможно избежать, поскольку выборочная совокупность не полностью воспроизводит генеральную совокупность. Значения выборочных показателей отличаются от показателей этих же величин в генеральной совокупности (или получаемых при сплошном наблюдении).
4.Ошибка выборочного наблюдения Ошибка выборочного наблюдения есть разность между значением параметра в генеральной совокупности и его выборочным значением. Для среднего значения количественного признака она равна: x = – x, а для доли (альтернативного признака) – w = p – w.
– генеральная доля W – выборочная доля – число единиц, обладающих признаком в генеральной совокупности
Ошибка выборки – это разность между характеристиками выборочной и генеральной совокупности. - ошибка средней - ошибка доли Различают средние и предельные ошибки выборки., где - предельная ошибка, - средняя ошибка, t – некоторое число
- генеральная средняя (средняя величина, которая имеет место в генеральной совокупности) - выборочная средняя где - частота, - отдельное значение признака - генеральная дисперсия, где 0 – признак генеральной совокупности
4.Ошибка выборочного наблюдения Ошибки выборки свойственны только выборочным наблюдениям. Чем больше эти ошибки, тем больше эмпирическое распределение отличается от теоретического распределения.
Ошибка выборки – это разность между характеристиками выборочной и генеральной совокупности. - ошибка средней - ошибка доли Различают средние и предельные ошибки выборки., где - предельная ошибка, - средняя ошибка, t – некоторое число
Теоремы закона больших чисел устанавливают связь между предельной ошибкой выборки, гарантированной с определенной вероятностью, числом ( t ) и средней ошибкой выборки ( )
Теорема Ляпунова А.М. Ляпунов доказал, что распределение выборочных средних( а следовательно, и их отклонений от генеральной средней ) при достаточно большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией.
Теорема Ляпунова Математически теорему Ляпунова можно записать так: где =3,14(математическая постоянная); - предельная ошибка выборки, которая дает возможность выяснить, в каких пределах находится величина генеральной средней.
4.Ошибка выборочного наблюдения Параметры эмпирического распределения x и s2 являются случайными величинами, следовательно, ошибки выборки также являются случайными величинами, могут принимать для разных выборок разные значения и поэтому принято вычислять среднюю ошибку.
Средняя ошибка выборки m =
Средняя ошибка выборки выражает среднее квадратическое отклонение выборочной средней от математического ожидания. Эта величина при соблюдении принципа случайного отбора зависит прежде всего от объема выборки n и от степени колеблемости признака: чем больше n и чем меньше вариация признака (следовательно, и значение 2 ), тем меньше величина средней ошибки выборки m.
Предельная ошибка выборки для некоторых способов формирования выборочной совокупности
ПовторныйБесповторный для среднейдля долидля среднейдля доли Собственно- случайная и механическая tttt Метод отбора Выборка
ПовторныйБесповторный для среднейдля долидля среднейдля доли Собственно- случайная и механическая tttt Метод отбора Выборка
ПовторныйБесповторный для среднейдля долидля среднейдля доли Типическая (при пропор- циональном объёму групп отборе) tttt Метод отбора Выборка
ПовторныйБесповторный для средней для долидля среднейдля доли Серийная (гнездовая) tttt Метод отбора Выборка
6. Необходимый объем выборки
Задача В городе 2000 семей. Предполагается провести выборочное обследование методом случайной бесповторной выборки для нахождения среднего размера семьи.
Определить необходимую численность выборки при условии, что с вероятностью 0,954 ошибка выборки не превысит 1 человека при среднем квадратическом отклонении 3 человека.
Формула
Решение
Исходные данные данные
Ответ Необходимо обследовать не менее 36 семей.
Основные выводы