Выборочное наблюдение
Понятие выборочного наблюдения. Выборочное наблюдение – это такой вид статистического наблюдения, при котором обследованию подвергается не вся изучаемая совокупность, а лишь часть ее единиц, отобранных в определенном порядке.
Вся исследуемая совокупность называется генеральной; Единицы подлежащие наблюдению составляют выборочную совокупность или выборку.
Условные обозначения Генеральные параметры Выборочные показатели Объем совокупностиNn Средняя величинаµ Относительная величинаπp Дисперсия
Цель выборочного наблюдения Определение параметров генеральной совокупности на основе показателей выборочной совокупности.
Выборочный метод обладает следующими достоинствами: относительно небольшие (по сравнению со сплошным наблюдением) материальные, трудовые, стоимостные затраты на сбор данных; оперативность получения результатов; широкая область применения; высокая достоверность результатов.
Выборочные оценки отличаются от генеральных параметров за счет ошибки наблюдения и ошибки выборки:
Различают два вида отбора – повторный соответствует схеме «возвращенного шара». - бесповторный. Бесповторная выборка соответствует схеме «невозвращенного шара».
Возможны три способа отбора: случайный; отбор единиц по определенной схеме; сочетание первого и второго способов.
Различают следующие виды выборочного наблюдения: Типическая (расслоенная или стратифицированная) Серийная (гнездовая) Многоступенчатая Многофазовая
Определение ошибки выборки средняя (стандартная), предельная относительная
При случайном и механическом отборах средняя ошибка выборки для средней величины ( ) при повторном отборе: При бесповторном отборе:
На практике величина дисперсии признака в генеральной совокупности, как правило неизвестна, поэтому ее заменяют выборочной дисперсией. Это возможно, поскольку доказано, что соотношение и определяется равенством:
При большой численности выборочной совокупности сомножитель стремится к единице и им можно пренебречь.
Величина дисперсии доли в генеральной совокупности определяется по формуле: где p – доля единиц, обладающих каким- либо значением признака в генеральной совокупности.
При расчете средней ошибки выборочной доли дисперсия доли в генеральной совокупности, как правило, тоже незвестна, поэтому ее заменяют дисперсией доли в выборочной совокупности: где w – доля единиц, обладающих каким-либо значением признака в выборочной совокупности.
Формула для расчета средней ошибки выборочной доли для повторного отбора
Формула для расчета средней ошибки выборочной доли для бесповторного отбора
Предельная ошибка выборки где t – коэффициент доверия, который определяется по таблице значений интегральной функции Лапласа при заданной доверительной вероятности.
P(t)0,6830,950,9540,990,997 t1,001,962,002,583,00 Наиболее часто употребляемые уровни доверительной вероятности и соответствующие им значения t:
Зная величину выборочной средней () или доли (w), а также предельную ошибку выборки (), можно определить доверительные интервалы, в которых находятся значения генеральных параметров:
Пример: Для определения среднего срока пользования краткосрочным кредитом в банке была произведена 5%-ая механическая выборка, в которую попали 200 счетов. По результатам выборки установлено, что средний срок пользования кредитом составляет 60 дней при среднеквадратическом отклонении 20 дней. В 8 счетах срок пользования кредита превышал 6 месяцев. Необходимо с вероятностью 0,99 определить пределы, в которых находится срок пользования краткосрочными кредитами банка и доля краткосрочных кредитов со сроком пользования более полугода.
Нахождения необходимой численности выборки на практике расчет объема выборки производят по формуле для повторного отбора:
Если полученный объем выборки превышает 5% численности генеральной совокупности, расчеты корректируют «на бесповторность»:
При решении задачи определения объема выборки величина допустимой предельной ошибки и уровень вероятности, гарантирующей точность оценок будущей выборки, задаются исследователем
Для оценки величины генеральной дисперсии можно использовать: 1. выборочную дисперсию по данным прошлых или пробных обследований; 2. дисперсию, найденную из соотношения для среднего квадратического отклонения:
3. дисперсию, определенную из соотношения для асимметричного распределения:
4. дисперсию, вычисленную из соотношения для нормального распределения:
Пример. Определить численность выборки по следующим данным. Для определения средней цены говядины на рынках города предполагается произвести выборочную регистрацию цен. Известно, что цены на говядину колеблются от 40 до 70 крон за кг. Сколько торговых точек необходимо обследовать, чтобы с вероятностью 0,954 ошибка выборки при определении средней цены не превышала 2 кроны за кг?
Относительная ошибка выборки характеризует относительную погрешность выборочного наблюдения
Расчет объема выборки при заданном уровне относительной ошибки
Пример. В городе зарегистрировано 30 тыс безработных. Для определения средней продолжительности безработицы организуется выборочное обследование. По данным прошлых лет известно, что коэффициент вариации продолжительности безработицы составляет 40%. Какое число безработных необходимо охватить выборочным наблюдением, чтобы с вероятностью 0,997 утверждать, что полученная предельная ошибка выборки не превышает 5% средней продолжительности безработицы?