ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ. Все единицы изучаемого явления называются генеральной со­вокупностью, а отдельная часть этих единиц, отобранных из ге­неральной.

Презентация:



Advertisements
Похожие презентации
СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ НТБ.
Advertisements

1. Сущность выборочного наблюдения, причины и условия его применения. 2. Теоретические основы выборочного наблюдения. Виды и способы отбора единиц в выборочную.
В ЫБОРОЧНОЕ НАБЛЮДЕНИЕ. Под выборочным наблюдением понимается такое несплошное наблюдение, при котором статистическому обследованию (наблюдению ) подвергаются.
Расчет оптимальной численности выборки. Статистическое наблюдение сплошное Обследование всех единиц изучаемой совокупности не сплошное Обследование части.
Выборочное наблюдение. Понятие выборочного наблюдения. Выборочное наблюдение – это такой вид статистического наблюдения, при котором обследованию подвергается.
ЛЕКЦИЯ 7 ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ § 1. Основные понятия, классификации, обозначения.
Статистические оценки параметров распределения Доверительные интервалы.
Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.
Общая теория статистики Выборочный метод в статистике. Статистическая гипотеза.
Доверительный интервал и доверительная вероятность.
Элементы математической статиститки. Статистика – дизайн информации.
Статистические методы обработки данных 22 слайда МОУ ДОД ДЮЦ «ЕДИНСТВО»
1. ОПРЕДЕЛЕНИЕ НЕОБХОДИМОГО ОБЪЕМА ВЫБОРКИ 2. ОЦЕНКА РЕЗУЛЬТАТОВ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ 3. МАЛАЯ ВЫБОРКА.
Лекция 2 – Идентификация закона распределения вероятностей одномерной случайной величины 2.1. Основные определения 2.2. Этапы обработки данных одномерной.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Визуализация данных Визуализация данных Точечные оценки Точечные оценки Групповые характеристики Групповые характеристики Метод.
1 Понятия выборочного исследования Генеральная совокупность – вся социальная группа, про которую необходимо собрать информацию. В большинстве случаев «генеральная.
Минаева Татьяна Александровна Демьяненко Ирина Николаевна.
ВЫБОРОЧНОЕ ИССЛЕДОВАНИЕ. Выборочное статистическое исследование – это обследование выборочной совокупности с целью получения достоверных суждений о характеристиках.
Интервальное оценивание Лекция 4 для студентов 2 курса, обучающихся по специальности – Медицинская кибернетика доц. Шапиро Л.А. Красноярск, 2015.
Выравнивание статистических рядов. Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с тем, что число наблюдений.
Транксрипт:

ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ

Все единицы изучаемого явления называются генеральной со­вокупностью, а отдельная часть этих единиц, отобранных из ге­неральной совокупности для непосредственного наблюдения, именуется выборочной совокупностью. Таким образом, выборочная совокупность репрезентует (представляет) всю генеральную со­вокупность.

научно обоснован­ные способы отбора единиц выборочной совокупности а) выборка из генеральной совокупности должна быть прове­дена случайно, то есть каждая ее единица должна иметь такую же вероятность попасть в выборку, как и остальные (так, например, отобранные наилучшие или наихудшие единицы не отображают действительное распределение признака в генеральной совокуп­ности);

б)выборка должна быть осуществлена из однородной совокупности, так как при других обстоятельствах результаты выборки будут не точными и не могут в полной мере представлять генеральную совокупность.

Различают два принципиально разных способа формирования выборочной совокупности: а) повторная выборка, когда отобранная из генеральной совокупности занумерованная единица фиксируется и снова возвращается на свое место, после чего пачка номеров единиц генеральной совокупности тщательным образом перемешивается; этот способ отбора на практике является ограниченным из-за нецелесообразности, а иногда и невозможности повторного обследования;

б)бесповторная выборка, когда отобранный из пачки номер единицы генеральной совокупности откладывается в сторону и не возвращается обратно в пачку; этот способ отбора характеризуется повышенной степенью точности, надежности выборки и чаще всего используется на практике.

В статистической практике различают такие разновидности выборки: - по способу организации выборочного обследования: простая случайная выборка; механическая выборка; районированная (типическая) выборка; серийная выборка; ступенчатая выборка.

по степени охватывания единиц обследуемой совокупности выборки: -большие (при n = 30); -малые (при n < 30).

Характеристики генеральной и выборочной совокупностей Рассматриваем изучение признака X в гене­ ральной совокупности объема N единиц. Генеральная совокупность представляется вариационным рядом, но это распределение неизвестно и стоит задача его определения.

Обобщающими характеристиками этого ряда будут: генеральная средняя: генеральная дисперсия :

генеральное среднее квадратическое отклонение

доля единиц признака генеральной совокупности р, то есть часть единиц М, которая обладает данным значением признака в общем объеме N единиц генеральной совокупности:

Цель выборочного исследования заключается в том, чтобы, ото­брав из генеральной совокупности n единиц, обследовать их и на этой основе оценить неизвестные нам генеральные характеристи­ки. Вариация признака х в выборочной совокупности объемом n может быть представлена в виде вариационного ряда, который 1 в общем случае отличается от вариационного ряда, представляющего генеральную совокупность, но характеристики которого могут быть определены.

Обобщающими характеристиками выборочной сово­купности будут: 1)выборочная средняя 2) выборочная дисперсия

3) выборочное среднее квадратическое отклонение ; 4) доля единиц признака выборочной совокупности w, то есть отношение количества единиц выборочной совокупности m, которая обладает данным признаком, к объему выборочной совокупности n:

5) часть выборки w в как отношение объема выборки к объему генеральной совокупности

Ошибки выборочного наблюдения Ошибками выборки называются некоторые расхождения ха­рактеристик генеральной и выборочной совокупности. Они вклю­чают ошибки регистрации и репрезентативности. Ошибками регистрации называют такие, которые возникают в результате получения неточных или неверных сведений от от­дельных единиц совокупности из-за несовершенства измеритель­ ных приборов, недостаточной квалификации наблюдателя, недо­статочной точности расчета и т. п. Эти ошибки должны быть ис­ключены или сведены к минимуму.

Ошибки репрезентативности разделяют на систематические случайные. Систематические ошибки репрезентативности возникают в результате особенностей принятой системы накоп­ления и обработки данных наблюдения или из условий несоблю­дения правил отбора в выборочную совокупность. Такие ошиб­ки также должны быть исключены

Случайные ошибки репрезен­тативности возникают прежде всего из-за того, что выборочная совокупность при ее малом объеме не всегда точно воспроизво­дит характеристики генеральной совокупности. Поэтому этот вид ошибок выборки является основным, и задание выборочного ме­тода заключается в получении таких выборочных характерис­тик, которые бы как можно точнее воспроизводили характерис­ тики генеральной совокупности, то есть давали наименьшие ошиб­ки репрезентативности.

Закон больших чисел Выборочный метод наблюдения основан на вероятном подхо­де, теоретической базой для которого является закон больших чисел. Сущность закона больших чисел заключается в том, что при уве­личении численности единиц совокупности постепенно уменьша­ется элемент случайности в обобщенных характеристиках сово­купности.

На основе закона можно утверждать, что при доста­точно большом объеме выборки (n=30) выборочные характеристики мало отличаются от генеральных, в результате чего исполь­зуются приближенные зависимости для средней, доли, дисперсии, среднем квадратическом отклонении:

Теорема Чебышева при неограниченном увеличении количества независимых наблюдений в генеральной совокупности при ограниченной дисперсии с вероятностью, сколь угодно приближенной к единице, можно утверждать, что выборочные характеристики (средняя, доля) будут достаточно мало отличаться от соответствующих генеральных характеристик, то есть

Теорема Ляпунова при достаточно большом количестве независимых наблюдений в генеральной совокупности с ограниченной дисперсией вероятность того, что величина отличия между выборочной и генеральной средней не превышает по абсолютной величине некоторого значения Δ и равняется интегралу Лапласа, то есть

где Δ предельная ошибка выборки, или максимально возмож­ная для принятой вероятности Р: средняя квадратическая (стандартная) ошибка выборки; t коэффициент доверия, который показывает соотношение пре­дельной и стандартной ошибок и зависит от значения вероятнос­ти P; Ф(t) интеграл Лапласа

Из теоремы Ляпунова следует, что при достаточно большом количестве независимых наблюдений распределение выборочных средних и их отклонение от генеральной средней приближено к нормальному закону распределения.

Простая случайная выборка При простой случайной выборке отбор единиц осуществляет­ся из всей массы единиц генеральной совокупности без предвари­тельного распределения ее на любые группы и единицы отбора совпадают с единицами наблюдения. С практической точки зрения преимущество отдается простой бесповторной выборке

Важным условием реп­резентативности случайного отбора является то, что каждой еди­ нице генеральной совокупности предоставляется одинаковая воз­можность попасть в выборочную совокупность. Именно принцип случайности попадания любой единицы генеральной совокупно­сти в выборку предотвращает возникновение систематических ошибок отбора.

При простой случайной выборке (как и в других видах выбо­рочного наблюдения) возможно решение таких задач: определение ошибки выборочного наблюдения; определение границ генеральных характеристик на основе выборочных с заданной доверительной вероятностью (степенью надежности);

определение доверительной вероятности того, что генеральные характеристики могут отличаться от выборочных не более определенной заданной величины; нахождение необходимой численности выборки, которая с практической достоверностью обеспечивала бы заданную точность выборочных характеристик.

Решение первой задачи Средняя квадратическая ошибка бесповоротной выборки m определяется по формулам: а) для средней б)для доли

На основе теоремы Ляпунова предельная ошибка выборки равна Коэффициент доверия t при определении предельной ошибки зависит от принятого уровня вероятности Р: так, при t=1,0 значение вероятности Р=0,683; t=1,96 для вероятности Р = 0,950; t=2,0 для вероятности Р = 0,954; t = 3,0 для вероятности Р=0,997.

Решение второй задачи Оценка по данным выборки характеристик генеральной совокупности а) для средней б) для доли

Эти формулы устанавливают границы, в которых при заданной доверительной вероятности находится неизвестная величина оцениваемого параметра: средней или доли р в генеральной совокупности. Вероятность того, что величина генеральной средней или доли выйдет за доверительные границы, равняется и называется уровнем значимости.

Решение третьей задачи Доверительная вероятность Р, которую необходимо вычислить по теореме Ляпунова, является функцией от коэффициента t: Р = Ф(t), где Ф(t) интеграл Лапласа.

Значение t, в свою очередь, может быть определено через предельную и стандартную ошибки вычисленными относительно средней или доли. Наконец, по найденным значениям t из справочных таблиц находится интеграл Лапласа, отвечающий разыскиваемой веро­ятности Р, которая сравнивается с заданной величиной.

Решение четвертой задачи а) для средней б) для доли

Механическая выборка Механической называется такая выборка, при которой генеральная совокупность объемов N единиц, расположенных в определенном порядке (по увеличению или уменьшению, по алфавиту, географическому положению и т. п.), разделяется на п равных частей, и из каждой части обследуется одна единица. Отношение называется интервалом выборки.

Например, если отбор составляет 5% от генеральной совокупности работающих на предприятии, размещенных в списке в алфавитном порядке, то обследуют каждого 20-го работающего (5% это 1/20 списоч­ ного состава работающих). Интервал выборки будет равняться

За начало отсчета при обследовании генеральной совокупности принимают или начальную единицу, определенную случайным отбором (при неблагоприятном размещении единиц генеральной совокупности) или середину первого интервала (если единицы в списке размещены по определенному признаку уве­личению или уменьшению).

Механическая выборка очень удобна в случаях, когда уже есть списки единиц, составленные в том или другом порядке, или тогда, когда мы не можем предварительно составить список еди­ниц генеральной совокупности, которые появляются постепенно в течение какого-то периода (например: при изучении покупок в магазине обследовать каждого 10-го покупателя; при контроле качества продукции проверить каждую 5-ую деталь, которая сошла со станка).

Ошибки выборки при механическом отборе единиц вычисляют по формулам простой случайной бесповторной выборки.

С целью экономии времени и средств иногда бывает удобно обследовать не всю выборочную совокупность, а часть ее, то есть осуществить подвыборку из единиц первичной выборки.

Этот спо­соб называют двухфазным, а при наличии нескольких подвыборок многофазным.

Многофазный способ чаще всего используют в тех случаях, когда количество необходимых для определения по­казателей имеет разную точность (например, в случаях разной степени вариации показателей). Ошибки при многофазной выбор­ке рассчитываются на каждой фазе отдельно.

Иногда бывает целесообразным взять из совокупности две или больше независимых между собой выборок, используя для каж­дой из них одинаковый способ отбора.

Такие выборки называют взаимопроникаемыми выборками. Преимущество таких выборок заключается в том, что они позволяют получить отдельные и не­зависимые оценки тех или других признаков совокупности.

Районированная (типическая) выборка Районированной выборкой называют такой способ отбора, ко­торый осуществляется на основе распределения количества отобранных единиц и между районами (группами), которые присут­ствуют в генеральной совокупности.

В качестве районов, в зави­симости от характера генеральной совокупности, могут быть при­няты территориальные области, отрасли производства, отдель­ные предприятия, социальные группы населения и т. п. Если гене­ральная совокупность разделяется на т частей, групп, районов, то есть N=N 1 +N N i +...+N m, то и выборочная совокупность должна формироваться из т частей так, чтобы п =п 1 + п п i п т.

Способы распределения между районами а) пропорциональный, когда количество отобранных в выбор­ку единиц является пропорциональным к удельному весу района в генеральной совокупности, то есть количество наблюдений в каждом районе рассчитывается по формуле:

б) непропорциональным, если из каждого района отбирают одинаковое количество единиц: где k количество выделенных районов;

в) оптимальным, которое учитывает и численность района N i,и среднее квадратическое отклонение признака в районе y i ; тогда численность каждого района выборки n i рассчитывается по фор­муле:

На практике в большинстве случаев применяют первый и тре­тий способы распределения между районами. Но использование оптимального размещения осложняется тем, что мы не всегда имеем данные о величинах у i в генеральной совокупности. Поэтому в таких случаях используется наиболее часто применяемое пропор­циональное распределение между районами.

Формулы расчета средней квадратической ошибки выборки при бесповторном отборе внутри районов для пропорционального способа распределения между районами а) для средней

где средняя из дисперсий районов выборки б) для доли где - средняя из частей районов

Необходимая численность выборки при бесповторном отборе внутри районов а)для средней б) для доли

Разновидностью районированной выборки является типическая выборка. При таком отборе районы генеральной совокупно­сти выделяются по признаку, который изучается. Так, например, для определения среднего возраста студентов можно разделить их на группы, которые имеют или не имеют производственного стажа. Таким образом получаем «тип» с точки зрения принятого признака группы и увеличиваем точность выборки.

Серийная выборка При серийной выборке отбору подле­жат отдельные серии (группы, гнезда) единиц генеральной сово­купности. На практике часто встречается отбор с равными сери­ями. В отобранных сериях методом случайного бесповторного или механического отбора проводят сплошное наблюдение всех единиц, которые в них вошли.

Поскольку при серийной выборке каждая серия выступает как самостоятельная единица наблюдения, то дисперсия внутри се­рий в случае определения средней ошибки и численности выбор­ки должна быть исключена и учитывается только межсерийная дисперсия.

При равных сериях средняя квадратическая ошибка беспов­торной выборки и ее численность определяются по формулам: где r - количество отобранных серий; R общее количество серий в генеральной совокупности.

Межсерийная дисперсия рассчитывается: а) для средней б) для доли где - среднее в сериях; - общая средняя для серий; w i – доли в сериях (группах); - средняя доля признака для всей выборочной совокупности.

Чем меньше групповые средние и доли отличаются одна от другой, то есть чем ближе одна от другой серии за уровнем приня­того признака, тем точнее серийная выборка.

Ступенчатая выборка Серийную выборку можно рассматривать как одноступенча­тую выборку, где в случайно отобранных сериях генеральной со­вокупности проводят сплошное обследование всех единиц, кото­рые в них включены.

Но возможно сформировать выборочную совокупность в два этапа: на первом этапе методом случайного бесповторного отбора формируют серии, которые подлежат об­следованию; на втором этапе в каждой серии случайным беспов­торным отбором формируется определенное количество единиц для последующего обследования.

Средняя квадратическая ошиб­ка выборки будет зависеть от ошибки серийного отбора и ошиб­ки индивидуального отбора: где m - количество отобранных единиц в каждой серии; - средняя из внутрисерийных дисперсий. Такая выборка называется двухступенчатой.

Многоступенчатый отбор характеризуется тем, что на всех ступенях, за исключением последней, осуществляется наблюде­ние только за последней ступенью. Этот отбор отличается от мно­гофазного отбора тем, что используется в механической выбор­ке: при многоступенчатом отборе на разных ступенях используют единицы отбора разных порядков, а при многофазном отборе пользуются на каждой фазе одними и теми же единицами отбора.

Малые выборки Теорема Ляпунова доказывает, что ошибки выборки являются случайными величинами и распределены по нормальному закону распределения. В том случае, когда выборка малая данное утверждение будет уже не справедливо, то есть закон распределения отклонений выборочных характеристик от генераль­ных будет отличаться от нормального

Английский ученый В. Госсет (Стьюдент) (1908 ). Определил характеристики этого закона, который и был назван его именем t-распределение Стьюдента, которое подобно нормаль­ному закону.

Отклонение выборочной средней от генеральной средней Стьюдент выразил в виде отношения Стьюдента. Фактически это коэффициент доверия между предельной и средней квадратической ошибкой малой выборки: Δ мв =tμ мв

Значение t может быть найдено по математическим таблицам распределения Стьюдента в зависимости от уровня значимости а =1 - Р где Р уровень вероятности и числа степеней свободы k=n-1 п объем малой выборки.

Средняя квадратическая ошибка для количеств признака ма­лой выборки определяется по формуле: где дисперсия малой выборки

Вероятность того, что ошибка выборки будет не больше за­данного значения представляет собой функцию S(t,n), приведенную в таблицах Стьюдента в литературе по ма­тематической статистике:

Из таблиц Стьюдента следует, что при увеличении объема выборки распределение Стьюдента приближается к нормально­му закону и при п = 20 он мало отличается от нормального рас­ пределения. Следует учесть, что распределение Стьюдента используется только в оценке ошибок выборки, взятой из генеральной сово­купности с нормальным законом распределения признака.

Ряды динамики