Расчет оптимальной численности выборки
Статистическое наблюдение сплошное Обследование всех единиц изучаемой совокупности не сплошное Обследование части единиц изучаемой совокупности Выборочное наблюдение
Цель выборочного наблюдения – по характеристикам выборочной совокупности судить о характеристиках генеральной совокупности. При проведении медико – социальных исследований используют следующие способы формирования выборочной совокупности: Механический отбор Типологический (стратифицированный) отбор Серийный отбор Многоступенчатый (скрининговый) отбор Когортный метод Метод отбора копи - пара
Репрезентативность выборки Соответствие характеристик, получаемых в результате выборочного наблюдения, аналогичным показателем генеральной совокупности. Ошибка выборки Расхождение между характеристиками выборочной и генеральной совокупностей.
Предельная ошибка выборки где S 2 - оценка дисперсии σ 2, вычисляемая по выборке х 1 х 2, х n.
Средняя ошибка выборки (μ) - это различие между средними выборочной и генеральной совокупностями, которая по модулю не превышает σ. Тогда коэффициент доверия t характеризует ее кратность. В случае когда генеральная совокупность имеет конечный объем N, в среднюю ошибку выборки μ вводят поправочный коэффициент
На формулах расчета предельной ошибки выборки основан способ определения численности выборки, обеспечивающей заданную точность оценки. Из формулы для предельной ошибки: следует:
В случае генеральной совокупности конечного объема N аналогично можно найти: следовательно, Доверительный коэффициент t находится из таблицы квантилей нормального распределения при заданной надежности γ. При стандартных значениях надежности γ = 0,95 и γ = 0,99 соответствующие доверительные коэффициенты t равны t 0,95 = 1,96; t 0,99 = 2,58. Приведем еще два часто используемых значения: t 0,9544 = 2; t 0,9973 = 3. Если вместо σ в формуле фигурирует S, оказывается, что t зависит не только от γ, но и от n. В этом случае коэффициент t находят из таблицы квантилей распределения Стьюдента. При достаточно больших n следует, что S σ и соответствующие коэффициенты t при одинаковой надежности малоразличимы.
При оценке вероятности р по относительной частоте ω из формулы: следует: Аналогично для генеральной совокупности конечного объема N получаем: следовательно,
Таким образом, задав желаемую точность, т.е. указав предельную ошибку Δ, достаточный объем выборки n, обеспечивающий эту точность, можно найти по приведенным формулам. При n, больших найденного значения, точность увеличивается, поскольку предельная ошибка Δ уменьшается (см. формулы, связывающие n и Δ).
Оценка достоверности результатов медико – социального исследования
Для оценки достоверности используют 3 способа определения : - средних ошибок математического ожидания, оцениваемого средним значением, и вероятности осуществления случайного события в одном испытании, оцениваемой относительной частотой; - доверительных границ; - достоверности показателя разности характеристик различных совокупностей.
Средняя ошибка математического ожидания: где σ - среднее квадратическое отклонение; n - число наблюдений. Средняя ошибка при оценке вероятности по относительной частоте, находимой из выборки, определяется как:
При числе наблюдений менее 30 ошибки математического ожидания и вероятности, находимых по выборке, определяются соответственно по формулам:
Доверительные границы - это границы интервала при оценке математического ожидания или вероятности по относительной частоте, выход за пределы которых вследствие случайных колебаний имеет незначительную вероятность (стандартными значениями этих вероятностей считаются 0,05; 0,01; 0,001).
Формулы определения доверительных границ: - Для средних величин (М ген ): - Для вероятностей, находимых по частоте (Р ген ): Надежность (доверительная вероятность) γ выбирается исследователем. Стандартные значения: γ = 0,95 и γ = 0,99. Следовательно, вероятность ошибки в найденном соотношении, определяемая как 1 - γ, равна соответственно 0,05 и 0,01.
В тех случаях когда необходимо определить, случайны или достоверны различия между двумя средними величинами или двумя вероятностями, используется способ оценки достоверности разности показателей, называемый критерием значимости. Для проверки наличия или отсутствия различий в значениях показателей (проверки гипотез) используются соответствующие критерии (случайные величины): - Для средних величин: - Для вероятностей: