Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемoknedis.narod.ru
1 1 Описательная статистика
2 2 Основные понятия Переменная = одна характеристика объекта или события Количественные: возраст, ежегодный доход Качественные: пол, раса человека Таблица частот = таблица, в которой собраны сведения о том, сколько раз встречаются данные с определенной величиной.
3 3 Статистические параметры распределения Персентиль – это такое значение заданного распределения, которое больше «р» процентов всех значений распределения. Квартили – значения, соответствующие 25, 50 и 75-й персентилям, т.е. четвертям распределения. Интерквартильный диапазон – разница между первой и третьей квартилями. Медиана - середина распределения, т.е. одна половина заданного набора данных имеет меньшие значения, а другая – большие значения.
4 4 Среднее значение = сумма значений, деленная на их количество. Усеченное среднее – среднее для набора данных, из которого исключены несколько процентов значений с обоих концов распределения. Среднее геометрическое n (Х 1 )*(Х 2 )*…*(Х n ) X = сумма всех значений общее количество наблюдений = Х 1 + Х 2 +…+Х n n = n x i i=1 n
5 5 Меры изменчивости
6 6 Основные понятия Изменчивость характеризует различия между данными или разброс от центра Диапазон = разница между максимальным и минимальным значениями распределения. Отклонение = наиболее распространенная мера изменчивости Стандартное отклонение
7 7 Вероятность
8 8 Основные понятия Случайные события - события, в которых нельзя точно определить отдельные исходы, но суммарный исход имеет определенную закономерность. Определение вероятности = количество успешных исходов на их общее число. Относительная частота = количество повторений события на общее число испытаний.
9 9 Распределение вероятностей = набор вероятностей для нескольких событий Вероятность каждого события или комбинации событий должна находиться в диапазоне от 0 до 1. Сумма вероятностей всех возможных событий должна быть равна 1.
10 10 Случайные переменные Случайная переменная - переменная, которая принимает значения случайным образом в соответствии с распределением вероятностей. Дискретная случайная переменная принимает значения в соответствии с дискретным распределением вероятностей. Непрерывная случайная переменная - в соответствии с непрерывным распределением вероятностей.
11 11 Случайные выборки данных Наблюдение - каждое зарегистрированное значение, которое принимает случайная переменная. Выборка - набор нескольких таких наблюдений. Случайная выборка - если наблюдения генерируются совершенно случайным образом и без какой-либо тенденции.
12 12 Доверительные интервалы
13 13 Свойства распределений и выборок 1. Выборочное среднее приблизительно удовлетворяет нормальному распределению со средним μ и стандартным отклонением σ / n, где μ среднее распределения, из которого сделана выборка, σ стандартное отклонение распределения, из которого сделана выборка, п размер выборки. В общем это свойство обозначается следующим выражением: х = N ( μ, σ / n) 2. В нормальном распределении около 95% значений попадают в диапазон двух стандартных отклонений от среднего.
14 14 Пример доверительного интервала Если σ ( σ стандартное отклонение распределения, из которого сделана выборка) = 10, а п (п размер выборки ) = 25, то выборочное среднее приблизительно удовлетворяет нормальному распределению со средним μ и стандартным отклонением 2, т.е. с вероятностью 95% выборочное среднее попадает в диапазон отклонения на 4 единицы от μ. Это значит, что если выборочное среднее равно 20, то μ ( μ среднее распределения, из которого сделана выборка) с вероятностью 95% находится в диапазоне от 16 до 24. Этот диапазон называется доверительным интервалом (x- μ / (σ / n)) – N (0;1)
15 15 Проверка гипотез
16 16 Четыре основных элемента 1. Формулировка нулевой гипотезы Н о. 2. Формулировка альтернативной гипотезы Н а. 3. Вычисление статистики теста. 4. Определение области непринятия гипотезы.
17 17 Типы ошибок Никогда нет абсолютной уверенности в том, что выводы не содержат ошибок, но вероятность ошибок можно сократить. Во время проверки гипотез может возникнуть два типа ошибок. Ошибка первого типа заключается в отказе от нулевой гипотезы, которая на самом деле является истинной. Ошибка второго типа заключается в принятии нулевой гипотезы, тогда как на самом деле истинной является альтернативная гипотеза. Вероятность возникновения ошибки первого типа обозначается греческой буквой а, а вероятность возникновения ошибки второго типа буквой ß.
18 18 Пример проверки гипотезы Фабрика по производству резисторов: количество дефектных резисторов в партии соответствует нормальному распределению со средним 50 и стандартным отклонением 15. На фабрике предлагается внедрить новый технологический процесс, который позволяет сократить количество дефектных резисторов с экономией материалов. После анализа выборки из 25 партий среднее количество дефектных резисторов в партии равно 45. Можно ли на основании этих данных утверждать, что новый технологический процесс позволяет сократить количество дефектных резисторов или число 45 является результатом допустимого случайного отклонения, а внедренный технологический процесс ни на что не влияет?
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.