1 Описательная статистика. 2 Основные понятия Переменная = одна характеристика объекта или события Количественные: возраст, ежегодный доход Качественные:

Презентация:



Advertisements
Похожие презентации
Проверка статистических гипотез Основные понятия и терминология Что такое статистическая гипотеза? Лекция 6.
Advertisements

6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г.6 ноября 2012 г. Лекция 5. Сравнение двух выборок 5-1. Зависимые и независимые выборки 5-2.Гипотеза о равенстве.
Лекция 2 – Идентификация закона распределения вероятностей одномерной случайной величины 2.1. Основные определения 2.2. Этапы обработки данных одномерной.
Лекция 3 - Проверка гипотез в одномерном статистическом анализе 3.1. Основные понятия, используемые при проверке гипотез 3.2. Общий алгоритм статистической.
Анализ вариационных рядов. Анализ вариационных рядов. Основные понятия и определения Генеральная совокупность – множество всех значений, характеризующих.
Математическая статистика Случайные величины. Случайной называется величина, которая в результате испытания может принять то или иное возможное значение,
ОСНОВНЫЕ СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ, ИСПОЛЬЗУЕМЫЕ В ГЕОЛОГИИ Лекция 3 по дисциплине «Математические методы моделирования в геологии» 1Грановская Н.В.
Курс математической статистики Лекционный материал Преподаватель – В.Н. Бондаренко.
Лекция 7 Постникова Ольга Алексеевна1 Тема. Элементы теории корреляции
Обработка и представление результатов измерений. Оценка случайной погрешности измерений Полученные при непосредственном измерении величины неизбежно содержат.
Теория статистики Описательная статистика и получение статистических выводов Часть 2. 1.
Описательные характеристики распределения тестовых результатов 1.Меры среднего положения (меры центральной тенденции). Мода, медиана, среднее 2.Меры вариации.
Углубленный анализ данных: этапы проверки гипотез Ключевые решения при проверке гипотез Этап 1: 1. Определяется нулевая гипотеза. Нулевая гипотеза – это.
Описательная статистика Параметры распределения. Асимметрия, эксцесс, модальность Распределение оценок студентов по разным разделам дисциплины: А – отрицательная.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Визуализация данных Визуализация данных Точечные оценки Точечные оценки Групповые характеристики Групповые характеристики Метод.
Проверка гипотез на примере уравнения регрессии Проверка гипотез и соответствующие статистические выводы являются одними из центральных задач математической.
1.Основные понятия случайной величины 1.1 Классификация случайных процессов.
Количественные характеристики случайных переменных Математическое ожидание (среднее значение) Математическое ожидание (среднее значение) Дисперсия и среднее.
Изучает закономерности массовых случайных явлений.
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
Транксрипт:

1 Описательная статистика

2 Основные понятия Переменная = одна характеристика объекта или события Количественные: возраст, ежегодный доход Качественные: пол, раса человека Таблица частот = таблица, в которой собраны сведения о том, сколько раз встречаются данные с определенной величиной.

3 Статистические параметры распределения Персентиль – это такое значение заданного распределения, которое больше «р» процентов всех значений распределения. Квартили – значения, соответствующие 25, 50 и 75-й персентилям, т.е. четвертям распределения. Интерквартильный диапазон – разница между первой и третьей квартилями. Медиана - середина распределения, т.е. одна половина заданного набора данных имеет меньшие значения, а другая – большие значения.

4 Среднее значение = сумма значений, деленная на их количество. Усеченное среднее – среднее для набора данных, из которого исключены несколько процентов значений с обоих концов распределения. Среднее геометрическое n (Х 1 )*(Х 2 )*…*(Х n ) X = сумма всех значений общее количество наблюдений = Х 1 + Х 2 +…+Х n n = n x i i=1 n

5 Меры изменчивости

6 Основные понятия Изменчивость характеризует различия между данными или разброс от центра Диапазон = разница между максимальным и минимальным значениями распределения. Отклонение = наиболее распространенная мера изменчивости Стандартное отклонение

7 Вероятность

8 Основные понятия Случайные события - события, в которых нельзя точно определить отдельные исходы, но суммарный исход имеет определенную закономерность. Определение вероятности = количество успешных исходов на их общее число. Относительная частота = количество повторений события на общее число испытаний.

9 Распределение вероятностей = набор вероятностей для нескольких событий Вероятность каждого события или комбинации событий должна находиться в диапазоне от 0 до 1. Сумма вероятностей всех возможных событий должна быть равна 1.

10 Случайные переменные Случайная переменная - переменная, которая принимает значения случайным образом в соответствии с распределением вероятностей. Дискретная случайная переменная принимает значения в соответствии с дискретным распределением вероятностей. Непрерывная случайная переменная - в соответствии с непрерывным распределением вероятностей.

11 Случайные выборки данных Наблюдение - каждое зарегистрированное значение, которое принимает случайная переменная. Выборка - набор нескольких таких наблюдений. Случайная выборка - если наблюдения генерируются совершенно случайным образом и без какой-либо тенденции.

12 Доверительные интервалы

13 Свойства распределений и выборок 1. Выборочное среднее приблизительно удовлетворяет нормальному распределению со средним μ и стандартным отклонением σ / n, где μ среднее распределения, из которого сделана выборка, σ стандартное отклонение распределения, из которого сделана выборка, п размер выборки. В общем это свойство обозначается следующим выражением: х = N ( μ, σ / n) 2. В нормальном распределении около 95% значений попадают в диапазон двух стандартных отклонений от среднего.

14 Пример доверительного интервала Если σ ( σ стандартное отклонение распределения, из которого сделана выборка) = 10, а п (п размер выборки ) = 25, то выборочное среднее приблизительно удовлетворяет нормальному распределению со средним μ и стандартным отклонением 2, т.е. с вероятностью 95% выборочное среднее попадает в диапазон отклонения на 4 единицы от μ. Это значит, что если выборочное среднее равно 20, то μ ( μ среднее распределения, из которого сделана выборка) с вероятностью 95% находится в диапазоне от 16 до 24. Этот диапазон называется доверительным интервалом (x- μ / (σ / n)) – N (0;1)

15 Проверка гипотез

16 Четыре основных элемента 1. Формулировка нулевой гипотезы Н о. 2. Формулировка альтернативной гипотезы Н а. 3. Вычисление статистики теста. 4. Определение области непринятия гипотезы.

17 Типы ошибок Никогда нет абсолютной уверенности в том, что выводы не содержат ошибок, но вероятность ошибок можно сократить. Во время проверки гипотез может возникнуть два типа ошибок. Ошибка первого типа заключается в отказе от нулевой гипотезы, которая на самом деле является истинной. Ошибка второго типа заключается в принятии нулевой гипотезы, тогда как на самом деле истинной является альтернативная гипотеза. Вероятность возникновения ошибки первого типа обозначается греческой буквой а, а вероятность возникновения ошибки второго типа буквой ß.

18 Пример проверки гипотезы Фабрика по производству резисторов: количество дефектных резисторов в партии соответствует нормальному распределению со средним 50 и стандартным отклонением 15. На фабрике предлагается внедрить новый технологический процесс, который позволяет сократить количество дефектных резисторов с экономией материалов. После анализа выборки из 25 партий среднее количество дефектных резисторов в партии равно 45. Можно ли на основании этих данных утверждать, что новый технологический процесс позволяет сократить количество дефектных резисторов или число 45 является результатом допустимого случайного отклонения, а внедренный технологический процесс ни на что не влияет?