ДИСПЕРСИЯ – главный свидетель разброса данных
Найдите среднее арифметическое, размах, моду и медиану полученного ряда данных. Объясните практический смысл этих статистических характеристик. Число бракованных деталей Число ящиков При изучении качества продукции, выпущенной цехом, определяли число бракованных деталей в каждом из 50 ящиков. Получили такую таблицу частот: Решите задачу: Проверьте себя Повторение
Случайные величины Часто в жизни приходится обрабатывать данные наблюдений. При этом предметом исследования может быть что угодно. Например, каждый день Вы проходите путь до школы и обратно. Сколько шагов Вы делаете, преодолевая это расстояние? Если в течение нескольких дней провести подсчеты, то наверняка получатся близкие друг к другу, но всё же разные результаты. Почему так происходит? Какие факторы влияют на результат подсчетов? Таким образом, можно сказать, что количество шагов от дома до школы – величина случайная. Случайные величины
Пусть некий школьник Ваня Иванов получил следующую последовательность чисел: 372, 376, 374, 375, 373, 364, 380, 374, 377, 375, 376, 373, 375, 374, 373, 371, 375, 373, 374, 376. Какое число шагов считать расстоянием от дома до школы? Насколько точно среднее значение характеризует это расстояние ? Ответить на последний вопрос нам поможет новая статистическая характеристика – дисперсия. Если провести 20 наблюдений, получим 20 значений случайной величины. Случайные величины
Дисперсия Дисперсия – среднее арифметическое квадратов разностей между значениями случайной величины и ее средним значением, т. е.: где а 1, а 2, а 3, … а n - данные, S – среднее арифметическое, n – количество чисел в ряду. Дисперсия
Точность наблюдений Из формулы видно, что чем меньше дисперсия, тем меньше отличаются результаты наблюдения от своего среднего значения и тем ближе среднее значение к истинному. Дисперсия
Вычисление дисперсии в Excel Для вычисления дисперсии числового ряда в Excel используется статистическая функция ДИСПР(диапазон ячеек). Откройте файл statistica7 из папки zagotovki, внесите в таблицу необходимые формулы и получите среднее значение числового ряда и его дисперсию.statistica7zagotovki Сделайте выводы: насколько точно среднее значение характеризует расстояние от дома до школы?
Практическое применение дисперсии Допустим, что Ваня Иванов решил повторить своё исследование, но на этот раз привлек к работе друзей. Каждый из них представил по 20 результатов наблюдений, не указав своей фамилии. Можно ли определить, какие из данных принадлежат Иванову, располагая результатами первого наблюдения? Оказывается, для этого достаточно сравнить дисперсии и средние значения. Дисперсия и среднее значение так же индивидуальны, как и отпечатки пальцев. Дисперсия
Практическое применение дисперсии Если наблюдения делал один и тот же человек, то дисперсии и средние значения во всех этих наблюдениях окажутся близки, если разные люди – то далеки. Дисперсии считаются далекими, если отношение большей дисперсии к меньшей превышает число 2. Средние значения считаются далекими, если число, найденное по формуле превышает 0,6. (S 1,S 2 – средние значения,D 1, D 2 – дисперсии) Дисперсия
Практическое применение дисперсии Метод сравнения средних значений и дисперсий используется в самых разных областях человеческой деятельности: медицине, литературоведении, криминалистике. Например, рассмотрим ситуацию: Органами милиции задержан грузовик с помидорами, похищенными на овощной базе. В городе всего 4 базы, каждая из них получает помидоры из своего сельскохозяйственного района. Определите, с какой базы были вывезены помидоры. Решение задач
План решения: 1. Выберем по помидоров (а лучше – больше!) на каждой овощной базе и из грузовика. 2. Найдем массу каждого помидора. Получатся 5 числовых последовательностей. 3. Вычислим средние значения и дисперсии всех пяти последовательностей. 4. Используя метод сравнения дисперсий и средних значений, будем сравнивать характеристики первых четырех последовательностей с характеристиками пятой последовательности. Решение задач
Задание: Откройте файл statistica8 из папки zagotovki.statistica8zagotovki. Внесите в ячейки таблицы необходимые формулы и получите результаты расчетов. Проанализируйте результаты. Определите, какие дисперсии и средние близки по значению, а какие – далеки. Можно ли сейчас определить, с какой базы были украдены помидоры? Почему грузовик не с первой базы, если средние арифметические у них примерно равны? Решение задач
Урок закончен! До свидания! ВЫХОД
Среднее арифметическое: (0*8 + 1*22 + 2* *5 + 4*2)/50 = 1,42 Размах: 4 – 0 = 4 Мода: 1 Медиана: 1 Число бракованных деталей Число ящиков Проверьте себя: