Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемИван Евтухов
1 Статистическая обработка данных Основные статистические характеристики
2 Статистика знает все. Точно учтено количество пахотной земли в СССР с подразделением на чернозем, суглинок и лесс. Все граждане обоего пола записаны в аккуратные толстые книги, так хорошо известные Ипполиту Матвеевичу Воробьянинову - книги загсов. Известно, сколько какой пищи съедает в год средний гражданин республики. Известно, сколько этот средний гражданин выпивает в среднем водки, с примерным указанием потребляемой закуски. Известно, сколько в стране охотников, балерин, револьверных станков, собак всех пород, велосипедов, памятников, девушек, маяков и швейных машинок. Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц! … От статистики не скроешься никуда. Она имеет точные сведения не только о количестве зубных врачей, колбасных, шприцев, дворников, кинорежиссеров, проституток, соломенных крыш, вдов, извозчиков и колоколов, но знает даже, сколько в стране статистиков. И.Ильф, Е.Петров Двенадцать стульев
3 Статистическая обработка данных Основные статистические характеристики
4 Основные этапы статистической обработки данных Пример В ходе некоторого анкетирования были получены следующие ответы: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 3, 4, 5, 7, 9, 1, 5, 7, 9, 3, 5, 3, 5, 3, 5, 3, 5, 5, которые занесли в таблицу Ответ Кол-во ответов
5 Основные этапы статистической обработки данных Каждый ответ (0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10) называется - варианта измерения. Если все варианты записать по порядку (например, по времени и т.п.) то получится ряд данных. 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 3, 4, 5, 7, 9, 1, 5, 7, 9, 3, 5, 3, 5, 3, 5, 3, 5, 5 Если же все варианты записать в порядке неубывания, то получится сгруппированный ряд данных. 0, 0, 1, …, 1, 2, 2, 2, 3, …, 3, 4, …, 4, 5, …, 5, 6, 6, 6, 7, …, 7, 8, 8, 8, 9, …, 9, Если среди всех данных одна из вариант встретилась k раз, то число k называют кратностью этой варианты.
6 Основные этапы статистической обработки данных Таким образом, таблица распределения данных имеет вид: Сумма (50) всегда равна сумме кратностей ( ) Варианта Сум ма Кратн ость
7 Основные этапы статистической обработки данных По таблице распределения данных строят три вида диаграмм Варианта Сум ма Кратн ость
8 Основные этапы статистической обработки данных Многоугольник распределения Варианта Сум ма Кратн ость
9 Основные этапы статистической обработки данных Гистограмма распределения Варианта Сум ма Кратн ость
10 Основные этапы статистической обработки данных Круговая диаграмма Варианта Сум ма Кратн ость
11 Основные этапы статистической обработки данных 1.Упорядочивание и группировка 2.Составление таблицы распределения данных 3.Построение графиков распределения данных (многоугольник, гистограмма, круговая диаграмма) 4.Получение паспорта данных измерения Объём измерения Размах измерения Мода измерения Среднее измерения Медиана измерения Частота варианты меры центральной тенденции
12 Числовые характеристики измерения Объём измерения – количество значений измерения. Размах измерения – разность между наибольшим и наименьшим результатами измерени я. Мода измерения – наиболее часто встречающийся результат измерени я. Среднее измерения – среднее арифметическое всех значений. Медиана измерения – средняя варианта в сгруппированном ряде данных (если количество значений нечётно) или полусумма двух средних вариант (если количество значений чётно). Частота варианты – отношение кратности варианты к объёму измерени я ; может быть числовой и процентной.
13 Дисперсия Числовую характеристику данных измерения, отвечающую за разброс (рассеивание) данных вокруг их среднего значения, называют дисперсией (от лат. disperses – рассыпанный, разогнанный, рассеянный) и обозначают буквой D; число σ = называют средним квадратическим отклонением. Чем меньше дисперсия D или среднее квадратическое отклонение σ, тем плотнее группируются данные измерения вокруг своего среднего значения.
14 Алгоритм вычисления дисперсии Для нахождения дисперсии D данных х 1, х 2, …, х n измерения следует вычислить: 1)Среднее значение М=(х 1 +х 2 +…+х n )/n 2)Отклонения данных от М, т.е. х 1 -М, х 2 -М, …, х n -М 3)Квадраты (х i -М) 2 отклонений, найденных на предыдущем шаге 4)Среднее значение всех квадратов отклонений D=[(х 1 -М) 2 + (х 2 -М) 2 +…+(х n -М) 2 ]/n это и есть дисперсия. σ = среднее квадратическое отклонение
15 Статистические функции MS Excel МОДА(число1; число2;…) – возвращает значение моды для массива или диапазона значений СРЗНАЧ(число1; число2;…) – возвращает среднее арифметическое своих аргументов, которые могут быть числами, именами, массивами или ссылками на ячейки с числами МЕДИАНА(число1; число2;…) – возвращает медиану исходных чисел ЧАСТОТА(массив_данных;массив_интервалов) – вычисляет распределение значений по интервалам и возвращает вертикальный массив, содержащий на один элемент больше, чем массив интервалов ДИСП(число1; число2;…) – оценивает дисперсию по выборке
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.