статистические методы обработки данных 22 слайда МОУ ДОД ДЮЦ «ЕДИНСТВО»
Этапы статистического исследования 1. Сбор информации 2. Обработка информации 3. Анализ данных
Виды статистических признаков: количественные; качественные (атрибутивные, описательные) альтернативные, имеющие только два значения: да (1) или нет (0).
Виды ошибок статистического наблюдения: I. Ошибки наблюдения по источнику происхождения: - преднамеренные (тенденциозные); - непреднамеренные (случайные); - ошибки запамятования; - ошибки, связанные с фактором времени. II. Ошибки статистических расчетов.
Виды статистического наблюдения I. Виды наблюдения по характеру регистрации фактов: - текущее (непрерывное); - периодическое (прерывное); - единовременное (разовое). II. Виды наблюдения по степени охвата единиц изучаемой совокупности: - сплошное; - несплошное.
Разновидности несплошного наблюдения выборочное способ основного массива анкетные обследования монографическое исследование
Таблица оптимальных соотношений объема исследуемой совокупности (n) и числа групп (s) n s
При группировке данных необходимо знать следующее: 1. Минимальное и максимальное значение признака в группе называется нижней и верхней границей интервала. 2. Интервалы, в которых указана лишь одна граница, называются открытыми интервалами. 3. Пограничные значения признака всегда включаются в следующий интервал. 4. Ширина открытого интервала равна ширине прилежащего интервала. 5. Все интервалы группировки должны быть заполнены единицами наблюдения. 6. Мелкие группы (менее 10% совокупности) при группировке могут быть объединены рубрикой «прочие».
Группировки 1. Структурные группировки – имеют своей целью выявление структуры совокупности. 2. Типологические группировки – строятся по качественным признакам, имея своей целью выявление групп и типов явлений. 3. Аналитические группировки – направлены на выявление взаимосвязи между отдельными признаками. В основании аналитических группировок лежит факторный признак x. Признак-следствие y называется результативным, т.е. результативный признак – это признак, который изменяется под влиянием факторного признака (-ов).
Построения гистограммы на основе равноинтервальной группировки
Средние величины Средняя арифметическая Средняя степенная Средняя геометрическая Средняя квадратическая
Мода и медиана Мода (Мо) – это значение признака, наиболее часто встречающееся в данной совокупности. Медиана (Ме) – значение признака у единицы, стоящей в середине ранжированного массива.
Виды показателей вариации 1. Абсолютные показатели вариации признака: Размах вариации (колебаний) Дисперсия признака Среднее квадратическое отклонение 2. Относительные показатели вариации: Коэффициент вариации
Ошибка репрезентативности состоит из трех компонент: - случайная компонента – возникает в том случае, когда в выборочную совокупность случайно попадают единицы, существенно искажающие представление о генеральной совокупности; - систематическая компонента – возникает при нарушении принципа случайности отбора; - сущностная компонента – связана с различиями в численности единиц и степени вариации признака в выборочной и генеральной совокупности (т.е. с сущностью выборочного наблюдения).
Средняя ошибка репрезентативности Отбор генерального среднего генеральной доли Повторный Бесповторный
Способы отбора в выборочную совокупность 1. Собственно случайный отбор (метод жеребьевки или метод лото) 2. Механическая выборка 3. Типический отбор с механической выборкой 4. Многоступенчатая выборка. 5. Многофазная выборка 6. Серийная (гнездовая) выборка
Ошибка многоступенчатой выборки
Доверительный интервал генерального среднего или генеральной доли - расчет границ генерального среднего - расчета границ генеральной доли
Значения коэффициента кратности при различных уровнях доверительной вероятности Уровень доверительной вероятности p(t) 0,6830,9500,9540,9900,9970,999 Критерий кратности t 1,001,962,002,583,004,00
Формулы расчета необходимой численности выборки ОтборДля среднейДля доли Повторный Бесповторный
Связи между явлениями и признаками функциональная связь (полная) – определенному значению факторного признака соответствует одно или несколько строго определенных значений результативного признака; корреляционная связь (статистическая, неполная) – одному и тому же значению факторного признака могут соответствовать разные значения результативного признака. - слабая, - умеренная - сильная (тесная)
Аналитические методы корреляционного анализа 1. Метод приведения параллельных данных 2. Метод построения корреляционных таблиц 3. Графический метод 4. Дисперсионный анализ