24 сентября 2012 г.24 сентября 2012 г.24 сентября 2012 г.24 сентября 2012 г. Тема 1. Почему социологи применяют статистику 1.1. Что такое статистика 1.2. Измерения и шкалы
2 Иванов О.В., Что такое статистика Статистика – область деятельности людей, направленная на сбор информации и ее анализ с целью изучения массовых явлений в природе и обществе. Статистика - наука, изучающая количественные характеристики массовых явлений в неразрывной связи с учетом их качественного своеобразия. Математическая статистика - область науки, разрабатывающая математические методы сбора и анализа статистических данных для получения научных и практических выводов. Составными частями математической статистики являются: (1)описание данных, (2)статистическое оценивание (3) проверка статистических гипотез. Математическая статистика 1. Описание данных 2. Статистическое оценивание 3. Проверка статистических гипотез Данные представляют собой результаты наблюдений, испытаний, накапливаемые с целью последующего изучения и анализа.
3 Иванов О.В., 2004 Есть ли у вас проблемы с числами Недоверие к числам - «Есть ложь, есть наглая ложь, а есть статистика» Означает ли применение чисел дегуманизацию? Математические символы и формулы – учитесь говорить заново Статистические методы работают в контексте. Надо понимать смысл и логику
4 Иванов О.В., 2004 Переменные, признаки Переменная, признак – это некоторая общая для всех изучаемых объектов характеристика или свойство, конкретные проявления которого могут меняться от объекта к объекту. Проявления признака называют значениями, альтернативами, градациями. ПеременнаяВозможные значения «Пол» два значения: «мужчина» и «женщина» «Профессия» большое число значений, например, «менеджер» «Рост» может меняться от «очень низкий» до «очень высокий» или от 150 см до 210 см Умение «мыслить признаками», правильно определять переменные для достижения исследовательских целей является одним из важнейших качеств социолога-профессионала.
5 Иванов О.В., 2004 Распределения переменных Различные значения переменной, которые она принимает для различных изучаемых объектов, приводят нас к необходимости рассматривать распределение переменной. Изучаем сообщество из 5,000 жителей одного района. ПеременнаяРаспределение «Пол» 55% женщин и 45% мужчин «Возраст» список возрастов 5,000 жителей «Уровень образования»… «Профессия»… «Годовой доход»… Распределение указанных переменных в изучаемом сообществе может отличиться от распределения этой же переменной, измеренной в другом сообществе.
6 Иванов О.В., 2004 Генеральная совокупность и выборка Генеральная совокупность (population) – вся интересующая исследователя совокупность изучаемых объектов. Выборка (sample) – некоторая, обычно небольшая, часть генеральной совокупности, отбираемая специальным образом и исследуемая с целью получения выводов о свойствах генеральной совокупности. Репрезентативная выборка хорошо представляет генеральную совокупность. Это означает, что каждое свойство (или комбинация свойств) наблюдается в выборке с той же частотой, что и в генеральной совокупности. Параметры - характеристики генеральной совокупности Статистики - характеристики выборки. Мы будем использовать статистики для оценки тех параметров генеральной совокупности, которым они соответствуют.
7 Иванов О.В., 2004 Генеральная совокупность и выборка (2) Что рассматривается? Генеральная совокупностьВыборка Как называется числовая характеристика? ПараметрыСтатистики Примеры Все жители города (150 тыс.) Доля мужчин в городе Средний возраст жителей Участники опроса (250 чел.) Доля мужчин в выборке Средний возраст в выборке
8 Иванов О.В., 2004 Пример. Повторные выборы мэра В ходе проведенного опроса 829 жителей города выяснилось, что 51,6% опрошенных предполагают поддержать на предстоящих выборах кандидатуру действующего мера. Можно ли на этом основании утверждать, что более половины жителей города поддерживают перевыборы действующего мера на следующий срок? Вопросы. 1. Какова генеральная совокупность? Включает все население или только трудоспособное? Сколько жителей в городе? 2. Репрезентативна ли выборка? Как она получена? Достаточен ли размер выборки для получения надежных результатов? 3. Какова доля признака в генеральной совокупности, если его доля в выборке составила 51,6%?
9 Иванов О.В., 2004 Роль статистики в социальных исследованиях Гипотеза – предположение относительно параметров генеральной совокупности, которое подлежит проверке на основе анализа выборки.
10 Иванов О.В., 2004 Описательная и аналитическая статистика Описательная статистика (descriptive statistics) состоит из статистических методов, которые позволяют проводить сбор, упорядочение, обобщение и визуализацию данных. Аналитическая статистика (inferential statistics) состоит из методов, которые на основе изучения статистик выборки позволяют получать выводы о параметрах генеральной совокупности.
11 Иванов О.В., 2004 Этапы статистического анализа Этап 1. Планирование исследования включает составление подробного плана сбора данных, возможно, с использованием случайной выборки из генеральной совокупности. Этап 2. Предварительное исследование данных включает рассмотрение набора данных с разных точек зрения, описание и обобщение данных. Выполнение этого этапа помогает убедиться, что запланированный анализ адекватен данным, а при необходимости позволяет внести в процесс анализа определенные коррективы. Этап 3. Оценивание неизвестной величины дает наиболее обоснованное возможное предположение о значении, основанное на исходных данных. Кроме того, есть возможность вычислить величину ошибки, которая возникает при использовании оценки вместо фактического, но неизвестного значения. Этап 4. Проверка статистических гипотез заключается в использовании данных для выбора одной из двух (или больше) различных возможностей при решении вопроса в неопределенной ситуации. Такая проверка позволяет убедиться, действительно ли данные обладают определенным интересным свойством, или мы имеем дело с "чистой случайностью", которая не представляет интереса. Планирование Исследование Оценивание Проверка гипотез
12 Иванов О.В., Измерения и шкалы Измерение означает присвоение чисел характеристикам изучаемых объектов, явлений согласно некоторому правилу. Шкала есть правило (или алгоритм), в соответствии с которым изучаемым объектам, явлениям присваиваются числа. Далее о следующем: Два типа данных Четыре критерия измерений Пять типов шкал
13 Иванов О.В., 2004 Данные Дискретные данные представляют собой отдельные значения признака, общее число которых конечно либо если бесконечно, то является счетным, т.е. может быть подсчитано натуральными числами от одного до бесконечности. Непрерывные данные могут принимать любое значение в некотором интервале. РеспондентВозрастПолОбразованиеСемейное положение Данные представляют собой результаты наблюдений, испытаний, накапливаемые с целью последующего изучения и анализа.
14 Иванов О.В., 2004 Критерии измерений Надежность измерения означает возможность получить согласующиеся результаты при повторных измерениях характеристик объекта. Достоверность измерения означает соответствие между результатами измерения и его целями, между выбранной шкалой и исследуемыми переменными. Завершенность измерения означает, что в результате измерения мы должны получить хотя бы одно значение измеряемой переменной. Единственность измерения означает, что в результате измерения мы должны получить только одно значение измеряемой переменной.
15 Иванов О.В., 2004 Шкалы Номинальная шкала состоит из названий, имен или категорий для сортировки или классификации объектов, явлений по некоторому признаку. Результаты измерений, полученные при помощи номинальной шкалы, не могут быть упорядочены и с ними не могут производиться арифметические операции. Порядковая шкала означает, что числа присваиваются объектам, чтобы обозначить относительные позиции объектов, но не величину различий между ними. Интервальная шкала позволяет находить разницу между двумя величинами. Обладает всеми свойствами номинальной и порядковой, но она позволяет указать количественное значение измеряемого признака. Недостатком служит отсутствие абсолютного нуля в качестве точки отсчета. Относительная шкала обладает абсолютным нулем в качестве точки отсчета, что позволяет ей иметь все свойства интервальной шкалы. Для данных этой шкалы осмысленными являются все операции, включая вычитание и дроби. Дихотомическая шкала - номинальная шкала, которая состоит из двух категорий.
16 Иванов О.В., 2004 Шкалы (2) НоминальнаяСодержит только Хобби студента категории, данные не могут упорядочиваться ПорядковаяСодержит категории, которые Место на соревнованиях могут упорядочиваться, разности не имеют смысла ИнтервальнаяРазности между значениями Температура тела студента могут быть вычислены, но отсутствует точка отсчета ОтносительнаяИмеется точка отсчета, Рост студента возможны отношения между значениями ДихотомическаяСодержит две категорииПол студента
17 Иванов О.В., 2004 Количественные и качественные данные Данные Категории (качественные данные) НоминальныеПорядковые Числа (количественные данные) ДискретныеНепрерывные Номинальная шкала Порядковая шкала Интервальная шкала Относительная шкала Какие шкалы для каких данных?
18 Иванов О.В., 2004 Понятия и термины 1.1. Что такое статистика Статистика Переменная, признак Распределение переменных Описательная статистика и Аналитическая статистика Генеральная совокупность и Выборка Репрезентативность выборки Гипотезы Независимые и Зависимые переменные 1.2. Измерения и шкалы Измерения: Достоверность, Надежность, Завершенность и Единственность Данные: Дискретные и Непрерывные данные Шкалы: Номинальная, Порядковая, Интервальная, Относительная и Дихотомическая шкала
19 Иванов О.В., 2004 Пример. Дискретные или непрерывные? Возраст сотрудника Годовой доход компании Рост студента Вес автомобиля Количество лет обучения сотрудника
20 Иванов О.В., 2004 Пример. Какой тип шкалы? Температура воздуха в лекционной аудитории Возраст Пол студента Семейное положение Место жительства Религиозные предпочтения Время на подготовку домашнего задания Трудолюбие
21 Иванов О.В., 2004 Пример. Укажите генеральную совокупность и выборку Среди 200 случайно выбранных телезрителей 19% выключат телевизор в течение ближайших 15 минут 4 из 15 опрошенных читателей газеты поддержат кандидатуру нынешнего губернатора на очередных выборах Время подготовки к занятиям превышает 3 часа в день у половины студентов