Исследование взаимосвязей социально- экономических явлений
Методы изучения связи социальных явлений Важной задачей статистики является разработка методики статистической оценки социальных явлений, которая осложняется тем, что многие социальные явления не имеют количественной оценки. Количественная оценка связей социальных явлений осуществляется на основе расчета и анализа целого ряда коэффициентов
Взаимосвязанные признаки : а) факторные (под их воздействием изменяются другие признаки) б) результативные
Виды связи по степени тесноты: а)функциональная б) статистическая
Функциональная связь – каждому значению факторного признака соответствует строго определённое одно или несколько значений результативного признака сбор зерна = средняя урожайность* посевные площади
Статистическая связь - одному и тому же значению факторного признака может соответствовать несколько значений результативного признака. Проявляются только для большого числа единиц совокупности
Корреляционная связь - соответствие одному и тому же значению факторного признака сколько угодно различных значений результативного признака. Связь прослеживается лишь при достаточно большом количестве наблюдений и лишь в форме средней величины
Связь по направлению: ПРЯМАЯ – с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного; ОБРАТНАЯ – значения результативного признака изменяются в противоположном направлении по сравнению с изменением факторного признака
По аналитическому выражению выделяют связь: ЛИНЕЙНУЮ – статистическая связь между явлениями приближенно выражена уравнением прямой линии; НЕЛИНЕЙНУЮ – статистическая связь выражена уравнением какой-либо кривой линии (параболы, гиперболы)
Основные приемы изучения взаимосвязей
Метод сравнения параллельных рядов Параллельное (одновременное) приведение двух рядов данных, связь между которыми следует выявить. Пример: выявление зависимости между объёмом производства и себестоимостью Применение метода: ранжирование предприятий по объему выпуска по возрастанию и прослеживание динамики себестоимости
Балансовый метод Изображение данных взаимосвязанных показателей в виде таблицы и их расположение следующего вида: итоги между отдельными её частями равны (сбалансированы). Используется для характеристики взаимосвязи между производством и распределением продуктов, денежными доходами и расходами населения
Объёмы транспортных потоков между регионами (млн тонно-км) Регионы отправ- ления Регионы прибытия Итого отправ- лено АБВГ А Б В Г Итого прибыло
Графический метод - наглядное представление о наличии и направлении (прямая/обратная) взаимосвязей между признаками. Метод используется как самостоятельно, так и совместно с другими
Метод аналитической группировки 1. Группировка единиц совокупности по факторному признаку. 2. Расчет средней или относительной величины по результативному признаку для каждой группы. 3.Сопоставление рассчитанных изменений с изменениями факторного признака для выявления характера связи между ними
Количество вкладчиков и средний остаток вклада по филиалам Сбербанка Число вкладчиков, человек Средний остаток по вкладу, тыс. руб , , ,05
Дисперсионный анализ 1.Определение вида признака- факторный/результативный 2.Группировка по факторному признаку 3.Расчет среднего значения факторного и результативного признака в группах 4.Выявление взаимосвязи между рассчитанными средними
Межгрупповая дисперсия используется для оценки тесноты связи по результатам факторной группировки Сопоставление межгрупповой дисперсии и общей дисперсии дает характеристику тесноты корреляционной связи между признаками
Сопоставление межгрупповой дисперсии и общей дисперсии дает характеристику тесноты корреляционной связи между признаками – Коэффициент детерминации - тесная связь
Корреляционное отношение Характеризует долю вариации результативного признака, вызванной действием факторного признака. Чем ближе корреляционное отношение к 1, тем большее влияние оказывает факторный признак на результативный
Если факторный признак не влияет на результативный Если результативный признак изменяется только под воздействием одного факторного признака Существование полной связи
Уровень значимости - достаточно малое значение вероятности, отвечающее событиям, которые в данных условиях исследования будут считаться практически невозможными. Это указывает на ошибочность начального предположения
Число степеней свободы факторной дисперсии n – число групп
Число степеней свободы случайной дисперсии m – число групп n – число вариант
Критерий Фишера -П-Проверка существенности связи. Используется при распределении, близком к нормальному -О-Отношение межгрупповой дисперсии к средней из внутригрупповых дисперсий, исчисленных с учетом числа степеней свободы
Корреляционно- регрессионный анализ 1. Определение формы связи 2. Измерение тесноты связи
1. Определение формы связи -Нахождение уравнения регрессии -Априорный теоретический анализ (с ростом факторного признака равномерно растет и результативный) -Проверка априорного теоретического анализа с помощью графического анализа
2. Измерение тесноты связи -Оценка и анализ полученных результатов при помощи показателей корреляционного анализа (коэффициенты детерминации, линейной и множественной корреляции) -Проверка существования связи между изучаемыми признаками
Этапы корреляционного анализа 1.Предварительный анализ объекта исследования 2.Сбор и первичная обработка информации 3.Построение уравнения регрессии и определение его параметров 4.Проверка адекватности полученной модели
Виды корреляционно- регрессионных связей Прямые/обратные Однофакторные (парная корреляция)/многофакторные Частичная связь Полное отсутствие связи
Уравнение регрессии (по аналитическому выражению) -Прямолинейное -Криволинейное
Прямолинейное уравнение Величина явления изменяется приблизительно равномерно в соответствии с изменением величины влияющего фактора
- Линейное уравнение регрессии Коэффициент регрессии. Показывает, на сколько в среднем отклоняется величина результативного признака Y при отклонении факторного признака X на одну единицу. При:
Криволинейное уравнение Неравномерное изменение явления в связи с изменением величины влияющего фактора
Параметр характеризует степень ускорения или замедления кривизны параболы и при : - Уравнение параболы второго порядка Парабола имеет минимум Парабола имеет максимум
Характеризует угол наклона кривой Характеризует начало кривой
Уравнение криволинейной связи может быть выражено и в виде гиперболической функции
Парная корреляция
Аналитическое выражение связи Аналитические методы - основной способ изучения связи. Различают параметрические и непараметрические методы
Корреляционный анализ Между стоимостью основного капитала и выпуском продукции существует прямолинейная связь, выраженная уравнением прямой. Найдите параметры а 0 и а 1
Эта задача решается методом наименьших квадратов при помощи системы нормальных уравнений. Все расчеты ведутся по данным выборочного наблюдения
Нахождение параметров позволит определить теоретические значения Y для разных значений x i. Причем а 0 и а 1 должны быть такими, чтобы было достигнуто максимальное приближение к первоначальным значениям y теоретических значений Y
Степень тесноты корреляционной связи ТЕСНОТА СВЯЗИ степень связи между признаками при наличии корреляционной зависимости, когда средняя величина значений одного признака меняется в зависимости от изменения другого признака
Измерение тесноты связи Для измерения тесноты прямолинейной связи между двумя признаками используют линейный коэффициент корреляции - r xy
или
Пределы изменения парного коэффициента корреляции
Оценка линейного коэффициента корреляции Значение линейного коэффициента связи Характер связиИнтерпретация связи r = 0 Отсутствует 0 < r < 1 Прямая С увеличением Х увеличивается У -1 < r < 0 Обратная С увеличением Х уменьшается У, и наоборот r = 1 Функциональная Каждому значению факторного признака строго соответствует одно значение результативного признака
Шкала Чеддока тесноты связи. слабая – от 0,1 до 0,3; умеренная – от 0,3 до 0,5; заметная – от 0,5 до 0,7; высокая – от 0,7 до 0,9; весьма высокая (сильная) – от 0,9 до 1,0
Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента:
При криволинейной и линейной формах связи используется индекс корреляции
- теоретическая дисперсия - общая дисперсия
Пределы изменения индекса корреляции по своему абсолютному значению
При функциональной зависимости R=1 При отсутствии связи R=0
Коэффициент детерминации Используется при любом количестве факторных признаков и при любой форме связи. Характеризует роль факторной вариации в общей вариации и по посторению аналогичен корреляционному отношению. Рассчитывается путем возведения в квадрат индекса корреляции
Множественная корреляция
Множественная корреляция используется при изучении, измерении связи между результативными признаком, двумя и более факторными
Множественная корреляция определяет : 1. форму связи 2. тесноту связи 3. влияние отдельных факторов на общий результат
1. Определение формы связи Сводится к нахождению уравнения связи y с факторами x, z,w,…,v - Линейное уравнение зависимости результативного от двух факторных
Для определения параметров а 0, а 1 и а 2 по способу наименьших квадратов, необходимо решить следующую систему трех нормальных уравнений
2. Измерение тесноты связи Производится на основе вариации результативного признака и правила сложения дисперсий:
Теоретическая дисперсия- вариация теоретического признака вокруг общей средней
Остаточная дисперсия - среднее квадратическое отклонение теоретического признака от фактического
3. Расчет коэффициента множественной корреляции Рассчитывается для определения тесноты связи результативного признака от двух факторных - парные коэффициенты корреляции
Пределы изменения коэффициента множественной корреляции
Если коэффициент множественной корреляции возвести в квадрат, то получим совокупный коэффициент детерминации, который характеризует долю вариации результативного признака Y под воздействием всех изучаемых факторных признаков
Частные коэффициенты корреляции Рассчитываются для определения тесноты связи между результативным признаком и одним из факторных при постоянных значениях прочих факторов
Непараметрические показатели связи. Ранговые коэффициенты. В анализе социально-экономических явлений часто приходится прибегать к различным условным оценкам с помощью рангов, а взаимосвязь между отдельными признаками измерять с помощью непараметрических коэффициентов связи.
Ранжирование – это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения. Ранг – это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин.
Среди непараметрических методов оценки тесноты связи наибольшее значение имеют ранговые коэффициенты Спирмена и Кендалла. Эти коэффициенты могут быть использованы для определения тесноты связи как между количественными, так и между качественными признаками при условии, если их значения будут упорядочены или проранжированы по степени убывания или возрастания признака.
Ранговые коэффициенты связи Спирмена Коэффициент ранговой корреляции Спирмена – это непараметрический метод, который используется с целью статистического изучения связи между явлениями
Коэффициент ранговой корреляции Спирмена - сумма квадратов разностей рангов, - число парных наблюдений
Ранговый коэффициент связи Кендалла - коэффициент корреляции, определяющий степень соответствия упорядочения всех пар объектов по двум переменным: n - число наблюдений, S - сумма разностей между числом последовательностей и числом инверсий по второму признаку
Коэффициент ассоциации и контингенции Применяются для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп. Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, т.е. состоящим из двух качественно отличных от друг друга значений признака
Таблица для вычисления коэффициентов ассоциации и контингенции aba + b cdc +d a + cb + da + b + c + d
Пример 1 По приведенным условным данным по отдельным отраслям промышленности в регионе рассчитать ранговые коэффициенты связи Спирмена и Кендалла Отрасль промышленности Уровень производительности труда, млн руб./чел. Среднемесячная номинальная заработная плата, тыс. руб. Электроэнергетика1,12710,96 Топливная2,63019,35 Черная металлургия1,6329,35 Цветная металлургия1,15513,45 Машиностроение0,5506,68
Решение Число пар значений n=5. Ранжируем значения факторного и результативного признаков в порядке возрастания количественных величин (графы 4 и 5). Находим разности рангов (графа 6). Полученные разности рангов ( ) возводим в квадрат, находим их сумму (графа 7) Отрасль промышленности ХУRXRX RYRY didi di2di Электроэнергетика 1,12710,96231 Топливная 2,63019, Черная металлургия 1,6329, Цветная металлургия 1,15513,45341 Машиностроение 0,5506, Итого
Подставляем значения в формулу коэффициента Спирмена При вычислении коэффициента Кендалла значения факторного признака предварительно ранжируем. Значения результативного признака записываем в соответствии с исходными данными
Отрасль промышленности ХУRxRx RyRy PQ Машиностроение 0,5506, Электроэнергетика 1,12710, Цветная металлургия 1,15513, Черная металлургия 1,6329, Топливная 2,63019, Итого 8-2
Для каждого R y определяем: число следующих за ним рангов, больших по значению, чем данный ранг. Общее число таких случаев учитывают со знаком «+» и обозначают буквой P (графа 6); число следующих за ним рангов, меньших по значению, чем данный ранг. Общее число таких случаев учитывают со знаком «-» и обозначают буквой Q (графа 7). Вычисляем S = P + Q = 8 + (-2) = 6
Подставим в формулу коэффициента Кендалла полученные значения Величины коэффициентов Спирмена и Кендалла свидетельствуют о тесной зависимости среднемесячной заработной платы от уровня производительности труда в представленных отраслях экономики
Пример 2 По приведенным ниже условным данным определить степень тесноты связи между успеваемостью студентов по математике и посещением занятий по этой же дисциплине Группы студентов Численность студентов - всего, чел. Из них Успешно сдали экзамен Не сдали экзамен Посещающие занятия Не посещающие занятия 725
Решение Расчитаем коэффициенты ассоциации и контингенции
Значения полученных коэффициентов свидетельствуют о тесной связи между успешной сдачей экзамена по математике студентом и посещением занятий по этой же дисциплине, т.к. k a >0,5 или k k >0,3
–Спасибо за внимание