Фиктивные переменные. Опр. Фиктивная переменная – сконструированная количественная переменная, описывающая качественные факторы Примеры качественных факторов:

Презентация:



Advertisements
Похожие презентации
Лекция 4 множественная регрессия и корреляция. ( продолжение )
Advertisements

Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
В задачу регрессионного анализа входит исследование остаточных величин. Исследование остаточных величин.
Лекция 1 «Введение». Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов. Специфической.
Проверка качества спецификации модели. Качество спецификации модели Под качеством спецификации модели понимается: - качество выбора функции уравнения.
Парная линейная корреляция. Метод наименьших квадратов Задача: найти оценки параметров a и b такие, что остаток в i-ом наблюдении (отклонение наблюдаемого.
ДИНАМИЧЕСКИЕ ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ. Опр. Эконометрическая модель является динамической, если в данный момент времени она учитывает значения входящих.
Временные ряды в эконометрических исследованиях..
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Регрессионный анализ. Основная особенность регрессионного анализа: при его помощи можно получить конкретные сведения о том, какую форму и характер имеет.
Лекция 10 Временные ряды в эконометрических исследованиях.
ЛЕКЦИЯ 8 КОРРЕЛЯЦИОННО- РЕГРЕССИОННЫЙ АНАЛИЗ. МОДЕЛИРОВАНИЕ СВЯЗЕЙ.
Статистический анализ зависимости стоимости квартиры от ее общей площади на рынке вторичного жилья Москвы Студент группы С210, Козлов Антон Алексеевич.
Рассмотрим квадратное уравнение (1) Дискриминант корни (в случае )
Лекция 2 Часть I: Многомерное нормальное распределение, его свойства; условные распределения Часть II: Парная линейная регрессия, основные положения.
Лекция 1 Введение.. Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов.
Оптимальное планирование эксперимента. Цель планирования эксперимента нахождение таких условий и правил проведения опытов при которых удается получить.
Лекция 6 множественная регрессия и корреляция. ( продолжение )
Коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора.
Транксрипт:

Фиктивные переменные

Опр. Фиктивная переменная – сконструированная количественная переменная, описывающая качественные факторы Примеры качественных факторов: –пол –профессия –образование –климатические условия –принадлежность к какой-либо группе Возможные пути учета качественного фактора: –оценивание отдельных регрессий для каждой категории с последующим выяснением значимо ли отличаются коэффициенты; –оценивание единой регрессии с введенной фиктивной переменной и измерением степени влияния качественного фактора.

Пример 1. Анализ зависимости урожайности пшеницы от вида вспашки и количества внесенного органического удобрения Пусть y – урожайность пшеницы, x – количество внесенного удобрения, z – вид вспашки. z=1 – для зяблевой вспашки, z=0 – для весенней вспашки. 1)Результаты регрессионного анализа без учета вида вспашки F=8,7 t a =11,9 t b =2,95r xy =0,5246 Вывод: уравнение регрессии статистически значимо.

2) Результаты регрессионного анализа по отдельным видам вспашки 3) Результаты регрессионного анализа с учетом вида вспашки путем введения фиктивной переменной z F=15,6 R=0,766 t a =11,8 t b =3,9 t d =4,1 r xz =-0,016

Общий случай Пусть качественный фактор имеет число градаций больше двух: –тогда в модель вводим несколько фиктивных переменных, число которых меньше числа качественных градаций; –одна из градаций выбирается как эталонная (для нее значения фиктивных переменных равны 0) и определяются значения фиктивных переменных для всех остальных градаций. Пример 2. Анализ зависимости цены двухкомнатной квартиры от полезной площади с учетом качества (типа) дома. Тип дома: «хрущевка», панельный, кирпичный. Решение. Введем две фиктивные переменные: z 1 и z 2. Эталонная категория – «хрущевка».

Замечание 1: параметры при фиктивных переменных представляют собой разность между средними уровнями результативного признака для соответствующей группы и эталонной группы. Замечание 2: целью включения фиктивной переменной может быть желание отразить в модели неоднородность данных. Замечание 3: рассмотренный метод фиктивной переменной предполагает равенство коэффициентов регрессии при x по частным совокупностям и возможность их замены общим коэффициентом регрессии.

Множественные совокупности фиктивных переменных Если имеются данные, собранные как по ряду количественных факторов, так и по ряду качественных факторов, то в уравнение регрессии включаются более одной совокупности фиктивных переменных. Пример 3. Исследуется зависимость веса новорожденного от интенсивности курения матери с учетом семейного положения и рожала ли ранее или нет. y - вес новорожденного x - количество сигарет, выкуриваемых в день будущей матерью d - рожала ли в прошлом s - семейное положение

1) Замужняя мать, первые родыs=0, d=0 2) Одинокая мать, первые родыs=1, d=0 3) Замужняя мать, не первые родыs=0, d=1 4) Одинокая мать, не первые родыs=1, d=1 Эталонная категория – первая. Результат исследования данных (США):

Фиктивные переменные для коэффициента наклона Пример 4. Исследуется зависимость веса новорожденного от интенсивности курения матери и фиктивной переменной числа родов в прошлом. Рассмотрим две модели: а) воздействие курения матери на вес новорожденного не зависит от номера родов; б) воздействие курения матери на вес новорожденного зависит от того, рожала раньше или нет d=0 d=1

Взаимодействие между фиктивными переменными Вернемся к примеру 3. Введем фиктивную переменную взаимодействия (sd), которую определим как произведение s и d. (sd)=1 для одиноких матерей, рожавших ранее (sd)=0 в остальных случаях Модель или Результат с.о.(18)(28)(52)(115)(2,1)

Тест Чоу Пусть имеется выборка, состоящая из двух подвыборок. Вопрос: следует ли их объединить для оценивания общей регрессии P или оценить отдельные регрессии A и B? Обозначим: U A – сумма квадратов остатков выборки A U B – сумма квадратов остатков выборки B U P – сумма квадратов остатков объединенной выборки F-статистика: Вывод: если F>F табл - не следует оценивать объединенную выборку Что делать? Ввести фиктивные переменные, позволяющие не задавать заранее какой-либо коэффициент одинаковым для обеих подвыборок.