Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемvvsu.ru
1 Фиктивные переменные
2 Опр. Фиктивная переменная – сконструированная количественная переменная, описывающая качественные факторы Примеры качественных факторов: –пол –профессия –образование –климатические условия –принадлежность к какой-либо группе Возможные пути учета качественного фактора: –оценивание отдельных регрессий для каждой категории с последующим выяснением значимо ли отличаются коэффициенты; –оценивание единой регрессии с введенной фиктивной переменной и измерением степени влияния качественного фактора.
3 Пример 1. Анализ зависимости урожайности пшеницы от вида вспашки и количества внесенного органического удобрения Пусть y – урожайность пшеницы, x – количество внесенного удобрения, z – вид вспашки. z=1 – для зяблевой вспашки, z=0 – для весенней вспашки. 1)Результаты регрессионного анализа без учета вида вспашки F=8,7 t a =11,9 t b =2,95r xy =0,5246 Вывод: уравнение регрессии статистически значимо.
4 2) Результаты регрессионного анализа по отдельным видам вспашки 3) Результаты регрессионного анализа с учетом вида вспашки путем введения фиктивной переменной z F=15,6 R=0,766 t a =11,8 t b =3,9 t d =4,1 r xz =-0,016
5 Общий случай Пусть качественный фактор имеет число градаций больше двух: –тогда в модель вводим несколько фиктивных переменных, число которых меньше числа качественных градаций; –одна из градаций выбирается как эталонная (для нее значения фиктивных переменных равны 0) и определяются значения фиктивных переменных для всех остальных градаций. Пример 2. Анализ зависимости цены двухкомнатной квартиры от полезной площади с учетом качества (типа) дома. Тип дома: «хрущевка», панельный, кирпичный. Решение. Введем две фиктивные переменные: z 1 и z 2. Эталонная категория – «хрущевка».
6 Замечание 1: параметры при фиктивных переменных представляют собой разность между средними уровнями результативного признака для соответствующей группы и эталонной группы. Замечание 2: целью включения фиктивной переменной может быть желание отразить в модели неоднородность данных. Замечание 3: рассмотренный метод фиктивной переменной предполагает равенство коэффициентов регрессии при x по частным совокупностям и возможность их замены общим коэффициентом регрессии.
7 Множественные совокупности фиктивных переменных Если имеются данные, собранные как по ряду количественных факторов, так и по ряду качественных факторов, то в уравнение регрессии включаются более одной совокупности фиктивных переменных. Пример 3. Исследуется зависимость веса новорожденного от интенсивности курения матери с учетом семейного положения и рожала ли ранее или нет. y - вес новорожденного x - количество сигарет, выкуриваемых в день будущей матерью d - рожала ли в прошлом s - семейное положение
8 1) Замужняя мать, первые родыs=0, d=0 2) Одинокая мать, первые родыs=1, d=0 3) Замужняя мать, не первые родыs=0, d=1 4) Одинокая мать, не первые родыs=1, d=1 Эталонная категория – первая. Результат исследования данных (США):
9 Фиктивные переменные для коэффициента наклона Пример 4. Исследуется зависимость веса новорожденного от интенсивности курения матери и фиктивной переменной числа родов в прошлом. Рассмотрим две модели: а) воздействие курения матери на вес новорожденного не зависит от номера родов; б) воздействие курения матери на вес новорожденного зависит от того, рожала раньше или нет d=0 d=1
10 Взаимодействие между фиктивными переменными Вернемся к примеру 3. Введем фиктивную переменную взаимодействия (sd), которую определим как произведение s и d. (sd)=1 для одиноких матерей, рожавших ранее (sd)=0 в остальных случаях Модель или Результат с.о.(18)(28)(52)(115)(2,1)
11 Тест Чоу Пусть имеется выборка, состоящая из двух подвыборок. Вопрос: следует ли их объединить для оценивания общей регрессии P или оценить отдельные регрессии A и B? Обозначим: U A – сумма квадратов остатков выборки A U B – сумма квадратов остатков выборки B U P – сумма квадратов остатков объединенной выборки F-статистика: Вывод: если F>F табл - не следует оценивать объединенную выборку Что делать? Ввести фиктивные переменные, позволяющие не задавать заранее какой-либо коэффициент одинаковым для обеих подвыборок.
Еще похожие презентации в нашем архиве:
© 2025 MyShared Inc.
All rights reserved.
Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемvvsu.ru
1 Фиктивные переменные
2 Опр. Фиктивная переменная – сконструированная количественная переменная, описывающая качественные факторы Примеры качественных факторов: –пол –профессия –образование –климатические условия –принадлежность к какой-либо группе Возможные пути учета качественного фактора: –оценивание отдельных регрессий для каждой категории с последующим выяснением значимо ли отличаются коэффициенты; –оценивание единой регрессии с введенной фиктивной переменной и измерением степени влияния качественного фактора.
3 Пример 1. Анализ зависимости урожайности пшеницы от вида вспашки и количества внесенного органического удобрения Пусть y – урожайность пшеницы, x – количество внесенного удобрения, z – вид вспашки. z=1 – для зяблевой вспашки, z=0 – для весенней вспашки. 1)Результаты регрессионного анализа без учета вида вспашки F=8,7 t a =11,9 t b =2,95r xy =0,5246 Вывод: уравнение регрессии статистически значимо.
4 2) Результаты регрессионного анализа по отдельным видам вспашки 3) Результаты регрессионного анализа с учетом вида вспашки путем введения фиктивной переменной z F=15,6 R=0,766 t a =11,8 t b =3,9 t d =4,1 r xz =-0,016
5 Общий случай Пусть качественный фактор имеет число градаций больше двух: –тогда в модель вводим несколько фиктивных переменных, число которых меньше числа качественных градаций; –одна из градаций выбирается как эталонная (для нее значения фиктивных переменных равны 0) и определяются значения фиктивных переменных для всех остальных градаций. Пример 2. Анализ зависимости цены двухкомнатной квартиры от полезной площади с учетом качества (типа) дома. Тип дома: «хрущевка», панельный, кирпичный. Решение. Введем две фиктивные переменные: z 1 и z 2. Эталонная категория – «хрущевка».
6 Замечание 1: параметры при фиктивных переменных представляют собой разность между средними уровнями результативного признака для соответствующей группы и эталонной группы. Замечание 2: целью включения фиктивной переменной может быть желание отразить в модели неоднородность данных. Замечание 3: рассмотренный метод фиктивной переменной предполагает равенство коэффициентов регрессии при x по частным совокупностям и возможность их замены общим коэффициентом регрессии.
7 Множественные совокупности фиктивных переменных Если имеются данные, собранные как по ряду количественных факторов, так и по ряду качественных факторов, то в уравнение регрессии включаются более одной совокупности фиктивных переменных. Пример 3. Исследуется зависимость веса новорожденного от интенсивности курения матери с учетом семейного положения и рожала ли ранее или нет. y - вес новорожденного x - количество сигарет, выкуриваемых в день будущей матерью d - рожала ли в прошлом s - семейное положение
8 1) Замужняя мать, первые родыs=0, d=0 2) Одинокая мать, первые родыs=1, d=0 3) Замужняя мать, не первые родыs=0, d=1 4) Одинокая мать, не первые родыs=1, d=1 Эталонная категория – первая. Результат исследования данных (США):
9 Фиктивные переменные для коэффициента наклона Пример 4. Исследуется зависимость веса новорожденного от интенсивности курения матери и фиктивной переменной числа родов в прошлом. Рассмотрим две модели: а) воздействие курения матери на вес новорожденного не зависит от номера родов; б) воздействие курения матери на вес новорожденного зависит от того, рожала раньше или нет d=0 d=1
10 Взаимодействие между фиктивными переменными Вернемся к примеру 3. Введем фиктивную переменную взаимодействия (sd), которую определим как произведение s и d. (sd)=1 для одиноких матерей, рожавших ранее (sd)=0 в остальных случаях Модель или Результат с.о.(18)(28)(52)(115)(2,1)
11 Тест Чоу Пусть имеется выборка, состоящая из двух подвыборок. Вопрос: следует ли их объединить для оценивания общей регрессии P или оценить отдельные регрессии A и B? Обозначим: U A – сумма квадратов остатков выборки A U B – сумма квадратов остатков выборки B U P – сумма квадратов остатков объединенной выборки F-статистика: Вывод: если F>F табл - не следует оценивать объединенную выборку Что делать? Ввести фиктивные переменные, позволяющие не задавать заранее какой-либо коэффициент одинаковым для обеих подвыборок.
Еще похожие презентации в нашем архиве:
© 2025 MyShared Inc.
All rights reserved.