Лекция 6.1 Dummy (фиктивные) переменные
Пример использования dummy переменной при наличии двух категорий 1 COST – годовые издержки 74 средних школ в Шанхае в середине 1980-х годов, N – количество обучавшихся в них учеников.
Пример использования dummy переменной при наличии двух категорий 2 Затраты в профессиональных школах больше, т.к. для обучения там используется специальное оборудование.
Пример использования dummy переменной при наличии двух категорий 3 Если оценивать регрессии отдельно для профессиональных и обычных школ, то размеры выборок уменьшатся, что снизит точность оценивания.
OCC = 0 Обычные школыCOST = N + u OCC = 1 Профессиональные школы COST = 1 ' + 2 N + u Пример использования dummy переменной при наличии двух категорий 4 Предположим, что коэффициенты наклона в регрессиях для профессиональных и обычных школах, а свободные члены различаются. 1 1 '
Пример использования dummy переменной при наличии двух категорий 5 Мы предполагаем, что постоянные затраты для двух типов школ различаются, а предельные затраты у них одинаковы. OCC = 0 Обычные школы COST = N + u OCC = 1 Профессиональные школы COST = 1 ' + 2 N + u 1 1 '
Пример использования dummy переменной 6 Обозначим разность свободных членов: = 1 ' – 1. OCC = 0 Обычные школы COST = N + u OCC = 1 Профессиональные школы COST = 1 ' + 2 N + u 1 1 '
Пример использования dummy переменной 7 Тогда 1 ' = 1 + и мы можем переписать регрессию для профессиональных школ. 1 + OCC = 0 Обычные школыCOST = N + u OCC = 1 Профессиональные школы COST = N + u 1
Общее уравнениеCOST = 1 + OCC + 2 N + u OCC = 0 Обычные школыCOST = N + u OCC = 1 Профессиональные школыCOST = N + u Пример использования dummy переменной 8 Введем dummy- переменную OCC, которая равна 0 для обычных школ и 1 для профессиональных. Dummy- переменная всегда принимает только два значения, обычно 0 и
School TypeCOST N OCC 1Occupational345, Occupational 537, Regular 170, Occupational Regular100, Regular 28, Regular 160, Occupational 45, Occupational 120, Occupational61, Пример использования dummy переменной В приведенной таблице указаны данные лишь для 10 школ. В последней колонке сформирована dummy - переменная. 9
. reg COST N OCC Source | SS df MS Number of obs = F( 2, 71) = Model | e e+11 Prob > F = Residual | e e+09 R-squared = Adj R-squared = Total | e e+10 Root MSE = COST | Coef. Std. Err. t P>|t| [95% Conf. Interval] N | OCC | _cons | Пример использования dummy переменной В таблице приведены результаты оценивания регрессии COST на N и OCC. 1010
. reg COST N OCC Source | SS df MS Number of obs = F( 2, 71) = Model | e e+11 Prob > F = Residual | e e+09 R-squared = Adj R-squared = Total | e e+10 Root MSE = COST | Coef. Std. Err. t P>|t| [95% Conf. Interval] N | OCC | _cons | Пример использования dummy переменной Коэффициент при OCC значим, расходы на учеников в профессиональных школах на юаней больше. 11
. reg COST N OCC Source | SS df MS Number of obs = F( 2, 71) = Model | e e+11 Prob > F = Residual | e e+09 R-squared = Adj R-squared = Total | e e+10 Root MSE = COST | Coef. Std. Err. t P>|t| [95% Conf. Interval] N | OCC | _cons | Пример использования dummy переменной Коэффициент при N значим, каждый ученик увеличивает расходы школы на 331 юань. 12
. reg COST N OCC Source | SS df MS Number of obs = F( 2, 71) = Model | e e+11 Prob > F = Residual | e e+09 R-squared = Adj R-squared = Total | e e+10 Root MSE = COST | Coef. Std. Err. t P>|t| [95% Conf. Interval] N | OCC | _cons | Пример использования dummy переменной Свободный член является незначимым. 13