ЭКОНОМЕТРИЧЕСКИЙ АНАЛИЗ ПАНЕЛЬНЫХ ДАННЫХ (36 ЧАСОВ ) д. э. н. Е. А. Коломак
Программа курса Введение Однонаправленная панельная модель Двунаправленная панельная модель Тестирование гипотез для панельных данных Несбалансированные панели Модель с гетероскедастичностью Модель с серийной автокорреляцией Динамическая панельная регрессия Векторная авторегрессия панельных данных Бинарные зависимые переменные в панельных данных
1.1. Метод наименьших квадратов 1.2. Тестирование гипотез 1. Обзор линейной регрессии
1.1. Метод наименьших квадратов i =1,..,n – индекс наблюдения y i – наблюдения над зависимой переменной, x i – вектор наблюдений над независимыми переменными β - вектор коэффициентов регрессии, e i – ошибка регрессии, x i T – транспонированный вектор наблюдений над независимыми переменными.
1.1. Метод наименьших квадратов В матричном виде : где x i1 =1 для i=1,…,n, в этом случае β 1 является константой
1.1. Метод наименьших квадратов Метод наименьших квадратов (Ordinary Least Squares - OLS) Оценки метода наименьших квадратов являются несмещенными линейными оценками с минимальной дисперсией, если верны следующие предположения о стохастической структуре модели : E(e i )=0 E(e i 2 )= σ 2 E(e i e j )=0 для всех ij rk X=k
1.1. Метод наименьших квадратов Ковариационная матрица Оценка дисперсии ошибок σ 2 : Стандартная ошибка коэффициента регрессии Коэффициент детерминации RSS – сумма квадратов ошибки регрессии, TSS – сумма квадратов центрированных значений зависимой переменной
1.1. Метод наименьших квадратов Если в модели линейной регрессии нарушены предположения, что E(e i 2 )= σ 2 и E(e i e j )=0 для всех ij, то наиболее эффективной в классе линейных несмещенных оценок является оценка обобщенного метода наименьших квадратов (Generalized Least Squares – GLS). Где Ω – ковариационная матрица ошибок регрессии. Ковариационная матрица оценки :
1.1. Метод наименьших квадратов Доступный обобщенный метод наименьших квадратов (Feasible Generalized Least Squares - FGLS). На первом этапе методом наименьших квадратов получают состоятельные оценки ошибок и оценку ковариационной матрицы Ω, На втором этапе получают оценки регрессионной модели.
1.2. Тестирование гипотез Существует два подхода к тестированию гипотез : точный и асимптотический. Точный подход основан на предположении о нормальности распределения ошибок регрессии. Асимптотический подход опирается на следствия центральной предельной теоремы.
1.2. Тестирование гипотез. Точный подход : e i ~N(0, σ 2 ) 1. Линейная гипотеза относительно коэффициентов : где R – матрица размерности qxk, а r – вектор размерности qx1. Пример : Статистика для проверки гипотез ~ F q,n-k или ~ F q,n-k
1.2. Тестирование гипотез. Точный подход : e i ~N(0, σ 2 ) Наиболее часто тестируемые гипотезы : 1. Проверка на значимость регрессионной модели в целом 2. Проверка гипотезы о значении отдельного коэффициента
1.2. Тестирование гипотез. Асимптотический подход : В этом случае 1. Линейная гипотеза относительно коэффициентов : 2. Гипотеза о значении коэффициента регрессии
2.1. Структура панельных данных 2.2. Преимущества панельных данных 2.3. Линейная модель панельных данных 2. Панельные данные
2.1. Структура панельных данных Панельные данные представляют собой наблюдения над однородными объектами в течение определенного периода времени, таким образом, панельные данные объединяют кросс - секции и временные ряды. Пусть i=1,…,n – индекс объекта, t=1,…,T – индекс момента времени, тогда y it – наблюдения над зависимой переменной, x it – вектор наблюдений над независимыми переменными. Если для всех объектов имеются наблюдения в каждый момент времени, тогда панель считается сбалансированной, общее количество наблюдений равно n*T. Если для некоторых i или t наблюдения отсутствуют, то панель считается несбалансированной. Если в различные моменты времени наблюдаются различные объекты, то в этом случае имеем дело с псевдо панелью.
2.1. Структура панельных данных Примеры регрессий с панельными данными. W it – заработная плата объекта i в момент времени t, Edu it – образование объекта i в момент времени t, Exp it – опыт работы объекта i в момент времени t, Hours it – количество отработанных часов объекта i в момент времени t. Оценивается влияние образования, опыта работы и отработанного времени на заработную плату. I it – инвестиционные вложения на предприятии i в момент времени t, F it – рыночная стоимость предприятия i в момент времени t, С it – основные фонды предприятия i в момент времени t. Оценивается влияние рыночной стоимости и накопленных основных фондов на инвестиции.
2.2. Преимущества панельных данных 1. Большее количество наблюдений увеличивает число степеней свободы, уменьшает коллинеарность независимых переменных и позволяет получить более эффективные оценки. 2. Возможность контролировать неоднородность объектов в выборке. 3. Позволяют тестировать эффекты, которые невозможно идентифицировать в кросс - секциях и во временных рядах. Примеры - исследование рынка труда женщин ; - влияние членства в профсоюзе на заработную плату.
2.2. Преимущества панельных данных 4. В случае временных рядов возникает проблема оценки динамических коэффициентов, например при оценки модели распределенного лага 5. Панельные данные позволяют снизить остроту проблемы отсутствующих и ненаблюдаемых переменных Если z it =z i для всех t=1,…,T. Если z it =z t для всех i=1,…,n
2.3. Линейная модель панельных данных Линейная панельная модель i – индекс объекта, t – индекс момента времени, β – вектор коэффициентов регрессии, x it T – транспонированный вектор наблюдений над k независимыми переменными. Однонаправленная модель ошибки : μ i – ненаблюдаемые индивидуальные эффекты, υ it – остаточные идиосинкразические компоненты. Двунаправленная модель ошибки : λ i – ненаблюдаемые временные эффекты.
2.3. Линейная модель панельных данных Предполагается, что μ i, λ i и υ it являются независимыми одинаково распределенными величинами с нулевой средней и постоянной дисперсией σ μ 2, σ λ 2 и σ υ 2 соответственно. Индивидуальные и временные эффекты могут трактоваться как фиксированные или как случайные. В первом случае оценивается модель с фиксированными эффектами, во втором случае оценивается модель со случайными эффектами.