ЭКОНОМЕТРИЧЕСКИЙ АНАЛИЗ ПАНЕЛЬНЫХ ДАННЫХ (36 ЧАСОВ ) д. э. н. Е. А. Коломак.

Презентация:



Advertisements
Похожие презентации
Модели и методы прикладного экономического анализа. Часть I. Лекция 2. Модели и методы пространственной эконометрики.
Advertisements

Лекция 8 Регрессионный анализ временных рядов. Временные ряды Проблема для составления выборки – автокорреляция данных Нарушено условие о независимости.
В задачу регрессионного анализа входит исследование остаточных величин. Исследование остаточных величин.
Модели и методы прикладного экономического анализа. Часть I: Анализ пространственных аспектов экономического развития Коломак Евгения Анатольевна д.э.н.,
Модели и методы прикладного анализа территориальных систем. Коломак Евгения Анатольевна д.э.н., профессор.
Количественные характеристики случайных переменных Математическое ожидание (среднее значение) Математическое ожидание (среднее значение) Дисперсия и среднее.
Кандидат технических наук, доцент Поляков Константин Львович Учебный курс Эконометрика: идентификация, оценивание и анализ статических моделей Лекция 10.
Автокорреляция. Временные ряды Зависимость наблюдений во времени Зависимость ошибок во времени Ковариационная матрица Авторегрессионный процесс первого.
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
КЛАССИЧЕСКИЙ РЕГРЕССИОННЫЙ АНАЛИЗ. ОБЩАЯ ЛИНЕЙНАЯ МОДЕЛЬ.
Парная линейная корреляция. Метод наименьших квадратов Задача: найти оценки параметров a и b такие, что остаток в i-ом наблюдении (отклонение наблюдаемого.
Свойства коэффициентов регрессии и проверка гипотез.
Определение. Случайная величина имеет нормальное распределение вероятностей с параметрами и 2, если ее плотность распределения задается формулой:
МЕТОД КОЙКА Предположим,что для описаний некоторого процесса используется модель с бесконечным лагом вида: Предположим,что для описаний некоторого процесса.
Уравнение множественной регрессии y t = a 0 +a 1 x 1t +a 2 x 2t +a 3 x 3t +…+a k x kt +U t (8.1) Наилучшая линейная процедура получения оценок параметров.
Количественные методы в менеджменте. Лекция 2, Тема 3. Панельные данные.
ВОПРОСЫ Решение каких проблем включает эконометрическое исследование. Укажите этапы эконометрического исследования. Что представляет собой простая регрессия.
Кандидат технических наук, доцент Поляков Константин Львович Учебный курс Эконометрика: идентификация, оценивание и анализ статических моделей Лекция 8.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Случайные и систематические погрешности при измерениях и расчетах.
Транксрипт:

ЭКОНОМЕТРИЧЕСКИЙ АНАЛИЗ ПАНЕЛЬНЫХ ДАННЫХ (36 ЧАСОВ ) д. э. н. Е. А. Коломак

Программа курса Введение Однонаправленная панельная модель Двунаправленная панельная модель Тестирование гипотез для панельных данных Несбалансированные панели Модель с гетероскедастичностью Модель с серийной автокорреляцией Динамическая панельная регрессия Векторная авторегрессия панельных данных Бинарные зависимые переменные в панельных данных

1.1. Метод наименьших квадратов 1.2. Тестирование гипотез 1. Обзор линейной регрессии

1.1. Метод наименьших квадратов i =1,..,n – индекс наблюдения y i – наблюдения над зависимой переменной, x i – вектор наблюдений над независимыми переменными β - вектор коэффициентов регрессии, e i – ошибка регрессии, x i T – транспонированный вектор наблюдений над независимыми переменными.

1.1. Метод наименьших квадратов В матричном виде : где x i1 =1 для i=1,…,n, в этом случае β 1 является константой

1.1. Метод наименьших квадратов Метод наименьших квадратов (Ordinary Least Squares - OLS) Оценки метода наименьших квадратов являются несмещенными линейными оценками с минимальной дисперсией, если верны следующие предположения о стохастической структуре модели : E(e i )=0 E(e i 2 )= σ 2 E(e i e j )=0 для всех ij rk X=k

1.1. Метод наименьших квадратов Ковариационная матрица Оценка дисперсии ошибок σ 2 : Стандартная ошибка коэффициента регрессии Коэффициент детерминации RSS – сумма квадратов ошибки регрессии, TSS – сумма квадратов центрированных значений зависимой переменной

1.1. Метод наименьших квадратов Если в модели линейной регрессии нарушены предположения, что E(e i 2 )= σ 2 и E(e i e j )=0 для всех ij, то наиболее эффективной в классе линейных несмещенных оценок является оценка обобщенного метода наименьших квадратов (Generalized Least Squares – GLS). Где Ω – ковариационная матрица ошибок регрессии. Ковариационная матрица оценки :

1.1. Метод наименьших квадратов Доступный обобщенный метод наименьших квадратов (Feasible Generalized Least Squares - FGLS). На первом этапе методом наименьших квадратов получают состоятельные оценки ошибок и оценку ковариационной матрицы Ω, На втором этапе получают оценки регрессионной модели.

1.2. Тестирование гипотез Существует два подхода к тестированию гипотез : точный и асимптотический. Точный подход основан на предположении о нормальности распределения ошибок регрессии. Асимптотический подход опирается на следствия центральной предельной теоремы.

1.2. Тестирование гипотез. Точный подход : e i ~N(0, σ 2 ) 1. Линейная гипотеза относительно коэффициентов : где R – матрица размерности qxk, а r – вектор размерности qx1. Пример : Статистика для проверки гипотез ~ F q,n-k или ~ F q,n-k

1.2. Тестирование гипотез. Точный подход : e i ~N(0, σ 2 ) Наиболее часто тестируемые гипотезы : 1. Проверка на значимость регрессионной модели в целом 2. Проверка гипотезы о значении отдельного коэффициента

1.2. Тестирование гипотез. Асимптотический подход : В этом случае 1. Линейная гипотеза относительно коэффициентов : 2. Гипотеза о значении коэффициента регрессии

2.1. Структура панельных данных 2.2. Преимущества панельных данных 2.3. Линейная модель панельных данных 2. Панельные данные

2.1. Структура панельных данных Панельные данные представляют собой наблюдения над однородными объектами в течение определенного периода времени, таким образом, панельные данные объединяют кросс - секции и временные ряды. Пусть i=1,…,n – индекс объекта, t=1,…,T – индекс момента времени, тогда y it – наблюдения над зависимой переменной, x it – вектор наблюдений над независимыми переменными. Если для всех объектов имеются наблюдения в каждый момент времени, тогда панель считается сбалансированной, общее количество наблюдений равно n*T. Если для некоторых i или t наблюдения отсутствуют, то панель считается несбалансированной. Если в различные моменты времени наблюдаются различные объекты, то в этом случае имеем дело с псевдо панелью.

2.1. Структура панельных данных Примеры регрессий с панельными данными. W it – заработная плата объекта i в момент времени t, Edu it – образование объекта i в момент времени t, Exp it – опыт работы объекта i в момент времени t, Hours it – количество отработанных часов объекта i в момент времени t. Оценивается влияние образования, опыта работы и отработанного времени на заработную плату. I it – инвестиционные вложения на предприятии i в момент времени t, F it – рыночная стоимость предприятия i в момент времени t, С it – основные фонды предприятия i в момент времени t. Оценивается влияние рыночной стоимости и накопленных основных фондов на инвестиции.

2.2. Преимущества панельных данных 1. Большее количество наблюдений увеличивает число степеней свободы, уменьшает коллинеарность независимых переменных и позволяет получить более эффективные оценки. 2. Возможность контролировать неоднородность объектов в выборке. 3. Позволяют тестировать эффекты, которые невозможно идентифицировать в кросс - секциях и во временных рядах. Примеры - исследование рынка труда женщин ; - влияние членства в профсоюзе на заработную плату.

2.2. Преимущества панельных данных 4. В случае временных рядов возникает проблема оценки динамических коэффициентов, например при оценки модели распределенного лага 5. Панельные данные позволяют снизить остроту проблемы отсутствующих и ненаблюдаемых переменных Если z it =z i для всех t=1,…,T. Если z it =z t для всех i=1,…,n

2.3. Линейная модель панельных данных Линейная панельная модель i – индекс объекта, t – индекс момента времени, β – вектор коэффициентов регрессии, x it T – транспонированный вектор наблюдений над k независимыми переменными. Однонаправленная модель ошибки : μ i – ненаблюдаемые индивидуальные эффекты, υ it – остаточные идиосинкразические компоненты. Двунаправленная модель ошибки : λ i – ненаблюдаемые временные эффекты.

2.3. Линейная модель панельных данных Предполагается, что μ i, λ i и υ it являются независимыми одинаково распределенными величинами с нулевой средней и постоянной дисперсией σ μ 2, σ λ 2 и σ υ 2 соответственно. Индивидуальные и временные эффекты могут трактоваться как фиксированные или как случайные. В первом случае оценивается модель с фиксированными эффектами, во втором случае оценивается модель со случайными эффектами.