Лекция 2 Часть I: Многомерное нормальное распределение, его свойства; условные распределения Часть II: Парная линейная регрессия, основные положения.

Презентация:



Advertisements
Похожие презентации
Лекция 2.1 Линейная регрессионная модель для случая одной объясняющей переменной. Метод наименьших квадратов (МНК)
Advertisements

МЕТОД НАИМЕНЬШИХ КВАДРАТОВ. СТАТИСТИЧЕСКАЯ ОЦЕНКА.
Метод наименьших квадратов В математической статистике методы получения наилучшего приближения к исходным данным в виде аппроксимирующей функции получили.
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Регрессионный анализ. Основная особенность регрессионного анализа: при его помощи можно получить конкретные сведения о том, какую форму и характер имеет.
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Метод наименьших квадратов УиА 15/2 Айтуар А.. В математической статистике методы получения наилучшего приближения к исходным данным в виде аппроксимирующей.
Общая теория статистики Регрессионно- корреляционный анализ.
Коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора.
ПАРНАЯ РЕГРЕССИЯ. Экономические данные - количественные характеристики каких- либо экономических объектов или процессов. Экономические данные (фактор.
В задачу регрессионного анализа входит исследование остаточных величин. Исследование остаточных величин.
ЛЕКЦИЯ 8 КОРРЕЛЯЦИОННО- РЕГРЕССИОННЫЙ АНАЛИЗ. МОДЕЛИРОВАНИЕ СВЯЗЕЙ.
Парная линейная корреляция. Метод наименьших квадратов Задача: найти оценки параметров a и b такие, что остаток в i-ом наблюдении (отклонение наблюдаемого.
Лекция 1 «Введение». Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов. Специфической.
Основные понятия регрессионного анализа. Регрессионный анализ –метод математической статистики, позволяющий в эконометрике изучать зависимость одной экономической.
Основы корреляционного и регрессионного анализа. План лекции: 1.Способы изучения корреляционных зависимостей. 2.Определение коэффициента парной линейной.
Элементы теории корреляции. План: I. Понятие корреляционной зависимости: 1) Коэффициент корелляции 2) Проверка гипотезы о значимости выборочного коэффициента.
P4P4 X X1X1 X2X2 X3X3 X4X4 Разница между действительным и оцененным значением Y называется остатком. P3P3 P2P2 P1P1 R1R1 R2R2 R3R3 R4R4 ( остаток ) e1e1.
Тема 2. Регрессионный анализ : постановка задачи и идентификация линейной модели 1.1. Вспомогательные сведения 1.2. Постановка задачи регрессионного анализа.
Анализ данных Лекция 5 Методы построения математических функций.
Транксрипт:

Лекция 2 Часть I: Многомерное нормальное распределение, его свойства; условные распределения Часть II: Парная линейная регрессия, основные положения

Одномерное нормальное распределение При рассмотрении различных моделей статистического анализа часто предполагается нормальное распределение всех (или нескольких) признаков генеральной совокупности. Постулируется, что значения исследуемой случайной величины формируются под воздействием очень большого числа независимых случайных факторов, причем сила воздействия каждого отдельного фактора мала и не может превалировать среди остальных, а характер воздействия – аддитивный.

Функция плотности нормального распределения в одномерном случае имеет вид

Плотность вероятности двумерного нормального вектора

Для двумерного нормального распределения условные распределения имеют характеристики

Функция плотности многомерного нормального распределения

Если матрица ковариаций V – вырожденная, т.е. определитель этой матрицы равен нулю, то соответствующее многомерное нормальное распределение является вырожденным (несобственным). Это означает, что разброс значений исследуемой многомерной величины сосредоточен в пространстве меньшей, чем n, размерности.

Линейная регрессионная модель для случая одной объясняющей переменной. Метод наименьших квадратов (МНК) Решение задач, связанных с построением зависимостей между двумя переменными X и Y X – независимая, объясняющая, экзогенная переменная, регрессор Y- зависимая, объясняемая, эндогенная переменная На практике мы имеем дело с реальными парами наблюдений (X i, Y i ), i = 1,…,n

Регрессии: 1)линейные (описываются уравнением прямой на плоскости) 2)нелинейные: по оцениваемым параметрам (например, степенная, показательная, экспоненциальная функции); относительно объясняемых переменных (например, полиномы разных (как правило, невысоких) степеней, гипербола) Некоторые нелинейные модели могут быть преобразованы в линейные путем линеаризующих преобразований

Определение парной регрессии: E(Y|X = Xi) = f(Xi), i = 1,…,n Уравнение теоретической регрессии: Yi = f(Xi) + ui, i = 1,…,n В этом уравнении выделена детерминированная (т.е. обусловленная) экзогенной переменной часть f(Xi), а также случайная составляющая или возмущение ui

Причины появления возмущения В модели учтены не все переменные (факторы), оказывающие влияние на Y; Неверная спецификация модели (неправильный выбор уравнения регрессии); Выборочный характер данных; Особенности в измерении переменных (ошибки наблюдений); Неопределенность в поведении экономических агентов

Предположим, что переменная Y является линейной функцией переменной X с неизвестными параметрами, оценки которых b1 и b2, мы хотим оценить. Специфицируем модель следующим образом:, где u – возмущение. По n парам наблюдений мы должны построить оценки параметров β1 и β2 (соответственно b1 и b2).

Модель, построенная по данным n пар наблюдений: Эта модель фактически является аппроксимацией теоретической линии регрессии:

В случае, если бы все расчетные значения совпадали с данными наблюдений, остатки были бы равны нулю. На практике оцененные значения не совпадают с реальными. Следовательно, встает задача наилучшего выбора теоретической прямой: так, чтобы минимизировать отклонения теоретически рассчитанных «игреков» от наблюдаемых. Обратите внимание: остатки и возмущения – это не одно и то же! Они имеют разную природу! В качестве меры отклонения расчетных значений от набора наблюдений можно взять : сумму квадратов отклонений; сумму модулей отклонений; иные функционалы (обзор в основной литературе).

К вопросу нахождения оценок параметров XXnXn X1X1 Y b1b1 b2b2