1. И снова о регрессионном анализе. 2. Классификация и кластерный анализ.

Презентация:



Advertisements
Похожие презентации
МЕТОД НАИМЕНЬШИХ КВАДРАТОВ. СТАТИСТИЧЕСКАЯ ОЦЕНКА.
Advertisements

Кандидат технических наук, доцент Поляков Константин Львович Учебный курс Эконометрика: идентификация, оценивание и анализ статических моделей Лекция 10.
Лекция 2 Часть I: Многомерное нормальное распределение, его свойства; условные распределения Часть II: Парная линейная регрессия, основные положения.
Проверка качества уравнения регрессии Лекция2 Цели лекции Выполнимость теоретических предпосылок Анализ расчетных статистических показателей качества Интерпретация.
В задачу регрессионного анализа входит исследование остаточных величин. Исследование остаточных величин.
Проверка статистических гипотез 1.Формулировка задачи. Термины и определения. 2.Схема проверки статистической гипотезы. 3.Мощность критерия. 4.Проверка.
Метод наименьших квадратов В математической статистике методы получения наилучшего приближения к исходным данным в виде аппроксимирующей функции получили.
Количественные характеристики случайных переменных Математическое ожидание (среднее значение) Математическое ожидание (среднее значение) Дисперсия и среднее.
Оценка неизвестных параметров распределений Точечное оценивание.
Оценка неизвестных параметров распределений Точечное оценивание.
Определение. Случайная величина имеет нормальное распределение вероятностей с параметрами и 2, если ее плотность распределения задается формулой:
Основы теории СЛУЧАЙНЫХ ПРОЦЕССОВ. Пространство элементарных событий (генеральная совокупность) 2 Основные понятия теории вероятностей Все сигналы и все.
Метод максимального правдоподобия ММП позволяет получить по крайней мере асимптотически несмещенные и эффективные оценки параметров распределения, которые.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Визуализация данных Визуализация данных Точечные оценки Точечные оценки Групповые характеристики Групповые характеристики Метод.
Метод наименьших квадратов УиА 15/2 Айтуар А.. В математической статистике методы получения наилучшего приближения к исходным данным в виде аппроксимирующей.
1 МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ ПЛАТА ASVABC S 1 ПЛАТА = S + 3 ASVABC + u Геометрическая интерпретация множественной регрессионной модели с.
КЛАССИЧЕСКИЙ РЕГРЕССИОННЫЙ АНАЛИЗ. ОБЩАЯ ЛИНЕЙНАЯ МОДЕЛЬ.
Выполнила: Паросова О. ГИП Гистограмма Закон (плотность) распределения случайной величины Нормальный закон распределения Функция Лапласа Основные.
Лекция 7 Уравнение множественной регрессии Теорема Гаусса-Маркова Автор: Костюнин Владимир Ильич, доцент кафедры: «Математическое моделирование экономических.
Свойства коэффициентов регрессии и проверка гипотез.
Транксрипт:

1. И снова о регрессионном анализе. 2. Классификация и кластерный анализ.

Регрессионный анализ

Предпосылки использования МНК (условия Гаусса – Маркова) 0 0. Регрессионная модель корректно специфицирована (нет лишних регрессоров) Случайное отклонение имеет нулевое математическое ожидание Дисперсия случайного члена постоянна Ошибки в разных наблюдениях независимы (некоррелированы) друг относительно друга Ошибки независимы (некоррелированы) с регрессорами Ошибки представляют собой слабый белый (гауссовский) шум.

Y = AX + 1.E( i ) = 0 во всех наблюдениях Естественное требование, означающее несмещенность в среднем «наблюдаемых» значений зависимой переменной относительно «теоретических» Условия Гаусса-Маркова

Дисперсия ошибки i одинакова во всех наблюдениях Нарушение – дисперсия ошибки i неодинакова в разных наблюдениях i Условия Гаусса-Маркова

Отсутствие автокорреляции - ошибки в разных наблюдениях не связаны между собой

Y = А Х + А – детерминированная переменная (известна абсолютно точно) Требование детерминированности регрессоров упрощает анализ, но зачастую не выполняется Условия Гаусса-Маркова

Y = АX + Нормальность ошибок: Ошибки имеют совместное многомерное нормальное распределение Условия Гаусса-Маркова

Оценки максимального правдоподобия Z(A 1,..., A N ; Y 1,..., Y N ; X) = k – плотность вероятности k-го измерения k (A k ; Y k ; Х) =

Функция правдоподобия L(A 1,..., A N ; Y 1,..., Y N ; X) = Z(A 1,..., A N ; Y 1,..., Y N ; X) = const* МНК!

Свойство 1. Несмещенность Свойство 2. Эффективность: оценка с минимальной дисперсией по сравнению с другими оценками Свойство 3. Состоятельность

К проблеме мультиколлинеарности

A

X = (A T A) -1 A T Y =

Интервальное оценивание параметров

X1X1 X2X2 X3X3 X4X4

Cor(X)

Проверка адекватности регрессионной модели

Классификация Сравнитель- ные размеры жука- носорога, взрослой мыши и мышонка

Классификация с обучением Принадлежит ли образец к данному классу или нет? КЛАССЫ ИЗВЕСТНЫ! Цели классификации: 1) уменьшить число ошибочно ОТКЛОНЕННЫХ образцов (ошибка первого рода), т.е. таких, которые ошибочно отнесены к не членам определенного класса; 2) уменьшить число образцов, ошибочно ОПРЕДЕЛЕННЫХ как принадлежащие определенному классу (ошибка второго рода).

Порог принадлежности к классу Чем выше порог, тем метод более требователен к отбору, и тем меньше образцов будут приписаны данному классу и наоборот. Порог снижается

Дискриминатный анализ

Как построить дискриминирующую функцию? Самый простой способ: найти опорные векторы (к сожалению, удается редко)