Определение. Случайная величина имеет нормальное распределение вероятностей с параметрами и 2, если ее плотность распределения задается формулой:
Определение. Пусть (где натуральные числа) обозначают независимые случайные величины, каждая из которых распределена по стандартному нормальному закону
Если величина стандартизирована Тогда переход к стандартному нормальному закону распределения – N (0, 2 ). Проверка нормальности распределения – основа критерий хи-квадрат
2 Статистическая независимость и выявление тренда 2.1 Критерий серий Если то (+), если то (-) Определение. С ерией называют последовательность наблюдений перед и после которой следуют наблюдения противоположного типа. N=20, r=12. (*) (**)
2.2. Критерий инверсий Пусть есть 8 наблюдений: x1=5, x2=3, x3=8, x4=9, x5=4, x6=1, x7=7, x8=5. A1 = 3, A2 = 1, A3 = 4, A4 = 4, A5 = 1, A6 = 0, A7 = 1. 1, x i > x j h ij = 0, x i x j, - мат. ожидание
2.3 Проверка стационарности случайного процесса. 1.Реализация x(t) разделяется на N равных интервалов. 2.Вычисляются оценки среднего квадрата для каждого интервала. Эти оценки располагают в порядке возрастания номера интервала: 3. Эта последовательность проверяется на наличие тренда с помощью критерия серий или критерия инверсий
МЕТОДЫ МНОГОМЕРНОГО РАЗВЕДОЧНОГО АНАЛИЗА ДАННЫХ - пошаговая линейная и нелинейная регрессия - факторный анализ - кластерный анализ -анализ дискриминантных функций - многомерное шкалирование - логлинейный анализ - канонические корреляции -анализ соответствий - анализ временных рядов -деревья классификации -нейронные сети
3 РЕГРЕССИОННЫЙ АНАЛИЗ 3.1 Простая линейная регрессия ИДЕЯ Х1Y Модель линейного перехода 1 шаг. Диаграмма рассеивания 2 шаг Расчет коэффициента парной корреляции
Предполагается модель (1) Рассчитывается модель вида Базовый метод расчета коэффициентов модели - МНК Пусть мы имеем n наблюдений величин х и y
x y MIN
(*) (**) нормальное уравнение
3.2 Исследование полученной модели 1.Проверка адекватности полученной модели 2. Проверка корректности применения метода МНК 3. Исследование точности прогнозирования по модели Проверка адекватности полученной модели ПОЛУЧИЛИ МОДЕЛЬ Определение. Под адекватностью модели простой линейной регрессии понимается, что никакая другая модель не дает значительного улучшения в предсказании Y.
ОСТАТКИ 1) ПРОВЕРКА ОСТАТКОВ Номер опыта y i – результаты наблюдений - расчетные значения 1 2 ………… n
2) ПОСТРОЕНИЕ ДИСПЕРСИОННОЙ ТАБЛИЦЫ Источник дисперсии Сумма квадратовСтеп. Своб. Средние квадраты Регрессия Отклонение от регрессии R =n-2 Полная D =1 T =n-1
F-отношение ПРОВЕРЯЕТСЯ ГИПОТЕЗА H 0 : 1 =0 ПРОТИВ H1: 1 0 ЛИНЕЙНАЯ РЕГРЕССИЯ ОТСУТСТВУЕТ ЛИНЕЙНАЯ РЕГРЕССИЯ Если, то гипотеза H 0 отвергается.
3) Расчет коэффициента детерминации 4) Расчет доверительных интервалов для коэффициентов модели дисперсия коэффициента b 1 :
Доверительный интервал для b 1 Доверительный интервал для b 0
Доверительный интервал для предсказываемой переменной
Случай 1. Проверяется модель. Нет неадекватности. Линейная регрессия значима. Случай 2. Проверяется та же модель. Линейная регрессия незначима. Используется Случай 3. Проверяется та же модель. Нет неадекватности. Линейная регрессия незначима. Используется модель