1 Тема 3 Верифікація моделі Кафера інформатики та компютерних технологій доцент Бесклінська О.П.

Презентация:



Advertisements
Похожие презентации
1 Тема 4 Класична лінійна багатофакторна модель. Кафера інформатики та компютерних технологій доцент Бесклінська О.П.
Advertisements

1 Тема 5 Мультиколінеарність Кафера інформатики та компютерних технологій доцент Бесклінська О.П.
1 Моделі парної регресії. 1. Моделі парної регресії та їх дослідження. 2. Метод найменших квадратів Кафера інформатики та компютерних технологій доцент.
1 Тема 6 ГЕТЕРОСКЕДАСТИЧНІСТЬ Кафера інформатики та компютерних технологій доцент Бесклінська О.П.
1 АНАЛІЗ ВАРІАЦІЙНИХ РЯДІВ ЛЕКЦІЯ 7. 2 ПЛАН Предмет математичної статистики. Генеральна сукупність та вибірка. Оцінки параметрів генеральної сукупності.
Лекція 7 Кафера інформатики та компютерних технологій доцент Бесклінська О.П. Автокореляція.
Основи кореляційного аналізу Інформатика 10 клас Фролов М.А. Новоолександрівська СЗОШ Єланецький р-н Миколаївська обл.
1 ЕКОНОМЕТРИКА ТЕМА 3. ЗАГАЛЬНА ЛІНІЙНА ЕКОНОМЕТРИЧНА МОДЕЛЬ © доц. Лебідь О.Ю., навч. рік.
Нормальний закон розподілу Підготували студенти 2 курсу 7 групи економічного факультету: Федорчук Юля Снопко Ілона Мельніченко Таміла Віріч Оксана Москаленко.
Функція. Область визначення і область значень функції. 7 клас.
Мета уроку : повторити вивчений матеріал по темі «Функція»; вивчити поняття області визначення та області значень функції;навчитися шукати область визначення.
Презентація на тему: Страхові ризики та їх оцінка.
1 ЕКОНОМЕТРИКА ТЕМА 2. МОДЕЛІ ПАРНОЇ РЕГРЕСІЇ ТА ЇХ ДОСЛІДЖЕННЯ © доц. Лебідь О.Ю., навч. рік.
Тема: Функція. 1. Поняття функції. 2. Способи задання функцій. 3. Класифікація елементарних функцій. 4. Монотонні функції. 5. Парні та непарні функції.
Інтерактивний Тренажер «Лінійні рівняння»». Автори учитель математики Кліщова Ольга Володимирівна, учитель інформатики Островий Сергій Григорович Хмільнянський.
Лекція 2 з дисципліни Медична інформатика для студентів ІІ курсу медичних факультетів.
Числовим виразом називається запис, складений із чисел, знаків арифметичних дій і дужок. Числовий вираз має лише одне значення. Порядок операцій у числовому.
Функція. Область визначення і область значення функції.
Виконав студент групи ІУСТ-31: Залужний Максим. МАІ - це математичний інструмент, що використовується для аналізу й вирішення складних проблем. МАІ дозволяє.
Транксрипт:

1 Тема 3 Верифікація моделі Кафера інформатики та компютерних технологій доцент Бесклінська О.П.

2 Зміст 1.Показники якості моделі 2. Перевірка значущості та довірчі інтервали

3 Постановка задачі Постановка задачі Формування вихідної інформації Формування вихідної інформації Аналіз залишків Аналіз залишків Прогноз на основі моделі Прогноз на основі моделі Специфікація моделі Специфікація моделі Оцінка параметрів моделі Оцінка параметрів моделі Верифікація моделі Верифікація моделі Етапи побудови моделі

4 1. Показники якості моделі Верифікація моделістатистична перевірка на адекватність моделі, тобто наскільки добре розвязано проблему специфікації моделі, наскільки добрі оцінки імітаційних та прогнозних розрахунків.

5 Для перевірки коректності побудови моделі визначають: стандартну похибку рівняння; коефіцієнт детермінації; коефіцієнт множинної кореляції; стандартну похибку параметрів.

6 Стандартна похибка рівняння (точкова оцінка емпіричної дисперсії залишків)- характеризує абсолютну величину розкиду випадкової складової рівняння

7 Поправка на число ступенів свободи дає незміщену оцінку дисперсії залишків:

8 У поняття "тіснота зв'язку" (щільність) вкладається оцінка впливу незалежної змінної на залежну змінну. Під терміном "значимість зв'язку" (істотність, або значущість) розуміють оцінку відхилення вибіркових змінних від своїх значень у генеральній сукупності спостережень за допомогою статистичних критеріїв.

9 Коефіцієнт детермінації показує, якою мірою варіація залежної змінної (результативного показника) у визначається варіацією незалежної змінної (вхідного показника) х. де

10 Інші формули: де - розрахункові значення регресанда; -загальна середня фактичних даних результативного показника; -фактичні індивідуальні значення результативного показника.

11 квадрат емпіричного коефіцієнта кореляції між двома рядами спостережень (теоретичними значеннями регресанта та його розрахунковими значеннями ).

12 Коефіцієнт кореляції, або індекс кореляції, показує, наскільки значним є вплив змінної х i, на y i і розраховується так:

13 Іноді для спрощення розрахунків тісноту кореляційного зв'язку характеризують коефіцієнтом кореляції, який розраховується за формулою:

14 Якщо зв'язок між результативним і вхідним показниками лінійний, то використовується лінійний коефіцієнт кореляції, який характеризує не тільки тісноту зв'язку, а і його напрям:

15 2. Перевірка значущості та довірчі інтервали.

16 Зауваження. У задачах регресійного аналізу важливе значення має припущення про нормальний розподіл випадкових величин, що задіяні в даній моделі. Певні перетворення нормально розподілених величин забезпечують їх розподіл за законом Стьюдента чи за законом Фішера: на підставі першого з них визначаються довірчі інтервали, а другий дає змогу оцінювати відношення двох випадкових величин.

17 Стосовно кожного статистичного результату висувається так звана нульова гіпотеза (про рівність нулю деякої випадкової величини) і альтернативна до неї гіпотеза (про її суттєву відмінність від нуля). У нульовій гіпотезі формулюють результат, який бажано відхилити, а в альтернативній, яка інакше називається експериментальною, той, що його необхідно підтвердити.

18 За заданим рівнем значущості множина допустимих значень розбивається на дві неперетинні множини: одна містить значення випадкової величини, ймовірність досягнення яких перевищує заданий рівень значущості, а інша критична область визначає ті значення, що досягаються рідко (ймовірність потрапити до такої області нижча від заданого рівня), і розташована вона, як правило, на "хвостах розподілу".

19 При перевірці гіпотез може бути допущена помилка, наприклад може бути відхилена нульова гіпотеза, хоча насправді вона правильна (помилка першого роду), або ж, навпаки, нульова гіпотеза може бути прийнята, хоча вона неправильна (помилка другого роду).

20 R2R2 R2R2 R2R2 R2R ? застосувати відповідний статистичний критерій, який дасть змогу встановити, чи суттєво відрізняється R 2 від нуля, чи ця відмінність пов'язана з особливостями конкретних даних, тобто зумовлена лише похибками вимірювань. застосувати відповідний статистичний критерій, який дасть змогу встановити, чи суттєво відрізняється R 2 від нуля, чи ця відмінність пов'язана з особливостями конкретних даних, тобто зумовлена лише похибками вимірювань.

21 Висувається нульова гіпотеза Н 0 : R 2 = О. Це означає, що досліджуване рівняння не пояснює змінювання регресанда під впливом відповідних регресорів. У такому разі всі коефіцієнти при незалежних змінних мають дорівнювати нулю. При цьому нульову гіпотезу можна подати у вигляді Н 0 :а 1 =а 2 =... = а n = 0.

22 Альтернативною до неї є Н 1 : значення хоча б одного параметра моделі відмінне від нуля, тобто хоча б один із факторів впливає на змінювання залежної змінної.

23 Для перевірки цих гіпотез застосовують F- критерій Фішера з n-m-1 ступенями свободи. яке порівнюють з табличним значенням розподілу Фішера при заданому рівні значущості α. (Як правило, α = 0,05 або α = 0,01).

24 Якщо F табл < F експ нульова гіпотеза відхиляється, тобто існує такий коефіцієнт у регресійному рівнянні, який суттєво відрізняється від нуля, а відповідний фактор впливає на досліджувану змінну. нульова гіпотеза відхиляється, тобто існує такий коефіцієнт у регресійному рівнянні, який суттєво відрізняється від нуля, а відповідний фактор впливає на досліджувану змінну.

25 У випадку парної регресії цей критерій розраховується за формулою:

26 Коефіцієнт кореляції, як вибіркова характеристика, перевіряється на значущість за допомогою t-критерію Стьюдента. Фактичне значення t статистики обчислюється за формулою

27 t експ порівнюється з табличним значенням t- розподілу з п – т – 1 ступенями свободи, та при заданому рівні значущості α/2 Якщо можна зробити висновок, що коефіцієнт кореляції достовірний (значущий), а зв'язок між залежною змінною та всіма незалежними факторами суттєвий.

28 Можна визначити стандартні похибки оцінок параметрів моделі з урахуванням дисперсії залишків: де - дисперсія залишків, обчислюється за формулою:

29 c jj –відповідний діагональний елемент матриці похибок С (матриця, обернена до матриці коефіцієнтів системи нормальних рівнянь)

30 Статистичну значущість кожного параметра моделі можна перевірити за допомогою t-критерію. При цьому нульова гіпотеза буде: Н 0 : a j =0, альтернативна H 1 : a j 0 Експериментальне значення t-статистики для кожного параметра моделі обчислюється за формулою:

31 Довірчі інтервали для кожного параметра a j обчислюються на основі його стандартної похибки та критерію Стьюдента: Табличне значення t табл., як і раніше, має n- m-1 ступенів свободи і рівень значущості α/2

32 Завдання: Зробити аналіз залежності обсягу споживання y (у.о.) домогосподарства від наявного прибутку x (у.о.) за вибіркою обсягом n=12, результати якої наведено у таблиці. Визначити вид залежності, оцінити параметри рівняння регресії, оцінити силу лінійної залежності між x та y.

Обсяг спожива- ння ( y у.о.) Наявний прибуток ( x у.о.)

34 y=3,423+0,936 х

35 коефіцієнт кореляції R=0, Коефіцієнт детермінації. Значення критерію Фішера Значення критерію Стьюдента

36 Завдання : За 10 парами спостережень отримано такі результати: За МНК оцініть коефіцієнти рівняння регресії Y на X. Оцініть коефіцієнт кореляції r xy