оценка и прогнозирование спроса Доц. Касимовская Елена Николаевна 1
Простая линейная регрессия ( одна независимая переменная) У = А +bХ Y – зависимая переменная(функция) Х – независимая переменная ( аргумент) b – угол наклона= У/ Х Например: У – объем продаж, Х – период времени : Q = A + bt Используется для прогнозирования Стандартный пакет Excel 2
Исходные данные y = 1000x R² = Excel: функция TREND 3
4
Пусть известны объемы продаж по периодам. Необходимо дать прогноз на 9-ий период, используя простую линейную регрессию Формула из Excel: =SUM(LINEST(B1:B6,A1:A6)*{9,1}) ОТВЕТ: ЗАДАНИЕ: рассчитайте объем продаж на 11 период 5
6
7
8
Ценовые и неценовые факторы спроса ( несколько аргументов) Y = A + b 1 + b 1 X 1 + b 2 X 2 +…… + b n X n Где X 1, X 2... X n – различные факторы, определяющие поведение спроса ( цена, доход, цены на сопряженные товары и пр.); знак (+/-) перед b определяет характер связи функции и аргумента ( прямая или обратная) Количественное значение факторов – результат статистической обработки первичных данных 9
У (зависимая переменная) – стоимость офисного здания 4 независимых переменных: Х1 – площадь в кв.м., Х2- количество офисов, Х3- количество входов в здание, Х4- возраст здания( в годах) Случайная выборка 11 зданий из Цель – определить зависимость цены здания от выявленных переменных 10
BCDE Floor space (x1) Offices (x2)Entrances (x3) Age (x4)Assessed value (y) , , , , , , , , , , ,000 Formula =LINEST(E2: E12,A2:D12, TRUE,TRUE) 11
АВСDEF 1mnmn m n-1 …m2m2 m1m1 b 2se n Se n-1 …se 2 se 1 se b 3r2r2 se v 4Fdf 5ss rg ss resid 12
y = 27.64*x1 + 12,530*x2 + 2,553*x *x4 + 52,318 Результаты: #N/A #N/A #N/A 13
Используя полученную модель, можно рассчитать стоимость здания площадью 2500 кв.м., с тремя офисами и двумя входами, построенное 25 лет назад: y = 27.64* * * * = $158,261 Можно рассчитать коэфффициенты эластичности(чувствительности) цены по каждому параметру, например: E(по площади)= 27.64*2500/158258= 0,44 14
Прямая зависимость между ценой на здание и: Площадью Количеством офисов Количеством входов Обратная зависимость между ценой и временем постройки 15
R2 – коэфффициент детерминации: показывает, какая часть изменения зависимой переменной вызвана изменением всех объясняющих переменных в уравнении ( чем ближе к 1, тем лучше) F-статистика: измеряет статистическую значимость всего уравнения ( т.е. Модели). Проверяется по таблицам критических значений при заданном уровне достоверности ( зависит от числа наблюдений и количества независимых параметров). См. пример Стандартные ошибки и t-статистики: значение t- статистики получают путем деления коэфффициента переменной на стандартную ошибку. Проверяется по таблицам критических значений при заданном уровне достоверности ( зависит от числа наблюдений и количества независимых параметров). В большинстве случаев – «правило двух»: если значение больше двух, параметр признается значимым 16
R2 = 0,99,т.е. Параметры уравнения почти на 100% объясняют изменение в цене F-статистика : очень большая, критическое значение при 11 наблюдениях и 4-х переменных =3.36 ( при уровне достоверности 95%), т.е. Построенное нами уравнение статистически значимо t-статистика: что значительно больше двух, т.е. Все параметры значимы 17
Проблема идентификации Мультиколлинеарность: если независимые переменные связаны между собой, то мы получим искаженную картину ( например, доход и образование как переменные). Если F-статистика хорошая, а t-статистика нет, то вероятна мультиколлинеарность. Нужно провести корреляционный анализ ( коэфф. Пирсона и\или Спирмена). Одну из переменных надо будет удалить. Автокорреляция ( или корреляция внутри ряда наблюдений) – некая систематическая связь между зависимой и независимой переменной ( например, циклическая\сезонная). Используют показатель\статистику Дарбина-Уотсона ( таблицы критических значений). Или применяют дополнительные методы обработки данных, как то выделение данной циклической составляющей и ее учет в прогнозах, выводах и пр. 18
19
На основе приводимых далее данных построить регрессионную модель Выделить значимые факторы ( объяснить почему) Рассчитать значения эластичностей по кадому фактору для уровня цены=25 Построить функцию спроса с учетом только значимых параметров и на ее основе определить уровень цен, при которых доход фирмы будет максимальным 20
21