Метод прогнозирования индикаторов рынка недвижимости путём двумерного разложения дискретной пространственно-параметрической модели на основе применения нейронных сетей Евстафьев А. И. Начальник отдела консалтинга ООО Южная Юридическая Консалтинговая Компания САРН Гордиенко В. А. Начальник IT отдела ООО Компания ВИЛЛАН Краснодар 2009 г.
Задачи исследования разработка инструментария прогнозирования, способного анализировать слабо изученные явления и процессы с неформализованными зависимостями; подстройка метода под практическое применение в условиях отсутствия длинных статистических рядов наблюдений; выявление скрытых системных закономерностей между рассматриваемыми показателями и как следствие возможность применения инструментария для прогнозирования широко круга индикаторов рынка. 2
Понятийный аппарат Дискретная пространственно-параметрическая модель (ДППМ) рынка недвижимости (Таблица Стерника) – упорядоченный набор индикаторов состояния рынка по всем его сегментам, полученный в результате параллельного сечения рассматриваемой выборки объектов недвижимости по следующим измерениям: Размер, Местоположение, Качество, Срок сдачи объекта и (реже) другие. Ячейка - мельчайшая неделимая единица информации о конкретном сегменте в локальном рынке недвижимости (информация об объектах недвижимости с определенным Местоположением, Размером, Качеством и т.д.). Измерение - ось в гиперпространстве, задающая конкретный адрес каждой ячейке (как в excel); Пример измерений для вторичного рынка жилья Краснодара: Кол-во комнат в квартире (Размер), Топонимический район (Местоположение), Материал наружных стен дома (Качество). Параметр - конкретная статистическая величина, агрегирующая данные по выборке, вошедшей в ячейку. Пример параметров: средняя, максимальная, минимальная цена предложения, кол-во объектов в выборке, темп прироста цен и т.д. Набор параметров - содержимое ячейки. Слой ячеек - набор ячеек из куба ДППМ, соответствующий определенному значению по одному из измерений. В аналогии с кубиком Рубика такой набор ячеек будет соответствовать слою маленьких кубиков, находящихся в одной плоскости. Искусственные нейронные сети (ИНС) – математические модели, а также их программные или аппаратные реализации, построенные по принципу организации и функционирования биологических нейронных сетей – сетей нервных клеток живого организма. 3
4 Трехмерное представление ДППМ Адрес ячейки в ДППМ
Алгоритм создания инструментария Статистическая обработка массива данных Построение ДППМ с максимально обширным объемом параметров в ячейках отдельно для каждого временного отрезка в предыстории Двумерное разложение ДППМ Подготовка и нормализация данных Интеллектуальная обработка данных Обучение множества нейронных сетей по всей предыстории Оценка качества обучения и выбор наиболее удачных сетей при помощи корреляционного анализа Регрессионное моделирование Формирование единого набора прогнозов, полученных из всех отобранных сетей, и фактических значений роста цен по предыстории Построение регрессионного уравнения, увязывающего прогнозы сетей с фактом 5
6 Логика создания и применения инструментария 6
7 1. Статистическая обработка массива данных Двумерное разложение ДППМ
8 2. Интеллектуальная обработка данных Образец простейшей двухслойной нейронной сети Вход сети Выход сети Первый слой нейронов Второй слой нейронов
9 2. Интеллектуальная обработка данных Схема применения нейронной сети в прогнозировании, сопряженном с двумерным разложением ДППМ
10 3. Регрессионное моделирование
11 3. Регрессионное моделирование
12 3. Регрессионное моделирование График линейной аппроксимации тренда роста цен
13 3. Регрессионное моделирование График роста цен, полученный уравнением регрессии после нейросетевого анализа y = 63, ,347 * местоположение + 0,438 * класс + (–0,407) * размер R2=0.764
Уникальность метода Корреляционно-регрессионный анализ можно применить при анализе взаимосвязи параметров внутри ячейки с одним целевым параметром. Однако тогда не учитывается единство внутри слоя ячеек: регрессионная модель предполагает зависимость ОДНОГО параметра от множества других. При использовании нейронных сетей можно получить набор связанных выходов. Тем самым резюмируется наличие внутренней логической связи между ячейками, вошедшими в один слой. Итогом этапа нейросетевого анализа является по сути не один прогноз, а три (по числу измерений ДППМ). Оценивая их качество (по критерию максимальной корреляции) можно найти то, каким образом агрегировать их в более достоверный один прогноз. Представленный метод выявляет одновременно зависимости: - индикаторов рынка внутри ячеек ДППМ; - индикаторов рынка внутри ДППМ; - ячеек внутри ДППМ Применение нейронных сетей в данном методе смягчает требования к составу и качеству исходных данных: не требуется набор данных за продолжительный промежуток времени (достаточно за 6-9 месяцев), допускаются пропуски и искажения в данных. В условиях существенной информационной закрытости рынка недвижимости указанное преимущество нейросетевого анализа являются неоспоримым 14
Перспективы дальнейших разработок Прогнозирование неценовых индикаторов рынка недвижимости, таких как конъюнктура спроса и предложения, обороты и емкость рынка, ликвидность объектов и т.д. Разработка методики вычисления пропущенных и исправления недостоверных значений параметров в ячейках ДППМ (интеллектуальная нормализация данных); вычисление вероятных значений параметров в Пустых ячейках (в локациях и/или сегментах, где нет объектов недвижимости). Комбинирование и интеграция получаемых данным методом результатов корреляционно- регрессионного анализа в семейство традиционных методов регрессионного анализа рынка недвижимости (с ростом новых непересекающихся факторов регрессионной модели растет качество модели - R2). Разработка методики сценарного прогнозирования связанных значений одной части набора индикаторов рынка в определенной ячейке ДППМ (входов сети) для заданного значения другой части набора индикаторов рынка (выходов сети). 15
Евстафьев А. И. Гордиенко В. А. Краснодар 2009 г.