Методы построения скоринговых моделей
BaseGroup Labs Постановка задачи оценки рисков Любая проблема оценки рисков сводится к решению двух задач: Отнесение объекта к одному из заранее заданных классов (например, «низкий», «средний» и «высокий» риск) – задача классификации. Численная оценка вероятности возникновения неблагоприятного события (например, мошенничества) – задача регрессии. Для решения каждой из этих задач существует соответствующий математический аппарат, возможность применения которого зависит от данных, используемых для анализа.
BaseGroup Labs Анализируемые данные Данные, используемые для анализа рисков, могут быть представлены множеством различных видов, в том числе: Структурированные данные Слабоструктурированные данные Неструктурированные данные Аудиоинформация Графика Видеоизображения Каждый из вариантов представления данных требует специфических методов обработки. Опишем методы, пригодные для анализа структурированных (табличных) данных.
BaseGroup Labs Структурированные данные Структурированные данные – это информация, представленная в виде таблиц. Данные представляются следующим образом: каждому столбцу соответствует фактор, а в каждую строку заносится пример (ситуация, прецедент). Прецедент Факторы N Стаж работы Наличие автомобиля Объем кредита 1>5 летДа
BaseGroup Labs Последовательность работы При анализе структурированных данных наиболее практически пригодной для оценки рисков является методика, состоящая из следующих шагов: Выдвижение гипотезы Сбор и систематизация данных в табличном виде Подбор модели, объясняющей имеющиеся прецеденты Тестирование и интерпретация полученных результатов Применение полученной модели на новых данных для оценки риска
BaseGroup Labs Проблема недостатка данных На практике довольно часто возникает проблема недостатка данных для построения моделей – отсутствие истории. Возможны следующие варианты ее решения: Получение данных из стороннего источника Сбор собственной истории и последующее ее использование для построения модели Генерация искусственной истории Последний вариант наиболее часто применим на практике.
BaseGroup Labs Сценарный подход Реализация данной методики требует поддержки сценарного подхода, т.е. последовательности действий, которые необходимо провести для преобразования структурированных данных в знания. Cбор, систематизация, построение моделей, тестирование и проч. является не одной операцией, а цепочкой действий. На практике очень редко используется одна модель – реальный результат получается при прохождении через набор различных обработчиков, например: различные способы очистки и трансформации данных; через сито различных моделей.
BaseGroup Labs Практическая реализация Подобный подход к анализу структурированных данных реализован в аналитической платформе Deductor. Система активно используется для создания решений в области анализа рисков: Оценка риска невозврата кредита Системы андеррайтинга Выявление случаев мошенничества Оценка риска взрыва в шахтах
BaseGroup Labs Постановка задачи Анализ кредитоспособности можно производить на основе скоринговых анкет. Анализируемые данные в этом случае представляются в виде обычной таблицы, в которой содержатся прецеденты. Таблица помимо факторов, используемых аналитиком для оценки рисков, содержит и столбец, в котором указывается, вернул ли во время клиент кредит. На этих данных строятся модели, объясняющие уже имеющиеся прецеденты, и делается предположение, что следующие кредитополучатели поведут себя аналогично.
BaseGroup Labs Методы решения Моделью для оценки риска может являться любое правило, например разработанные экспертом формулы или балльная система, но наиболее мощные механизмы - это самообучающиеся алгоритмы, обладающие способностью к адаптации, т.е. автоматическому учету вновь поступающих данных и подстройке модели. В качестве подобных адаптивных механизмов рассмотрим 3 алгоритма: Деревья решений Нейронные сети Самообучающиеся карты
BaseGroup Labs Деревья решений Дерево решений - это алгоритм, автоматически строящий иерархическую систему правил для решения задач анализа. Достоинствами алгоритма является простота интерпретации полученных результатов и автоматический выбор алгоритмом наиболее значимых факторов.
BaseGroup Labs Нейронные сети Нейронные сети - самообучающийся алгоритм, автоматически определяющий вклад каждого фактора в результат, причем учитывающий их взаимное влияние. Нейронные сети позволяют находить очень сложные, нетривиальные зависимости
BaseGroup Labs Самоорганизующиеся карты Алгоритм разбивают объекты на кластеры – группы близких объектов. Новый объект в зависимости от его показателей попадает в тот или иной кластер, для каждого кластера рассчитывается количество попавших в него положительных и отрицательных случаев и на основании сложившихся пропорций оценивается риск возникновения ситуации.
BaseGroup Labs Результаты Подобные алгоритмы оценки рисков доказали свою практическую ценность во множестве проектов, связанных не только с банковской сферой. Самообучающиеся механизмы - очень мощный инструмент, позволяющий находить сложные зависимости в большом объеме данных, формализовать процесс оценки рисков и тиражировать построенные модели. Одним из самых важных достоинств подобных механизмов является их адаптивность. Именно эта особенность гарантирует не только получение качественного результата сейчас, но и ее адекватность постоянно изменяющейся среде.
BaseGroup Labs Актуализация моделей Любая модель имеет срок жизни, в течение которого она позволяет получать адекватные результаты. Это связано со множеством факторов: Изменения в экономике Изменения в структуре клиентской базы Действия конкурентов Появление новых кредитных продуктов Выход на новые рынки
BaseGroup Labs Поддержание работоспособности Инструмент построения скоринговых моделей должен обеспечить не только процесс их получения, но и иметь механизмы поддержания их в работоспособном состоянии: Проверка отклонений Анализ качества Автоматическое дообучение Перестройка моделей с учетом появления новых факторов Аналитическая отчетность
BaseGroup Labs BaseGroup Labs – профессиональный поставщик Data Warehouse, OLAP, KDD, Data Mining решений и инструментов. Web-сайт: Образование: edu.basegroup.ruedu.basegroup.ru