Методы построения скоринговых моделей. BaseGroup Labs Постановка задачи оценки рисков Любая проблема оценки рисков сводится к решению двух задач: Отнесение.

Презентация:



Advertisements
Похожие презентации
Методы построения скоринговых моделей. BaseGroup Labs Постановка задачи оценки рисков Любая проблема оценки рисков сводится к решению двух задач: Отнесение.
Advertisements

Белорусский государственный университет Механико-математический факультет Кафедра математических методов теории управления Федорович Марина Николаевна.
Прогнозирование в Deductor. BaseGroup Labs Задача прогнозирования Прогнозирование – одна из самых востребованных, но при этом и самых сложных задач анализа.
Deductor в банковской аналитике. BaseGroup Labs Банковская аналитика Банковская аналитика охватывает большой спектр вопросов от консолидации и визуализации.
Промышленное прогнозирование. BaseGroup Labs Постановка задачи Прогнозированием можно назвать любой способ предсказать значения одной переменной в зависимости.
Особенности Data Mining проектов. BaseGroup Labs Отличие от стандартного проекта В большинстве случаев Data Mining проекты не оправдывают ожидания клиентов.
Data Mining – подготовка данных. BaseGroup Labs Последовательность работы Гипотеза, предположение Сбор и систематизация данных Подбор модели Тестирование,
Deductor 5 – эволюция платформы. BaseGroup Labs Причины изменений Deductor изменялся под влиянием требований, возникающих при его применения в реальных.
Оценка кредитоспособности физических лиц. BaseGroup Labs Составные части системы Система оценки рисков кредитования состоит из 2-х блоков: Скоринговая.
Deductor – аналитическая платформа. BaseGroup Labs Назначение системы Deductor 5 является платформой, ориентированной на решение задач анализа любых структурированных.
Data Mining – инструмент оптимизации работы с клиентами.
Арустамов Алексей BaseGroup Labs IT Service Management – анализ инцидентов и проблем.
Анализ бизнес информации – основные принципы. BaseGroup Labs Последовательность работы Сбор и систематизация данных Построение модели, объясняющей имеющиеся.
Анализ больших объемов данных. BaseGroup Labs Обработка больших объемов данных Во многих компаниях, особенно в розничных торговых сетях, аккумулируется.
Обнаружение нетривиальных аномалий методами Data Mining.
Deductor – принципы работы. BaseGroup Labs Назначение системы Deductor является платформой, ориентированной на решение задач анализа самого широкого спектра:
Арустамов Алексей BaseGroup Labs IT Service Management в банках : анализ инцидентов и проблем.
Deductor – принципы работы. BaseGroup Labs Назначение системы Deductor является платформой, ориентированной на решение задач анализа самого широкого спектра:
Deductor Inventory Stock Optimization. BaseGroup Labs Важность проблемы Большая часть финансовых средств торговой организации сосредоточена на складе,
Оценка эффективности маркетинговых кампаний. BaseGroup Labs Сложность оценки «Я точно знаю, что половина моих рекламных денег тратится впустую, вот только.
Транксрипт:

Методы построения скоринговых моделей

BaseGroup Labs Постановка задачи оценки рисков Любая проблема оценки рисков сводится к решению двух задач: Отнесение объекта к одному из заранее заданных классов (например, «низкий», «средний» и «высокий» риск) – задача классификации. Численная оценка вероятности возникновения неблагоприятного события (например, мошенничества) – задача регрессии. Для решения каждой из этих задач существует соответствующий математический аппарат, возможность применения которого зависит от данных, используемых для анализа.

BaseGroup Labs Анализируемые данные Данные, используемые для анализа рисков, могут быть представлены множеством различных видов, в том числе: Структурированные данные Слабоструктурированные данные Неструктурированные данные Аудиоинформация Графика Видеоизображения Каждый из вариантов представления данных требует специфических методов обработки. Опишем методы, пригодные для анализа структурированных (табличных) данных.

BaseGroup Labs Структурированные данные Структурированные данные – это информация, представленная в виде таблиц. Данные представляются следующим образом: каждому столбцу соответствует фактор, а в каждую строку заносится пример (ситуация, прецедент). Прецедент Факторы NNСтаж работы Наличие автомобиля Объем кредита 1>5 летДа

BaseGroup Labs Последовательность работы При анализе структурированных данных наиболее практически пригодной для оценки рисков является методика, состоящая из следующих шагов: Выдвижение гипотезы Сбор и систематизация данных в табличном виде Подбор модели, объясняющей имеющиеся прецеденты Тестирование и интерпретация полученных результатов Применение полученной модели на новых данных для оценки риска

BaseGroup Labs Проблема недостатка данных На практике довольно часто возникает проблема недостатка данных для построения моделей – отсутствие истории. Возможны следующие варианты ее решения: Получение данных из стороннего источника Сбор собственной истории и последующее ее использование для построения модели Генерация искусственной истории Последний вариант наиболее часто применим на практике.

BaseGroup Labs Сценарный подход Реализация данной методики требует поддержки сценарного подхода, т.е. последовательности действий, которые необходимо провести для преобразования структурированных данных в знания. Cбор, систематизация, построение моделей, тестирование и проч. является не одной операцией, а цепочкой действий. На практике очень редко используется одна модель – реальный результат получается при прохождении через набор различных обработчиков, например: различные способы очистки и трансформации данных; через сито различных моделей.

BaseGroup Labs Практическая реализация Подобный подход к анализу структурированных данных реализован в аналитической платформе Deductor. Система активно используется для создания решений в области анализа рисков: Оценка риска невозврата кредита Системы андеррайтинга Выявление случаев мошенничества Оценка риска взрыва в шахтах

BaseGroup Labs Постановка задачи Анализ кредитоспособности можно производить на основе скоринговых анкет. Анализируемые данные в этом случае представляются в виде обычной таблицы, в которой содержатся прецеденты. Таблица помимо факторов, используемых аналитиком для оценки рисков, содержит и столбец, в котором указывается, вернул ли во время клиент кредит. На этих данных строятся модели, объясняющие уже имеющиеся прецеденты, и делается предположение, что следующие кредитополучатели поведут себя аналогично.

BaseGroup Labs Методы решения Моделью для оценки риска может являться любое правило, например разработанные экспертом формулы или балльная система, но наиболее мощные механизмы - это самообучающиеся алгоритмы, обладающие способностью к адаптации, т.е. автоматическому учету вновь поступающих данных и подстройке модели. В качестве подобных адаптивных механизмов рассмотрим 4 алгоритма: Логистическая регрессия Деревья решений Самообучающиеся карты Нейронные сети

BaseGroup Labs Логистическая регрессия Логистическая регрессия – линейная модель для задач с бинарным результирующем полем, например «выдать»/«отказать». Обычно на основе этого алгоритма строятся скоринговые карты, позволяющие подобрать оптимальный и экономически обоснованный порог отсечения.

BaseGroup Labs Деревья решений Дерево решений - это алгоритм, автоматически строящий иерархическую систему правил для решения задач анализа. Достоинствами алгоритма является простота интерпретации полученных результатов и автоматический выбор алгоритмом наиболее значимых факторов.

BaseGroup Labs Самоорганизующиеся карты Алгоритм разбивают объекты на кластеры – группы близких объектов. Новый объект в зависимости от его показателей попадает в тот или иной кластер, для каждого кластера рассчитывается количество попавших в него положительных и отрицательных случаев и на основании сложившихся пропорций оценивается риск возникновения ситуации.

BaseGroup Labs Нейронные сети Нейронные сети - самообучающийся алгоритм, автоматически определяющий вклад каждого фактора в результат, причем учитывающий их взаимное влияние. Нейронные сети позволяют находить очень сложные, нетривиальные зависимости

BaseGroup Labs Сравнение алгоритмов Чем более простой алгоритм, тем он грубее, но при этом легче объяснить полученные результаты. Наиболее мощные алгоритмы способны находить сложные нелинейные зависимости, но их интерпретация является непростой задачей. На практике необходимо находить компромисс между точностью и простотой. Логистическая регрессия Деревья решений Самоорганизующиеся карты Нейронные сети Легко Сложно Грубо Точно

BaseGroup Labs Результаты Подобные алгоритмы оценки рисков доказали свою практическую ценность во множестве проектов, связанных не только с банковской сферой. Самообучающиеся механизмы - очень мощный инструмент, позволяющий находить сложные зависимости в большом объеме данных, формализовать процесс оценки рисков и тиражировать построенные модели. Одним из самых важных достоинств подобных механизмов является их адаптивность. Именно эта особенность гарантирует не только получение качественного результата сейчас, но и ее адекватность постоянно изменяющейся среде.

BaseGroup Labs Актуализация моделей Любая модель имеет срок жизни, в течение которого она позволяет получать адекватные результаты. Это связано со множеством факторов: Изменения в экономике Изменения в структуре клиентской базы Действия конкурентов Появление новых кредитных продуктов Выход на новые рынки

BaseGroup Labs Поддержание работоспособности Инструмент построения скоринговых моделей должен обеспечить не только процесс их получения, но и иметь механизмы поддержания их в работоспособном состоянии: Проверка отклонений Анализ качества Автоматическое дообучение Перестройка моделей с учетом появления новых факторов Аналитическая отчетность

BaseGroup Labs BaseGroup Labs – профессиональный поставщик Data Warehouse, OLAP, KDD, Data Mining решений и инструментов. Web-сайт: Образование: edu.basegroup.ruedu.basegroup.ru