Кейс: Скоринг в МФО на минимальных данных
Повышение скорости бизнес-процессов Сбор минимальных данных о заемщике Снижение возможности анализа Повышение неопределенности Упрощение форм ввода Микрофинансовые организации должны принимать решения за минуты. Требования рынка
Типичная форма заявки содержит минимум полей: сложно принимать обоснованные решения. Микрофинансовые организации
Обогащение данных из сторонних источников Социальные сети Бюро кредитных историй Государственные органы Данные мобильных операторов Возможные источники данных Может МФО нужно искать данные во внешних источниках?
Ожидания: Имеет кредитную историю Активен в социальных сетях По окружению можно судить о заемщике Портрет заемщика МФО
Реальность: Кредитная история плохая/отсутствует Пассивен в социальных сетях Окружение мало говорит о заемщике Портрет заемщика МФО
Доступны всегда: Анкетные данные для всех клиентов Поведенческие данные повторных клиентов Доступные иногда: Бюро кредитных историй Профили и активности в соцсетях Данные мобильных операторов Прочие источники Какие данные анализировать?
Вначале выжать максимум из минимальных существующих данных Задача
Пример построения скоринговой карты
Строим две скоринговые карты для 2-х категорий заемщиков: Новые – аппликационный скоринг Повторные – поведенческий скоринг Виды скоринговых карт
Первичные: 1. Возраст 2. Семейный статус 3. Число иждивенцев 4. Стаж 5. Основной доход 6. Дополнительный доход 7. Сумма займа 8. Срок займа 9. Отделение выдачи 10. Наличие телефона 11. Наличие Расчетные: 1. Пол 2. Совокупный доход 3. Наличие дополнительного дохода 4. Общая сумма выплат по договору 5. Проценты по займу 6. Отношение процентных выплат к сумме займа 7. Отношение общих выплат по займу к указанному доходу Анкетные характеристики
Агрегаты: 1. Суммы предыдущих займов 2. Сроки предыдущих займов 3. Сроки между займами 4. Отношение общих выплат по займу к указанному доходу 5. Отношение процентных выплат к сумме займа 6. Сумма выплат по предыдущим займам 7. Факты и длительность пролонгаций Расчетные показатели: 1. Количество посещенных отделений 2. Отношение количества отделений к займам 3. Количество займов 4. Мин. и макс. срок между займами 5. Отношение % по текущему займу к средним % 6. Отношение суммы последнего займа к максимально возможной 7. … Поведенческие характеристики
Входные данные: 11 анкетных полей История выплат Дополнительные данные: +7 анкетных показательней + Десятки поведенческих агрегатов + Десятки расчетных показательней Анализируемые атрибуты Итого ~50(!) атрибутов для построения скоринговой карты
Подготовка скоринговой выборки Анализ жизненных циклов счетов Моделирование (предварительная карта) Добавление в выборку отказов (Reject Inference)Перестройка карт с учетом отказов (окончательная карта) Тестовая эксплуатация и мониторинг Двумерный анализ – конечные классы (одобренные)Сэмплинг Сравнение качества карт, выбор оптимальной, назначение балла отсечения Разработка скоринговой карты
Новый клиент: значимость Самые важные характеристики аппликационного скоринга
Повторный клиент: значимость Самые важные характеристики поведенческого скоринга
Качество карты Даже на минимальных данных неплохой индекс GINI
Ретроспективный анализ
Портфель займов за 12 мес. Закрытые C просрочками Списанные Открытые Просрочка до 300 дней Просрочка от 300 дней 100% потери Частичные потери 100% потери Доход Без просрочек Доход Финансовая модель
Ретроскоринг займов Без карты: выдать тем же клиентам С картой: выдать только тем у кого балл выше порога
Показатель«Как есть»Скоринговая карта* Портфель займов, млн. руб Ожидаемые выплаты, млн. руб Реальные выплаты, млн. руб ROI Потери, млн. руб Дополнительный доход, млн. руб Финансовый анализ *Балл отсечения: 425
1. Соблюдение методологии построения скоринга 2. Тщательная предобработка и очистка данных 3. Обогащение данных, расчет агрегатов и производных характеристик 4. Частое перестроение скоринговых карт 5. Отказ от генрик-карт: множество скоринговых карт для разных продуктов, регионов, отделений, сегментов 6. Подбор балла отсечения с учетом финансовой модели 7. Построение скоринговой карты вероятности мошенничества Внимание нюансам
1. Даже на минимальных данных можно построить скоринговую карту, дающую экономический эффект. 2. Использовать сложные методы и дополнительные источники можно и нужно, но только после того, как выжат максимум из существующих данных. Резюме
basegroup.ru