Анализ данных в телекоме: от отчетности к Data Mining
BaseGroup Labs Предпосылки Телекоммуникационный сектор характеризуется огромными объемами данных, большим количеством мелких операций и сложными закономерностями. Глубокая бизнес аналитика позволяет решать не только задачи консолидации и отчетности, но и множество других: Мониторинг абонентской базы Лояльность и предотвращение оттока клиентов Обнаружение мошенничества Прогнозирование загрузки оборудования и выявление причин отказа Анализ и оптимизация трафика
BaseGroup Labs Информация для анализа Отчетность – один из наиболее простых и привычных методов анализа данных. Чаще всего для этого используется сочетание хранилища данных с механизмами визуализации: OLAP-системы, таблицы, графики, информационные панели и прочие. Именно хранилище данных является поставщиком информации для аналитика, однако перед, собственно, анализом необходимо провести предобработку и очистку. Использование «грязных» данных может привести к выявлению ложных закономерностей, ошибочных прогнозов и к неверным управленческим решениям.
BaseGroup Labs Игнорирование задач очистки и предобработки приводит к тому, что хранилище данных превращается в «свалку данных», т.к. реальные информационные системы практически всегда содержат большое количество ошибок: Фиктивные значения Аномальные выбросы Пропуски Дубликаты Противоречия Очистка и предобработка данных ETL-процесс Хранилище данных Источники данных Предобработка Очистка Обогащение
BaseGroup Labs Методы очистки и предобработки данных Для исправления некоторых ошибок можно использовать различные методы профайлинга, например, жесткие правила, однако, огромное количество данных исключает возможность решения проблемы очистки только «ручными» методами. Для этого нужно использовать специализированный математический аппарат, позволяющий автоматически находить ошибки. Аномалия Время Трафик
BaseGroup Labs Анализ данных методами Data Mining Наличие больших объемов консолидированных, очищенных и подготовленных для анализа данных обеспечивает возможность использовать различные методы моделирования в процессе принятия решений. Их применение позволяет реально оперировать большими базами, выявлять сложные зависимости, которые невозможно обнаружить в «сырых» данных при помощи только средств визуализации.
BaseGroup Labs Моделирование – схема работы Общие принципы работы Data Mining вне зависимости от сферы применения сводятся к нескольким шагам: Постановка цели Сбор исторических данных для анализа Построение моделей на исторических данных Проверка адекватности моделей и их интерпретация Применение построенной модели для принятия решений Периодическая верификация модели
BaseGroup Labs Кейс 1 – сегментация клиентской базы Наличие информации о поведении клиентов, такой как тарифных план, количество звонков в разное время суток, звонки на номера других операторов, и прочее, позволяет сегментировать клиентскую базу, оценить предпочтения и рассчитать доходность для каждой группы. Все это позволяет получить профиль потребителей из различных сегментов и планировать маркетинговые акции. Взрослые Большое количество звонков за рубеж Большое количество звонков днем Большое количество SMS
BaseGroup Labs Кейс 2 – предотвращение оттока клиентов Анализируя информацию о клиентах, которые отказались от услуг оператора можно выявить и оценить значимость факторов, которые влияют на лояльность клиентов. Проанализировав доходность каждой категории клиентов, можно принять решение о необходимости их удержания и, если это экономически обосновано, предложить соответствующие меры. Вероятность оттока высокая Вероятность оттока низкая
BaseGroup Labs Кейс 3 – повышение доходности Данные из биллинговой системы клиенте позволяет формировать точные адресные предложения. Построив модели поведения различных групп клиентов, можно автоматически стоить персональные обращения с предложением услуг на которые скорее всего среагируют потребители. Подобные модели позволяют решать задачи стимулирования спроса и повышения доходности. Сравнение вероятности оплаты дополнительной услуги для клиентов из разных кластеров
BaseGroup Labs Кейс 4 – мошенничество (fraud detection) Автоматическое построение шаблонов «нормального» поведения клиентов и анализ отклонений от него, позволяет выявлять случаи фрода и проводить превентивные мероприятия, снижающие или исключающие потери. Использование самообучающихся алгоритмов обеспечивает системе способность адаптироваться под изменяющееся поведение мошенников. Подозрительная операция – обратить внимание
BaseGroup Labs Кейс 5 – превентивная диагностика Анализируя различные параметры работы оборудования можно выявлять шаблоны поведения системы, которые предшествуют возникновению сбоев. Подобная ранняя диагностика позволяет проводить нужные профилактические мероприятия в периоды минимальной нагрузки, планировать замену и ремонт оборудования в рабочем порядке, без проблем для клиентов. Ситуация еще не вышла за допустимые границы, но есть тенденция к ухудшению, при продолжении этой тенденции с расчетное время скорее всего произойдет сбой
BaseGroup Labs Data Mining в телекомме Многие телекоммуникационные компании давно поняли необходимость использования Data Mining в своей деятельности и недостаточность применения только систем отчетности: British Telecom проанализировав предпочтения своих клиентов смогла повысить количество откликов на предложение по почтовой рассылке на 100 процентов MCI Communications смогла сэкономить миллионы долларов проанализировав причины оттока клиентов и сконцентрировавшись на наиболее прибыльных Rural Cellular Corporation использует технологию Data Mining для более точного позиционирования своих услуг и тарифных планов
BaseGroup Labs Deductor – инструмент анализа данных Deductor – аналитическая платформа, позволяющая решить все описанные выше задачи. Реализованные в ней технологии обеспечивают возможность на базе единой архитектуры пройти все этапы построения аналитической системы: от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов. Все кейсы, описанные в презентации реализованы в системе Deductor.
BaseGroup Labs Deductor – инструмент анализа данных Ключевые преимущества Deductor: Хранилища данных на нескольких платформах Поддержка ETL-процесса, включая механизмы очистки, предобработка и обогащения данных Встроенный развитый OLAP-модуль Развитые механизмы Data Mining, реализация широкого спектра самообучающихся алгоритмов: нейронные сети, деревья решений, самоорганизующиеся карты, ассоциативные правила и прочее... Гибкая интеграция – десятки источников данных Учетно-методическая поддержка: система дистанционного обучения, кейсы, книги, обширная справка на русском Доступная, для продуктов подобного класса, цена
BaseGroup Labs BaseGroup Labs – профессиональный поставщик Data Warehouse, OLAP, KDD, Data Mining решений и инструментов. Web-сайт: Образование: edu.basegroup.ruedu.basegroup.ru