Сценарии интеллектуального анализа Поиск прибыльных клиентов Потребности клиентов Упреждение смены клиентов (анализ лояльности) Предсказание продаж
Модель Процесс интеллектуального анализа DM Engine Тренировочные данные Предсказываемые данные Модель Данные с пред- сказаниями Модель
Интеллектуальный анализ данных с использованием Data Mining Add-ins Analysis Services Data Mining Add-ins Размещение Результаты
Analysis Services Server Server Mining Model Data Mining Algorithm DataSource Серверная архитектура DM Excel/Visio/SSRS/Your App OLE DB/ADOMD/XMLA/AMO Развер- тывание BIDSExcelVisioSSMSBIDSExcelVisioSSMS AppData
Алгоритмы интеллектуального анализа данных Decision Trees Association Rules Clustering Naïve Bayes Sequence Clustering Time Series Neural Nets Linear Regression Logistic Regression
Алгоритм дерева принятия решений (Decision Trees) Используйте для: Классификации: анализ рисков и перехода клиентов Регрессии: предсказание прибыли или дохода Анализа ассоциаций, основанного на предсказании нескольких переменных Строит одно дерево для каждого предсказываемого атрибута Быстрый
Упрощенный алгоритм Байеса (Microsoft Naïve Bayes) Используется для: Классификации Ассоциации с несколькими предсказываемыми атрибутами Предполагает, что все входные данные независимы Простой механизм классификации, основанный на вероятности выполнения условий Требует меньшего количества вычислений
Алгоритмы линейной и логистической регрессии Линейная регрессия Находит лучшую прямую через набор точек Логистическая регрессия Находит кривую путем применения логистического преобразования Используются для предсказательного анализа (определения отношений между числовыми атрибутами)
Алгоритм кластеризации (Clustering) Применим к: Сегментации: группировка клиентов, маркетинговая рассылка предложений Также: классификация и регрессия Обнаружение аномалий Дискретные и непрерывные атрибуты Замечания: Атрибуты «Predict Only» нельзя использовать
Clustering Обнаружение аномалий Мужчина Женщина Сын Дочь Родитель Возраст
Применим к: Классификациии Регрессии Хорош для нахождения сложных взаимосвязей между атрибутами Но сложно интерпретировать результаты Алгоритм нейронной сети (Neural Network) AgeEducationSexIncome Input Layer Hidden Layers Output Layer Loyalty
Алгоритм взаимосвязей (Association Rules) Используйте для анализа: Анализа рыночной корзины Кросс-продаж и рекомендаций Находит часто встречающиеся наборы элементов и связей Чувствителен к параметрам