Афанасьева С.В.
Data Mining (Интеллектуальный анализ данных) - это технология выявления скрытых взаимосвязей внутри больших баз данных. Является службой Microsoft SQL Server 2005 (2008) Analysis Services
Алгоритм дерева принятия решений Алгоритм кластеризации Упрощенный алгоритм Байеса Алгоритм взаимосвязей Алгоритм кластеризации последовательностей Алгоритм временных рядов Алгоритм нейронной сети (службы SSAS) Алгоритм логистической регрессии Алгоритм линейной регрессии
выявлять закономерности и тренды, существующие в сложных данных, отображать такие закономерности в диаграммах и интерактивных средствах просмотра формировать цветные сводные отчеты для презентаций и бизнес-аналитики. анализировать корреляции и формировать прогнозы для данных, хранящихся в таблицах Microsoft Office Excel, или создавать и изменять модели интеллектуального анализа данных, хранящихся в экземпляре Analysis Services
Алгоритм интеллектуального анализа данных представляет собой механизм, создающий модели интеллектуального анализа данных. Средства интеллектуального анализа данных в этой надстройке автоматически анализируют распределение и тип данных и рекомендуют лучший способ обработки данных для получения допустимых результатов.
Анализ ключевых факторов влияния Определяет столбцы данных с наибольшим влиянием на выбранное значение или столбец значений. Поиск категорийОпределяет строки с похожими свойствами. Заполнение по примеруПоиск отсутствующих значений данных в выбранном столбце и предложение новых значений на основе закономерностей в данных. ПрогнозПрогнозирует будущие значения с учетом ряда значений. Выделение исключенийПоиск значений в столбце данных, не соответствующих шаблонам, обнаруженным в данных. Анализ сценария: поиск решения Указывает целевое значение и определяет базовые факторы, подлежащие изменению для соответствия цели на основе анализа шаблонов данных. Анализ сценария: гипотетические ситуации Использует значения для определения результата изменения на основе анализа закономерностей в данных
При создании отчета, средство выполняет три действия: 1.создает структуру интеллектуального анализа данных, хранящую ключевые сведения о данных; 2.создает модель интеллектуального анализа данных с помощью упрощенного алгоритма Байеса Майкрософт; 3.запускает прогнозирующий запрос для каждой заданной пары атрибутов, чтобы определить факторы, наиболее отличающие эти два целевых атрибута.заданной пары атрибутов
После завершения работы средства создается отчет со списком найденных категорий вместе с их отличительными характеристиками.отчет
В таблицу данных добавляется новый столбец с предлагаемой категорией
Средство позволяет быстро создать новые столбцы данных, основанные на закономерностях, найденных в таблице, и образцах новых значений, предоставленных пользователем.
После завершения мастера новые прогнозы добавятся в конец таблицы источника данных, Новые значения рядов времени не добавлены; это позволяет сначала предварительно просмотреть прогнозы.
На сводной диаграмме показано число ячеек в каждом столбце, значения в которых превышают порог исключений. Средство в исходной таблице выделяет подсветкой ячейки с подозрительными значениями. Темная подсветка означает, что строка требует внимания. Светлая подсветка означает, что значение в этой конкретной ячейке рассматривается как подозрительное.
При создании сценария поиска решения выполняются следующие действия. 1. Создает структуру интеллектуального анализа данных, в которой хранятся ключевые сведения о содержащихся в таблице данных. 2. На основе существующих данных создает модель интеллектуального анализа с логистической регрессией. 3. Создает прогнозирующий запрос для каждого из указанных значений. Сценарий Поиск решения представляет собой дополнение к средству сценария Анализ гипотетических вариантов и указывает на влияющие факторы, которые должны быть изменены
1. Создает структуру интеллектуального анализа данных, в которой хранятся ключевые сведения о содержащихся в таблице данных. 2. На основе существующих данных создает модель интеллектуального анализа с логистической регрессией. 3. Создает прогнозирующий запрос для каждого из указанных значений. Сценарий анализирует закономерности существующих данных, а затем позволяет оценить влияние изменений в одном столбце на значение другого столбца. При создании сценария средство выполняет задачи: