Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 12 лет назад пользователемtest.hse.spb.ru
1 Афанасьева С.В.
2 Data Mining (Интеллектуальный анализ данных) - это технология выявления скрытых взаимосвязей внутри больших баз данных. Является службой Microsoft SQL Server 2005 (2008) Analysis Services
3 Алгоритм дерева принятия решений Алгоритм кластеризации Упрощенный алгоритм Байеса Алгоритм взаимосвязей Алгоритм кластеризации последовательностей Алгоритм временных рядов Алгоритм нейронной сети (службы SSAS) Алгоритм логистической регрессии Алгоритм линейной регрессии
4 выявлять закономерности и тренды, существующие в сложных данных, отображать такие закономерности в диаграммах и интерактивных средствах просмотра формировать цветные сводные отчеты для презентаций и бизнес-аналитики. анализировать корреляции и формировать прогнозы для данных, хранящихся в таблицах Microsoft Office Excel, или создавать и изменять модели интеллектуального анализа данных, хранящихся в экземпляре Analysis Services
5 Алгоритм интеллектуального анализа данных представляет собой механизм, создающий модели интеллектуального анализа данных. Средства интеллектуального анализа данных в этой надстройке автоматически анализируют распределение и тип данных и рекомендуют лучший способ обработки данных для получения допустимых результатов.
6 Анализ ключевых факторов влияния Определяет столбцы данных с наибольшим влиянием на выбранное значение или столбец значений. Поиск категорийОпределяет строки с похожими свойствами. Заполнение по примеруПоиск отсутствующих значений данных в выбранном столбце и предложение новых значений на основе закономерностей в данных. ПрогнозПрогнозирует будущие значения с учетом ряда значений. Выделение исключенийПоиск значений в столбце данных, не соответствующих шаблонам, обнаруженным в данных. Анализ сценария: поиск решения Указывает целевое значение и определяет базовые факторы, подлежащие изменению для соответствия цели на основе анализа шаблонов данных. Анализ сценария: гипотетические ситуации Использует значения для определения результата изменения на основе анализа закономерностей в данных
7 При создании отчета, средство выполняет три действия: 1.создает структуру интеллектуального анализа данных, хранящую ключевые сведения о данных; 2.создает модель интеллектуального анализа данных с помощью упрощенного алгоритма Байеса Майкрософт; 3.запускает прогнозирующий запрос для каждой заданной пары атрибутов, чтобы определить факторы, наиболее отличающие эти два целевых атрибута.заданной пары атрибутов
9 После завершения работы средства создается отчет со списком найденных категорий вместе с их отличительными характеристиками.отчет
10 В таблицу данных добавляется новый столбец с предлагаемой категорией
11 Средство позволяет быстро создать новые столбцы данных, основанные на закономерностях, найденных в таблице, и образцах новых значений, предоставленных пользователем.
12 После завершения мастера новые прогнозы добавятся в конец таблицы источника данных, Новые значения рядов времени не добавлены; это позволяет сначала предварительно просмотреть прогнозы.
13 На сводной диаграмме показано число ячеек в каждом столбце, значения в которых превышают порог исключений. Средство в исходной таблице выделяет подсветкой ячейки с подозрительными значениями. Темная подсветка означает, что строка требует внимания. Светлая подсветка означает, что значение в этой конкретной ячейке рассматривается как подозрительное.
14 При создании сценария поиска решения выполняются следующие действия. 1. Создает структуру интеллектуального анализа данных, в которой хранятся ключевые сведения о содержащихся в таблице данных. 2. На основе существующих данных создает модель интеллектуального анализа с логистической регрессией. 3. Создает прогнозирующий запрос для каждого из указанных значений. Сценарий Поиск решения представляет собой дополнение к средству сценария Анализ гипотетических вариантов и указывает на влияющие факторы, которые должны быть изменены
15 1. Создает структуру интеллектуального анализа данных, в которой хранятся ключевые сведения о содержащихся в таблице данных. 2. На основе существующих данных создает модель интеллектуального анализа с логистической регрессией. 3. Создает прогнозирующий запрос для каждого из указанных значений. Сценарий анализирует закономерности существующих данных, а затем позволяет оценить влияние изменений в одном столбце на значение другого столбца. При создании сценария средство выполняет задачи:
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.