1 Учебный курс Хранилища данных Лекция 3 Создание куба в SQL Server 2005 Лекции читает Кандидат технических наук, доцент Перминов Геннадий Иванович
2 Цель: методом SQL Server Business Intelligence Development Studio создать реляционное хранилище для предметной области «Индекс РТС».
3 Задачи: 1. построить хранилище для индекса РТС с простыми измерениями; 1.1. создать решение для индекса РТС; 1.2. произвести подключение к источнику данных; 1.3. создание Data Source View; 2. произвести подключение к хранилищу дополнительной размерности типа «Время и Дата»; 2.1. добавить измерение Date; 2.2. произвести расчет измерения Date; 2.3. произвести просмотр измерения Date; 3. произвести подключение к хранилищу размерности, созданной из таблицы фактов; 3.1. добавить измерение Fact_Dim; 3.2. рассчитать размерность из таблицы фактов; 3.3. осуществить просмотр размерности из таблицы фактов.
4 Работа с ХД в новой версии сервера разделена на несколько шагов: создания решения (solution); подключение к источнику данных (data source); создание Data Source View; создание кубов и размерностей (рассматривается в теме 2); развертывание базы (deployment); администрирование базы.
5 Для выполнения этих действий есть два различных инструментария: 1) разработка производится с использованием SQL Server Business Intelligent Development Studio (Среда разработки интеллектуальных систем предприятия); 2) в то время как сопровождение и администрирование выполняется с помощью SQL Server Management Studio (Среда сопровождения SQL-сервера).
6 1.Создание решения
Вызов SQL серверной среды интеллектуальных систем предприятия
Команда создания нового проекта
Выбор шаблона «Проект аналитических систем»
10 2. Подключение к источнику данных (Data Source)
Команды выбора нового источника данных
Список существующих источников данных
Выбор провайдера для реляционной базы данных типа Access
Поиск имени источника данных (Базы данных - Access)
15 Стандартное окно поиска файла
Окончание подключения к источнику данных. Создание имени источника
Внешний вид папки Solution (Решение)
18 3. Создание Data Source View Под Data Source View понимается срез источника, который будет использоваться для заполнения хранилища, при этом в него могут входить как таблицы, так и представления (view) реляционной базы – источника данных.
Команда на построения среза источника данных
Выбор подключаемого источника данных
Выбор таблиц для включения в срез
Ввод имени подготовленного среза
Вид представления среза в дизайнере
24 4. Подключение дополнительных размерностей
Дополнительные виды размерностей С точки зрения своих возможностей размерности в рассматриваемой версии OLAP-сервера (SQL Server 2005) могут быть: регулярными (Regular); из таблицы фактов (Fact Dimension). ссылочными (Reference); многие-ко-многим (Many-to-Many);
Подключение размерности типа Дата Открытие среза
27 Вид окна «Добавление таблицы»
28 Вид дизайнера с добавленной таблицей Date
29 Вызов команды на построение нового измерения
30 Выбор метода построения измерения
31 Выбор представления
32 Выбор типа измерения
33 Установка соответствия периодов
34 Иерархии подключаемого измерения
Расчет измерения Date
36 Процесс расчета измерения
Просмотр измерения Date Команда на просмотр измерения
38 Просмотр размерности Дата
Добавление размерности из таблицы фактов Добавление новой размерности
40 Выбор типа измерения
41 Выбор таблицы и её атрибутов для измерения
42 Атрибуты, включаемые в измерение
43 Состав измерения и его имя
44 Появилось добавленное измерение
Расчет размерности из таблицы фактов
46 Расчет закончен
Просмотр размерности из таблицы фактов
48 Просмотр добавленной размерности, созданной из таблицы фактов
49 5. Создание куба
Особенности показателей в кубах данных MS SQL Server 2005 Система агрегирования представляет собой внутренний механизм, обеспечивающий управляемую «свертку» данных по иерархиям размерностей. Если не управлять агрегированием, то оно выполняется по умолчанию, то есть свертка показателей производится с использованием функции суммирования снизу вверх (в нашем примере от дней до лет). Управляя этим механизмом, мы можем: изменять функции агрегирования, используемые для свертки данных; изменять порядок свертки (выполнять ее не по всем размерностям); определять, на каких уровнях иерархии будет производиться свертка данных и т. д.
51 Показатели могут быть: аддитивными (additive); полуаддитивными (semiadditive); неаддитивными (nonadditive).
52 Аддитивные показатели Аддитивные показатели, также называемые полноаддитивными, агрегируются со всеми размерностями, включенными в группы показателей. Говоря другими словами (в терминах Microsoft), они пересекаются с любым членом размерности, то есть выбор любого члена любой размерности приводит к пересчету агрегатов показателей.
53 Полуаддитивные показатели Полуаддитивные показатели агрегируются относительно некоторых (не всех) размерностей. Например, показатель, определяющий количество товара на руках, может агрегироваться по географическому признаку, но не агрегироваться по остальным размерностям, поскольку к ним не должен относиться. О таких показателях говорят, что они не пересекаются с некоторыми размерностями. Скажем, агрегирование такого показателя по размерности «время» просто бессмысленно, поскольку нас не интересует, сколько товара было на руках в какой-то период времени.
54 Неаддитивные показатели Неаддитивные показатели не агрегируются по размерностям, но могут быть посчитаны для любой ячейки куба. Например, подсчитываемый показатель, возвращающий процент дохода, не может быть агрегирован из значений процентов своих дочерних ячеек других размерностей.
Особенности сохранения кубов пространство на диске не выделяется под пустые ячейки; выполняется сжатие данных; сложный механизм агрегирования определяет, каким образом будет произведена свертка данных на каждом уровне иерархии размерностей, чтобы при этом не пострадало качество.
Подключение простых размерностей К простым размерностям относятся: размерности, состоящие из одной таблицы (сбалансированные и несбалансированные); размерности, состоящие из нескольких таблиц (сбалансированные и несбалансированные); размерности типа «родитель-потомок».
57 Команда на создание нового куба
58 Выбор источника данных в виде реляционного хранилища
59 Распределение таблиц среза по измерениям и фактам куба
60 Окно определения фактов
61 Сохранение куба
Расчет (процессинг) куба В панели Solution Explorer (Проводник решений) в проекте Analysis Services RTS-Data-2 на кубе RTS-Data-2 (Индекс РТС) щелкните правой кнопкой мыши и затем выберите Process (Процессинг) из контекстного меню, произойдет процессинг куба. В панели Process Cube Main Sale Measures (Процессинг куба Главные показатели сбыта) щелкните Run (Выполнить); выполнится процессинг.
63 Куб создан по именем RTS-Data-2.cube
64 6. Подключение размерности типа «Время и Дата»
Измерение «Дата» можно подключить двумя способами: 1) при построении куба указать, что это временное измерение и 2) добавить измерение к уже построенному кубу. Мы демонстрируем второй способ.
Вид вкладки Dimension Usage (Использование размерности)
Добавление нового измерения
Подключаемое измерение (Дата)
В измерениях появилась Date (Дата)
Выбор типа связи
71 7. Подключение к кубу размерности, созданной из таблицы фактов
Команда на добавление новой размерности
Выбор типа нового измерения
Выбор необходимых атрибутов
В списке измерений появилось вновь созданное (Fact_Dim)
Панель Analysis Services RTS-Data- 2.cube [Design] (Построитель (дизайнер) куба)
Выбор связи нового измерения и факта
После выбора связи пересечение между Fact_Dim и Fact должно стать определенным
Процессинг обновленного куба