Хранилища данных В основе концепции ХД лежит идея разделения данных, используемых для оперативной обработки и для решения задач анализа. Хранилище данных.

Презентация:



Advertisements
Похожие презентации
СППР, хранилища данных, OLAP-системы. Технология Data Мining (также называемая Knowledge Discovery in Data) изучает процесс нахождения новых, действительных.
Advertisements

СППР OLAP и OLTP системы OLTP – оперативная транзакционная обработка данных OLAP – оперативная аналитическая обработка данных.
Хранилища данных Причины возникновения Концепция хранилищ данных Применение.
Проектирование баз данных Часть 5. Хранилища данных и OLAP Использование MS SQL Server Analysis Services 2008 для построения хранилищ данных Автор: В.В.
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ СТАВРОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ.
Учебная дисциплина «Хранилища данных» для студентов специальности Бизнес- информатика профиля «Архитектура предприятия» Лекция 2 КОНЦЕПЦИИ.
Хранилища данных Материалы курса «Управление данными» НИУ ВШЭ ̶ Пермь Факультет бизнес-информатики Кафедра информационных технологий в бизнесе Лядова Л.Н.
Базы данных Лекция 02 Технологии информационных хранилищ.
Хранилища данных. 4 Хранилища данных – это процесс сбора, отсеивания и предварительной обработки данных с целью представления результирующей информации.
Жизненный цикл программного обеспечения Подготовил студент 1 курса Лось Павел.
Информационная технология управления. Целью информационной технологии управления является удовлетворение информационных потребностей всех без исключения.
OLAP и OLTP системы OLTP – оперативная транзакционная обработка данных OLAP – оперативная аналитическая обработка данных.
Учебная дисциплина «Базы данных» для студентов специальности «Информационные системы и технологии» ЛЕКЦИЯ 4 ПРОЕКТИРОВАНИЕ БАЗ ДАННЫХ Вопрос.
Жизненный цикл программного обеспечения Лекция 4.
Теория экономических информационных систем Семантические модели данных.
3.3. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ КАК СИСТЕМА Успешное внедрение информационных технологий связано с возможностью их типизации. Конкретная информационная.
Лист 1 Системы поддержки принятия решения БД Информация Большие массивы данных Точные расчеты и детальный анализ Анализ – сложный процесс Анализ Информация.
Лекция 5 Способы конструирования программ. Основы доказательства правильности.
«Объектно-ориентированная логистическая система складского хранения». Научный руководитель: Дерябкин В.П.
Информационные системы и системология План: 1.Что такое информационная система 2.Этапы разработки информационной системы 3.Основные понятия системологии.
Транксрипт:

Хранилища данных В основе концепции ХД лежит идея разделения данных, используемых для оперативной обработки и для решения задач анализа. Хранилище данных - предметно ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений.

Структура СППР с физическим ХД

Структура СППР с виртуальным ХД

Проблемы создания физического ХД: необходимость интеграции данных из неоднородных источников в распределенной среде; потребность в эффективном хранении и обработке очень больших объемов информации; необходимость наличия многоуровневых справочников метаданных; повышенные требования к безопасности данных.

Buтpина данных (ВД) - это упрощенный вариант ХД, содержащий только тематически объединенные данные. Структура СППР с самостоятельными ВД

Структура СППР с ХД и ВД

Архитектура ХД

Состав ХД Детальными являются данные, переносимые непосредственно из ОИД. Они соответствуют элементарным событиям, фиксируемым OL ТР системами. (Haпример, продажи, эксперименты и др.). Принято разделять все данные на измерения и факты. Измерениями называются наборы данных, необходимые для описания событий (например, города, товары, люди и т. п.). Фактами называются данные, отражающие сущность события (например, количество проданного товара, результаты экспериментов и т. п.). На основании детальных данных могут быть получены агрегированные (обобщенные) данные.

Состав ХД Для удобства работы с ХД необходима информация о содержащихся в нем данных. Такая информация называется метаданными (данные о данных). Coгласно концепции Дж. Захмана, метаданные должны отвечать на следующие вопросы что (описание объектов), кто (описание пользователей), где (описание места хранения), как (описание действий), когда (описание времени) и почему (описание причин).

Информационные потоки в ХД Входной поток (Inflow) образуется данными, копируемыми из ОИД в ХД; поток обобщения (Upflow) образуется аrреrированием детальных дaнных и их сохранением в ХД; архивный поток (Downflow) образуется перемещением детальных дaнных, количество обращений к которым снизилось; поток метаданных (MetaFlow) образуется переносом информации о данных в репозиторий данных; выходной поток (Outflow) образуется данными, извлекаемыми пользователями; обратный поток (Feedback Flow) образуется очищенными данными, записываемыми обратно в ОИД.

Оптимизация ХД Для улучшения производительности ХД используют следующие приемы: создание таблиц предварительно агрегированных данных; индексирование (чтобы избежать необходимости просматривать слишком большие объемы данных); хранение данных в отсортированном виде, устраняющем необходимость в процессе "and sort". "денормализация" модели - размещение данных в одной таблице, а не в нескольких, которые необходимо соединять.

Избыточность и денормализация Нисходящая денормализация – избыточные столбцы из родительской таблицы помещаются в дочернюю таблицу Восходящая денормализация (избыточность) – данные из дочерней таблицы помещаются в родительскую таблицу. Внутритабличная денормализация – внутри таблицы создаются избыточные столбцы. (а также Вертикальное и Горизонтальное расщепление.)

Вопросы Что такое хранилище данных? Что такое виртуальное и физическое хранилище данных? Что такое витрина данных? Из чего состоит хранилище данных? Какие потоки данных имеются в хранилище данных? Какие есть приемы оптимизации хранилищ данных? Какие типы денормализации вы знаете?