Нормализация реляционной модели данных По учебнику Семакин Н.Г., Хеннер Е.К. Информационные системы и модели © 2006 Медведев Л.Н.

Презентация:



Advertisements
Похожие презентации
Нормализация реляционной модели данных. Реляционная модель данных – это множество взаимосвязанных отношений. Простейший вариант реляционной модели – одно.
Advertisements

Проектирование баз данных сложная задача. Теорию реляционных баз данных в 70 годах XX века разработал Е. Кодд. Сущность его теории сводится к приведению.
Расширение модели данных (трехтабличная БД) По учебнику Семакин Н.Г., Хеннер Е.К.Информационные системы и модели © 2006 Медведев Л.Н.
Нормализация таблиц реляционной базы данных © Панова И.В
ПОСТРОЕНИЕ ДЕКОМПОЗИЦИИ, УДОВЛЕТВОРЯЮЩЕЙ ТРЕБОВАНИЯМ 3НФ Синтетический подход. Часть 1.
Виды моделей данных. Ядром любой базы данных является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности.
ВИДЫ МОДЕЛЕЙ ДАННЫХ. Ядром любой базы данных является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности.
Нормализация данных В IDEF1X (дополнительный материал к лекции по информационному моделированию с использованием методологии IDEF1X)
Нормализация данных В IDEF1X (дополнительный материал к лекции по информационному моделированию с использованием методологии IDEF1X)
Базы данных Microsoft Access. Основные понятия База данных (БД) База данных (БД) – совокупность сведений о конкретных объектах реального мира в какой-либо.
БАЗА ДАННЫХ – ОСНОВА ИНФОРМАЦИОННОЙ СИСТЕМЫ ТЕХНОЛОГИЯ ИСПЛЬЗОВАНИЯ И РАЗРАБОТКА ИНФОРМАЦИОННЫХ СИСТЕМ.
Завершаем построение модели данных. 2 Осталось немного Приведем БД в окончательное соответствие с инфологической моделью, изображенной на следующем слайде.
Хранение, поиск и сортировка информации Базы данных и системы управления базами данных(СУБД)
Базы данных Реляционная база данных MS Access. Повторение База данных организованная совокупность данных из какой-либо предметной области, предназначенная.
Разбор проектирования БД «Успеваемость» § 15. Реляционная модель данных 1 Базы данных 11 класс.
Запросы По учебнику Семакин Н.Г и Хеннер Е.К. «Информационные системы и модели» Подготовил Медведев Л.Н. © 2006.
Реляционная модель – это особый метод рассмотрения данных, содержащий данные в виде таблиц, способов работы и манипуляции с ними в виде связей. структура,
Базы данных и информационные системы. База данных (БД) совокупность определенным образом организованной информации на какую-то тему (в рамках некоторой.
ЛЕКЦИЯ 2 ОСНОВЫ РЕЛЯЦИОННОЙ АЛГЕБРЫ Вопрос 1. Основные операции над отношениями в реляционных базах данных. Вопрос 2. Нормализация реляционных баз данных.
Базы данных База данных (БД) – совокупность хранящихся взаимосвязанных данных, организованных по определенным правилам. БД служат для хранения и поиска.
Транксрипт:

Нормализация реляционной модели данных По учебнику Семакин Н.Г., Хеннер Е.К. Информационные системы и модели © 2006 Медведев Л.Н.

Реляционная модель данных это множество взаимосвязанных отношений

Постановка задачи Построить БД успеваемости учеников в классе Интересуют четвертные и годовые оценки по всем учебным предметам В БД надо хранить адреса учеников Чтобы отличать мальчиков от девочек, надо указывать пол ученика

Решение в лоб Отношение, включающее в себя все перечисленные данные, будет следующим: УСПЕВАЕМОСТЬ (ФАМИЛИЯ, ИМЯ, ПРЕДМЕТ, ПОЛ, АДРЕС, 1ЧЕТВ, 2_ЧЕТВ, 3_ЧЕТВ, 4_ЧЕТВ, ГОД)

Критика простого решения Недостаток хранения данных в таком виде - это их избыточность. Избыточность - это многократное повторение одних и тех же данных. Она ведет к лишнему расходу памяти компьютера. При вводе повторяющихся значений в каких-то строках могут быть ошибки. Например, по-разному записан один и тот же адрес в нескольких местах. Такая ситуация называется противоречивостью данных.

Решение проблем - нормализация Решением этих проблем является разбиение данного отношения на два, т.е. переход от однотабличной модели к двухтабличной.

Практическое решение УЧЕНИКИ (НОМЕР_УЧ, ФАМИЛИЯ, ИМЯ, ПОЛ, АДРЕС) УСПЕВАЕМОСТЬ (НОМЕР УЧ, ПРЕДМЕТ, 1 ЧЕТВ, 2 ЧЕТВ, 3 ЧЕТВ, 4 ЧЕТВ, ГОД) Связь отношений имеет тип «один-ко-многим» и осуществляется через общее поле НОМЕР_УЧ. В таблице УЧЕНИКИ это поле - первичный ключ. В таблице УСПЕВАЕМОСТЬ оно - в составном ключе. Следовательно, конкретное значение этого поля в первой таблице может присутствовать только в одной записи, а во второй во множестве записей.

Основная цель нормализации - … … избавление от избыточности данных. В идеале не избыточная база данных должна хранить каждый факт в одном экземпляре. Для каждого ученика его атрибуты: ФАМИЛИЯ, ИМЯ, ПОЛ, АДРЕС будут заноситься в базу однократно. Если значения каких-то атрибутов изменятся, - их можно легко исправить. Пример: изменился адрес ученика. В первом варианте структуры данных его придется переписывать многократно. В окончательном варианте это нужно будет сделать один раз.

Первая нормальная форма Отношение находится в первой нормальной форме, если все его поля являются атомарными. Атомарное поле далее не делится. Пример: объединение в одно поле «ФИО» фамилии, имени и отчества человека нарушает принцип атомарности. Понятие атомарности относительно. Пример: если в приложениях не потребуется отдельной обработки деталей адреса конторы, то адрес можно не разбивать на составляющие и считать его атомарным.

Вторая нормальная форма Отношение находится во второй нормальной форме, если оно находится в первой нормальной форме, и все его неключевые поля полностью функционально зависят от первичного ключа. Значение неключевого поля в каждой записи однозначно связано со значением ключа этой записи. Отношения УЧЕНИКИ и УСПЕВАЕМОСТЬ обладают этим свойством. У данного ученика (ключ: НОМЕР УЧ.) определенный адрес, фамилия, дата рождения и пр. У данного ученика по данному предмету (ключ: НОМЕР УЧ.+ПРЕДМЕТ) определенные оценки за четверти и за год.

Пример отсутствия функциональной зависимости: значение поля 1 ЧЕТВ не зависит от поля АДРЕС. У данного ученика может измениться АДРЕС, но это не ведет к изменению оценки за 1-ю четверть по математике.

Третья нормальная форма Требование: удовлетворение второй нормальной форме и отсутствие в отношении полей, транзитивно зависимых от ключа. Транзитивной зависимостью между полями А и В называется зависимость через третье поле С: А С В. Например, если бы в отношении УЧЕНИКИ и присутствовало поле РАЙОН (города, где живет ученик), то имела бы место транзитивная зависимость. Район однозначно связан с адресом, поэтому транзитивность следующая: НОМЕР_УЧ АДРЕС РАЙОН

В построенных нами отношениях транзитивных зависимостей нет, поэтому полученная нами двухтабличная модель данных удовлетворяет требованию третьей нормальной формы.

Коротко о главном Нормализация отношений в реляционной модели данных исключает избыточность и противоречивость данных. Структура реляционной базы данных должна удовлетворять требованиям третьей нормальной формы: все поля в отношениях должны быть атомарными; все неключевые поля должны полностью функционально зависеть от первичного ключа; должны отсутствовать транзитивные зависимости.