Модуль 1. Математические основы баз данных и знаний
Лекция 3 Введение в реляционную модель данных 1. Основные понятия реляционных баз данных. 2. Фундаментальные свойства отношений. 3. Реляционная модель данных.
1. Основные понятия реляционных баз данных Состав понятий: тип данных; домен; атрибут; кортеж; отношение; первичный ключ.
1. Основные понятия реляционных баз данных
Тип данных – множество значений данного типа; набор операций, применимых к значениям типа; способ внешнего представления значений типа. 1. Основные понятия реляционных баз данных
три группы данных в программировании Простые типы данных. Структурированные типы данных. Ссылочные типы данных. 1. Основные понятия реляционных баз данных
Простые типы данных - не обладают внутренней структурой. Логический. Строковый. Численный. Расширения простых типов: Целый. Вещественный. Дата. Время. Денежный. Перечислимый. Интервальный. И т.д. 1. Основные понятия реляционных баз данных
Структурированные типы данных задают сложные структуры данных. Структурированные типы данных конструируются из составляющих элементов, называемых компонентами: Массивы Записи (Структуры) 1. Основные понятия реляционных баз данных
массив – это функция с конечной областью определения. Например - конечное множество натуральных чисел называемое множеством индексов. Отображение из множества А во множество вещественных чисел R задает одномерный вещественный массив. Значение этой функции для некоторого значения индекса есть элемент массива 1. Основные понятия реляционных баз данных
Запись (или структура) – это кортеж из некоторого декартового произведения множеств Запись – это именованый упорядоченный набор элементов r i, каждый из которых принадлежит типу T i Запись r = (r1, r2, …,rn) есть элемент декартового произведения множесть T = T1xT2x…Tn 1. Основные понятия реляционных баз данных
Ссылочный тип данных (указатели) предназначен для обеспечения возможности указания на другие данные. Указатели характерны для языков процедурного типа, в которых есть понятие области памяти для хранения данных. Ссылочный тип данных предназначен для обработки сложных изменяющихся структур, например деревьев, графов, рекурсивных структур. 1. Основные понятия реляционных баз данных
Собственно, для реляционной модели данных тип используемых данных не важен. Требование, чтобы тип данных был простым, нужно понимать так, что в реляционных операциях не должна учитываться внутренняя структура данных. Конечно, должны быть описаны действия, которые можно производить с данными как с единым целым, например, данные числового типа можно складывать, для строк возможна операция конкатенации и т.д. 1. Основные понятия реляционных баз данных
Домен - это подмножество значений некоторого типа данных имеющих определенный смысл. Свойства домена: Домен имеет уникальное имя (в пределах базы данных). Домен определен на некотором простом типе данных или на другом домене. Домен может иметь некоторое логическое условие, позволяющее описать подмножество данных, допустимых для данного домена. Домен несет определенную смысловую нагрузку. 1. Основные понятия реляционных баз данных
Домен - "возраст сотрудника" домен отражает семантику, определенную предметной областью домены ограничивают сравнения 1. Основные понятия реляционных баз данных
Домен Замечание 1. Понятие домена помогает правильно моделировать предметную область. Замечание 2. Не все домены обладают логическим условием, ограничивающим возможные значения домена. Замечание 3. Не всегда очевидно, как задать логическое условие. 1. Основные понятия реляционных баз данных
заголовок (или схема) отношения r (Hr) - конечное множество упорядоченных пар вида, где A - имя атрибута, T - имя некоторого базового типа или ранее определенного домена Кортеж tr, соответствующий заголовку Hr - множество упорядоченных триплетов вида, v – допустимое значение типа данных или домена T. 1. Основные понятия реляционных баз данных
Тело Br отношения r - произвольное множество кортежей tr Значение Vr отношения r – пара множеств Hr и Br Переменная VARr - именованный контейнер, который может содержать любое допустимое значение Vr 1. Основные понятия реляционных баз данных
Схема реляционной базы данных - набор пар, включающий имена и заголовки всех переменных отношения, которые определены в базе данных. Реляционная база данных – набор пар 1. Основные понятия реляционных баз данных
первичный ключ переменной отношения - такое подмножество S множества атрибутов ее заголовка, что в любое время значение первичного ключа (составное, если в состав первичного ключа входит более одного атрибута) в любом кортеже тела отношения отличается от значения первичного ключа в любом другом кортеже тела этого отношения, а никакое собственное подмножество S этим свойством не обладает.
Реляционной базой данных называется набор отношений. Схемой реляционной базы данных называется набор заголовков отношений, входящих в базу данных. 1. Основные понятия реляционных баз данных
Реляционный терминСоответствующий "табличный" термин База данныхНабор таблиц Схема базы данныхНабор заголовков таблиц ОтношениеТаблица Заголовок отношенияЗаголовок таблицы Тело отношенияТело таблицы Атрибут отношенияНаименование столбца таблицы Кортеж отношенияСтрока таблицы Степень (-арность) отношенияКоличество столбцов таблицы Мощность отношенияКоличество строк таблицы Домены и типы данныхТипы данные в ячейках таблицы 1. Основные понятия реляционных баз данных
2. Фундаментальные свойства отношений 1. В отношении нет одинаковых кортежей. 2. Кортежи не упорядочены (сверху вниз). 3. Атрибуты не упорядочены (слева направо). 4. Все значения атрибутов атомарны.
Замечание. не каждая таблица может задавать отношение. Для задания отношения таблица д. иметь простую структуру, в таблице не должно быть одинаковых строк, любой столбец таблицы должен содержать данные только одного типа, все используемые типы данных должны быть простыми. Замечание. Каждое отношение можно считать классом эквивалентности таблиц, для которых выполняются условия: Таблицы имеют одинаковое количество столбцов. Таблицы содержат столбцы с одинаковыми наименованиями. Столбцы с одинаковыми наименованиями содержат данные из одних и тех же доменов. Таблицы имеют одинаковые строки с учетом того, что порядок столбцов может различаться. Все такие таблицы есть различные изображения одного и того же отношения. 2. Фундаментальные свойства отношений
Ненормализованное отношение ОТДЕЛЫ-СЛУЖАЩИЕ
2. Фундаментальные свойства отношений нормализованный вариант отношения ОТДЕЛЫ-СЛУЖАЩИЕ
3. Реляционная модель данных Состав: структурная часть манипуляционная часть целостная часть
3. Реляционная модель данных В структурной части модели фиксируется, что единственной родовой структурой данных, используемой в реляционных БД, является нормализованное n-арное отношение. Определяются понятия доменов, атрибутов, кортежей, заголовка, тела и переменной отношения.
3. Реляционная модель данных Манипуляционная часть модели определяет механизмы манипулирования реляционными БД – реляционную алгебра и реляционное исчисление. Первый механизм базируется на классической теории множеств, а второй – на классическом логическом аппарате исчисления предикатов первого порядка. Основной функцией манипуляционной части реляционной модели является обеспечение меры реляционности любого конкретного языка реляционных БД: язык называется реляционным, если он обладает не меньшей выразительностью и мощностью, чем реляционная алгебра или реляционное исчисление
3. Реляционная модель данных В целостной части реляционной модели данных фиксируются требования целостности. Первое требование - требование целостности сущности (entity integrity). Любая переменная отношения должна обладать первичным ключом Требование целостности по ссылкам (требование целостности внешнего ключа) состоит в том, что для каждого значения внешнего ключа в значении- отношении переменной отношения, на которую указывает ссылка, должен найтись кортеж с таким же значением первичного ключа