Лекция 21 Лекция 21 Логическая и физическая схема организации пространства в документальных БД. Примеры моделей хранения и организации доступа.

Презентация:



Advertisements
Похожие презентации
Статичні структури даних.. 2 Статические данные переменная (массив) имеет имя, по которому к ней можно обращаться размер заранее известен (задается при.
Advertisements

ТЕХНОЛОГИЯ ХРАНЕНИЯ, ПОИСКА И СОРТИРОВКИ ИНФОРМАЦИИ Базы данных.
Физическая архитектура базы данных SQL Server. 2 Типы файлов Файлы данных (data files) –Primary (главный файл) – системные и пользовательские данные –Secondary.
Организация данных в виде отдельных файлов Файл с данными по договорам договора Дата Организация Директор Адрес Телефон Файл с данными по письмам исх/вх.
Текстовый редактор WORD Форматирование текста. Виды форматирования Форматирование символов Форматирование символов Форматирование абзацев Форматирование.
3.1. Назначение онтологий. Информационный поиск..
Физические модели баз данных Файловые структуры, используемые для хранения информации в базах данных.
Построение индексных структур для ключевых характеристик объектов.
Microsoft Office Access Презентация на тему:. Что такое базы данных? Базы данных 1.Это организованная совокупность данных предназначенная для длительного.
Базы данных Access Вводная лекция. Определение базы данных Базы данных - это совокупность тем или иным способом структурированных данных и комплекса аппаратно-программных.
Механизмы поиска в БД Структуры индексов. Основные виды индексов Простые индексы для упорядоченных файлов Вторичные индексы для неупорядоченных файлов.
Задачи проектирования ИПС: Анализ предметной области Определение структуры ИПС Определение видов поиска документов в ИПС Разработка структуры БД для ИПС.
Microsoft Office Access БАЗЫ ДАННЫХ. Что такое базы данных? Базы данных 1.Это организованная совокупность данных предназначенная для длительного хранения.
Базы данных. Системы управления базами данных (СУБД)
Массивы Структура типов данных типы простые структурированные 1.Целые (integer, longint) 2.Вещественные (real) 3.Логические (boolean) 4.Символьные (string,
БАЗЫ ДАННЫХ ( ВВЕДЕНИЕ ). База данных это информационная модель, позволяющая упорядоченно хранить данные о группе объектов, обладающих одинаковым набором.
База данных – информационная модель, позволяющая упорядоченно хранить данные о группе объектов, обладающих одинаковым наборов свойств Базы данных Фактографические.
Лекция 4 Программирование на Паскале. Элементы языка Турбо Паскаль 7.0. Типы данных. Управляющие конструкции.
«Типы данных». Целочисленные типы данных Тип ДиапазонТребуемая память (байт) byte shortint integer word longint
Подготовила: преподаватель информатики Судник Е. В.
Транксрипт:

Лекция 21 Лекция 21 Логическая и физическая схема организации пространства в документальных БД. Примеры моделей хранения и организации доступа

Отличия, обусловленные информационной природой элементов данных Запись базы данных – документ, который задается как набор в общем случае необязательных полей: «форматных» (числовые, символьные и другие величины) и текстовых (переменная длина, композиционная структура) текстовое поле параграф предложение слово Поле - атомарный адресуемый элемент данных с точки зрения хранения Слово - атомарный семантически значимый элемент данных с точки зрения поиска. Семантическая природа текстовых полей: синонимия, полисемия, омонимия, контекстная обусловленность смысла отдельного слова, возможность выразить один смысл многими способами индексы словоформы поля

Организация данных в диалоговой системы поиска документов STAIRS (Storage and Information Retrieval System)

Организация индексных файлов документов АИПС STAIRS

Организация поисковых файлов документов АИПС STAIRS

FF N AdrB AdrE Массив документов Индекс Корень … Вершина … … … … … … Лист … … … Организация доступа к документу в ИПС IRBIS Лист

Надстройка … Запись N Запись L Индекс Запись 1Метка поля Запись 1 Индекс надстрой ки Запись 2 Ссылка в файл словаря Запись 3 Слово Кол-во документов... … Ссылка в инвертирован ный список Запись 2 Запись 1 Запись 2 Запись 3... … Запись K Инв. списки Инвертированные индексы БД ИПС IRBIS

Физическая организация данных в ИПС IRBIS БДИПС IRBIS БД ИПС IRBIS Файлы БД файлы данных и файлы инвертированных структур Экстент 8 последовательных страниц Страница

Инвертированные структуры БД Индексные страницы Страницы текстового представления словарных структур Страницы инвертированных списков

Заголовок страницы Тип страницы Идентификатор (номер) страницы Идентификатор (номер) следующей страницы Идентификатор (номер) предыдущей страницы Число вхождений, размещенных на странице Длина фиксированной части вхождения

Индексные страницы Подзаголовок: число вхождений (указателей), размещенных на странице; номер первой страницы инвертированных списков для множества страниц текстового представления словарных структур, описываемых индексной страницей. Указатели на отдельные страницы текстового представления словарных структур: метка сегмента (для представления общего словаря в виде объединения непересекающихся подмножеств); буква (символ), с которой начинается первое слово на странице; идентификатор (номер страницы).

Страницы текстового представления словарных структур Подзаголовок: метка сегмента; номер первой страницы инвертированных списков; количество страниц инвертированных списков; размер свободного пространства; начало первого слова на странице (первые 4 буквы); начало последнего слова на странице (первые 4 буквы). Карта размещения словарных структур: длина слова (текстового выражения словарной структуры); количество документов (или длина инвертированного списка для словарной структуры); идентификатор страницы инвертированных списков, содержащей инвертированный список словарной структуры (по крайней мере, его начало); смещение начала инвертированного списка от начала списка страницы в целом.

Страницы инвертированных списков Подзаголовок: метка сегмента (для представления общего словаря в виде объединения непересекающихся подмножеств); номер первой страницы текстового представления словарных структур (для текущей страницы инвертированных списков); количество страниц текстового представления словарных структур (которым соответствует текущая страница инвертированных списков); размер свободного пространства.