Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 10 лет назад пользователемЛидия Шуняева
1 Лекция 21 Лекция 21 Логическая и физическая схема организации пространства в документальных БД. Примеры моделей хранения и организации доступа
2 Отличия, обусловленные информационной природой элементов данных Запись базы данных – документ, который задается как набор в общем случае необязательных полей: «форматных» (числовые, символьные и другие величины) и текстовых (переменная длина, композиционная структура) текстовое поле параграф предложение слово Поле - атомарный адресуемый элемент данных с точки зрения хранения Слово - атомарный семантически значимый элемент данных с точки зрения поиска. Семантическая природа текстовых полей: синонимия, полисемия, омонимия, контекстная обусловленность смысла отдельного слова, возможность выразить один смысл многими способами индексы словоформы поля
3 Организация данных в диалоговой системы поиска документов STAIRS (Storage and Information Retrieval System)
4 Организация индексных файлов документов АИПС STAIRS
5 Организация поисковых файлов документов АИПС STAIRS
6 FF N AdrB AdrE Массив документов Индекс Корень … Вершина … … … … … … Лист … … … Организация доступа к документу в ИПС IRBIS Лист
7 Надстройка … Запись N Запись L Индекс Запись 1Метка поля Запись 1 Индекс надстрой ки Запись 2 Ссылка в файл словаря Запись 3 Слово Кол-во документов... … Ссылка в инвертирован ный список Запись 2 Запись 1 Запись 2 Запись 3... … Запись K Инв. списки Инвертированные индексы БД ИПС IRBIS
8 Физическая организация данных в ИПС IRBIS БДИПС IRBIS БД ИПС IRBIS Файлы БД файлы данных и файлы инвертированных структур Экстент 8 последовательных страниц Страница
9 Инвертированные структуры БД Индексные страницы Страницы текстового представления словарных структур Страницы инвертированных списков
10 Заголовок страницы Тип страницы Идентификатор (номер) страницы Идентификатор (номер) следующей страницы Идентификатор (номер) предыдущей страницы Число вхождений, размещенных на странице Длина фиксированной части вхождения
11 Индексные страницы Подзаголовок: число вхождений (указателей), размещенных на странице; номер первой страницы инвертированных списков для множества страниц текстового представления словарных структур, описываемых индексной страницей. Указатели на отдельные страницы текстового представления словарных структур: метка сегмента (для представления общего словаря в виде объединения непересекающихся подмножеств); буква (символ), с которой начинается первое слово на странице; идентификатор (номер страницы).
12 Страницы текстового представления словарных структур Подзаголовок: метка сегмента; номер первой страницы инвертированных списков; количество страниц инвертированных списков; размер свободного пространства; начало первого слова на странице (первые 4 буквы); начало последнего слова на странице (первые 4 буквы). Карта размещения словарных структур: длина слова (текстового выражения словарной структуры); количество документов (или длина инвертированного списка для словарной структуры); идентификатор страницы инвертированных списков, содержащей инвертированный список словарной структуры (по крайней мере, его начало); смещение начала инвертированного списка от начала списка страницы в целом.
13 Страницы инвертированных списков Подзаголовок: метка сегмента (для представления общего словаря в виде объединения непересекающихся подмножеств); номер первой страницы текстового представления словарных структур (для текущей страницы инвертированных списков); количество страниц текстового представления словарных структур (которым соответствует текущая страница инвертированных списков); размер свободного пространства.
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.