Выполнила студентка группы ТУ-501 Полозова Ю.О
Виды документальных информационных систем Документальная информационная система (ДИС) единое хранилище документов с инструментарием поиска и выдачи необходимых пользователю документов. В зависимости от особенностей реализации хранилища документов и механизмов поиска, ДИС можно разделить на 2 группы: 1. системы на основе индексирования; 2. семантически-навигационные системы.
Классификационные информационно-поисковые языки Информационно-поисковые каталоги основаны на классификации сведений по определенной предметной области и исторически были первыми системами информационного поиска документов в библиотечном и архивном деле, возникнув еще в средние века по сложившейся тогда схеме разделения наук и искусств. Классификация - это группировка объектов по признакам.
Основные направления развития систем классификационного индексирования документов
Дескрипторные информационно-поисковые языки В основе построения дескрипторных ИПЯ лежит принцип координатного индексирования, который предполагает, что основное смысловое содержание документа может быть выражено списком ключевых слов. К ключевым словам относятся так называемые полнозначные слова- существительные, прилагательные, глаголы, наречия, числительные, местоимения. Ключевыми словами не могут быть: o предлоги, o союзы, o связки, o частицы.
Основными элементами ДИПЯ являются : словарь лексических единиц; правила применения ИПЯ (грамматика), определяющие процедуру перевода текстов документов и запросов с естественного языка на ИПЯ; правила построения ИПЯ.
Словари лексических единиц делятся на две группы: 1. основные лексические словари, составляющие лексику ИПЯ; 2. морфологические словари, обеспечивающие морфологический анализ и нормализацию слов. В качестве лексических единиц основных словарей используются ключевые слова, словосочетания и дескрипторы. Дескриптор это имя класса синонимов. В качестве дескрипторов могут быть использованы код, слово или словосочетание.
Системы индексирования : Система индексирования (СИ) совокупность методов и средств перевода текстов с естественного языка на ИПЯ в соответствии с заданным набором словарей лексических единиц и с правилами применения ИПЯ классификация систем индексирования: По степени автоматизации процесса индексирования выделяют системы: (ручного индексирования; автоматического индексирования, автоматизированного индексирования.) По степени контролируемости различают системы: (без словаря; с жестким словарем; со свободным словарем) По характеру алгоритма отбора слов текста выделяют системы:(с последовательным просмотром текста, с эвристическими процедурами выбора слов текста, со статистическими процедурами выбора слов) По характеру лексикографического контроля различают системы:(без лексикографического контроля; с полным контролем; с промежуточным контролем.)
По характеру морфологического анализа слов различают системы: (с использованием морфологических словарей; с использованием основных лексических словарей; с использованием морфологического анализа с усечением слов.)