Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 9 лет назад пользователемЮлия Бернова
1 Выполнила студентка группы ТУ-501 Полозова Ю.О
2 Виды документальных информационных систем Документальная информационная система (ДИС) единое хранилище документов с инструментарием поиска и выдачи необходимых пользователю документов. В зависимости от особенностей реализации хранилища документов и механизмов поиска, ДИС можно разделить на 2 группы: 1. системы на основе индексирования; 2. семантически-навигационные системы.
3 Классификационные информационно-поисковые языки Информационно-поисковые каталоги основаны на классификации сведений по определенной предметной области и исторически были первыми системами информационного поиска документов в библиотечном и архивном деле, возникнув еще в средние века по сложившейся тогда схеме разделения наук и искусств. Классификация - это группировка объектов по признакам.
4 Основные направления развития систем классификационного индексирования документов
5 Дескрипторные информационно-поисковые языки В основе построения дескрипторных ИПЯ лежит принцип координатного индексирования, который предполагает, что основное смысловое содержание документа может быть выражено списком ключевых слов. К ключевым словам относятся так называемые полнозначные слова- существительные, прилагательные, глаголы, наречия, числительные, местоимения. Ключевыми словами не могут быть: o предлоги, o союзы, o связки, o частицы.
6 Основными элементами ДИПЯ являются : словарь лексических единиц; правила применения ИПЯ (грамматика), определяющие процедуру перевода текстов документов и запросов с естественного языка на ИПЯ; правила построения ИПЯ.
7 Словари лексических единиц делятся на две группы: 1. основные лексические словари, составляющие лексику ИПЯ; 2. морфологические словари, обеспечивающие морфологический анализ и нормализацию слов. В качестве лексических единиц основных словарей используются ключевые слова, словосочетания и дескрипторы. Дескриптор это имя класса синонимов. В качестве дескрипторов могут быть использованы код, слово или словосочетание.
8 Системы индексирования : Система индексирования (СИ) совокупность методов и средств перевода текстов с естественного языка на ИПЯ в соответствии с заданным набором словарей лексических единиц и с правилами применения ИПЯ классификация систем индексирования: По степени автоматизации процесса индексирования выделяют системы: (ручного индексирования; автоматического индексирования, автоматизированного индексирования.) По степени контролируемости различают системы: (без словаря; с жестким словарем; со свободным словарем) По характеру алгоритма отбора слов текста выделяют системы:(с последовательным просмотром текста, с эвристическими процедурами выбора слов текста, со статистическими процедурами выбора слов) По характеру лексикографического контроля различают системы:(без лексикографического контроля; с полным контролем; с промежуточным контролем.)
9 По характеру морфологического анализа слов различают системы: (с использованием морфологических словарей; с использованием основных лексических словарей; с использованием морфологического анализа с усечением слов.)
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.