М.И. Скорик Презентация на тему: «Виды документальных информационных систем»
Особенностью документальных ИПС является то, что в их функции включаются задачи информационного оповещения пользователей по всем новым поступающим в систему документам, соответствующим информационным потребностям пользователя. Задачи информационного оповещения решаются На основе отображения в поисковое пространство информационных потребностей пользователя в виде так называемых поисковых профилей пользователя (ППП). ИС по мере поступления новых документов сравнивает их образцы с ППП пользователей и принимает решение об оповещении.
Поисковое пространство, отображающее поисковые образы документов и реализующее информационный поиск документов строятся на основе языков документальных баз данных, которые называются информационно-поисковыми языками (ИПЯ). Информационно-поисковый язык представляет собой формализованную семантическую систему, предназначенную для выражения содержания документа и запросов по поиску документов. По аналогии с языками баз данных фактографических систем ИПЯ можно разделить на структурную и манипуляционную составляющие.
1. Структурная составляющая ИПЯ документальных ИПС на основе индексирования реализуется индексными указателями в форме информационно-поисковых каталогов, тезаурусов и генеральных указателей. 2. Структурная составляющая ИПЯ семантически- навигационных систем реализуется в виде техники смысловых отсылок в тестах документов и специальном навигационном интерфейсе по ним и в настоящее время представлена гипертекстовыми технологиями.
Тезаурус представляет собой специальным образом организованную совокупность основных лексических единиц предметной области (словарь терминов) и описание парадигматических отношений между ними. Парадигматические отношения выражаются семантическими отношениями между элементами словаря, не зависящими от контекста. Независимость от контекста означает абстрагированность смысловых отношений, например, род-вид, предмет-целое, субъект-объект-средство-место-время действия. Так же как и в информационно-поисковых каталогах, в системах не основе тезаурусов в информационно-поисковое пространство отображается не весь текст документа, а лишь смысловое содержание документа. Генеральный указатель (глобальный словарь-индекс) представляет собой перечисление всех слов (словоформ), имеющихся в документах хранилища, с указанием местонахождения каждого слова (N документа–N абзаца–N предложения – Nслова). Индексирование нового документа в таких системах через дополнение координатных отсылок тех словоформ генерального указателя, которые присутствуют в новом документе. Так как поисковое пространство в таких системах отражает полностью весь текст документа, то такие системы получили название полнотекстовых ИПС.
В дескрипторных языках документы и запросы представляются наборами некоторых лексических единиц (слов, словосочетаний, терминов) – дескрипторов, не имеющих между собой связей, или как говорят, не имеющих грамматики. Таким образом, каждый документ представлен некоторым набором дескрипторов. Поиск осуществляется через поиск документов с подходящим набором дескрипторов. Такие языки применяются, прежде всего, в полнотекстовых системах. Семантические языки содержат грамматические и семантические конструкции для описания смыслового содержания документов и запросов. Все многообразие семантических языков подразделяется на две группы: - предикатные языки; - реляционные языки