Информационная система T-Libra (v.6.х) для создания многофункциональных электронных библиотек С.Х.Ляпин, А.В.Куковякин ООО «Константа» (Архангельск, Россия) Март 2007
Назначение ИС T-Libra Создание многофункциональных многоязычных электронных библиотек в Интернет/Интранет- архитектуре с возможностями автоматизированного импорта информации, поиска по каталогу со встроенным мультирубрикатором, гибкого параметризируемого полнотекстового поиска и мультимодального расширения. Функционирование в качестве технической платформы и ресурсной базы для создания многоцелевых информационных сред для интеграции с другими специализированными системами (учетно-фондовыми, тематическими коллекциями, обучающими программными оболочками, виртуальными лабораториями и т.д.).
Архитектура ИС T-Libra (v.6.x) Браузер (MS IE 6 и выше) Веб-сервер (Apache) CGI-приложение Сервер приложения (объектная среда, бизнес-логика) РСУБД (MySQL) HTTP CGI named pipe ODBC КлиентСервер
Архитектура ИС T-Libra (v.6.x) Основные характеристики Трехзвенная Интернет/Интранет архитектура с «внешней логикой», встроенной в объектно-ориентированный сервер приложения: Web-browser / Web-server + Application Server / Relational DBMS, с протоколами HTTP, CGI, PIPE API, ODBC. Многоплатформенность как в плане независимости от конкретной СУБД, так и от конкретной операционной системы (возможна работа под управлением Windows и Linux). Предметно-ориентированные объекты приложения разработаны на объектно-ориентированном языке C++. Для полнотекстового поиска применяется новая структура инвертированного индекса, хранящегося в файлах, и более эффективные алгоритмы работы с ним (по сравнению с чистой SQL-версией). В результате существенно повышена скорость поиска (на два порядка).
Функциональная структура Информационная система T-Libra Пользовательский раздел Административный раздел Каталог Депозитарий Полнотекстовый поиск Оператор ресурсов Оператор словаря Администратор поиск ресурсов по каталогу со встроенным мультирубрикатором поиск и извлечение файловых ресурсов по специализированному настраиваемому рубрикатору гибкий параметризируемый поиск по полнотекстовым ресурсам пополнение ИС ресурсами различного типа пополнение и редактирование многоязычного словаря словоформ управление пользователями, назначение прав доступа к ресурсам ИС, настройки ИС
Пользовательский раздел Форма запроса по каталогу
Пользовательский раздел Каталог Поиск по библиографической информации осуществляется с учетом лексико-грамматической парадигматики естественного языка по 8-ми полям: Автор, Заглавие, Ключевые слова, Аннотация, Год издания, Предметная область, Библиотечные фонды, Носитель информации. Пополняется с помощью программ импорта из любых электронных каталогов, поддерживающих стандарты семейства MARC, или из библиографических файлов-описаний, создаваемых пользователем. Имеется полная и краткая форма поиска (в последней поля Заглавие, Ключевые слова, Аннотация объединены логическим сложением). Булева алгебра (операции логического сложения, умножения, отрицания) включена в функционал соответствующих полей и структуру формы поиска. Поле Предметная область представляет собой настраиваемый мультирубрикатор, включающий набор стандартных классификаторов (УДК, ББК, ВАК, ГРНТИ), а также рубрикатор Депозитарий, создаваемый с учетом интересов конкретного корпоративного пользователя.
Пользовательский раздел Депозитарий Подсистема представляет собой универсальное файловое хранилище информации ИС T-Libra, и содержит файловые ресурсы любого формата. Имеет собственный настраиваемый рубрикатор ресурсов и позволяет получить сначала описания ресурсов (метаданные), а затем и сами электронные ресурсы: полные тексты (учебников, учебных пособий, справочников, монографий и т.п.), архивные документы в графическом формате, аудио-, видео файлы и т.д. Подсистема связана в обе стороны с другими подсистемами пользовательского раздела T-Libra (Каталог и Полнотекстовый поиск), а также с мультимодальными расширениями ИС T-Libra.
Пользовательский раздел Полнотекстовый поиск Типы запросов –Абзацно-ориентированный: в произведениях, включенных пользователем в поисковую область («корзина ресурсов»), находит множество абзацев, удовлетворяющих условиям запроса. –Частотно-ориентированный: создает частотно- ранжированный список терминов (имен существительных) из произведения / произведений на заданную пользователем глубину ранжирования с указанием абсолютной и относительной частоты встречаемости термина.
Пользовательский раздел Полнотекстовый поиск Виды абзацно-ориентированных запросов: Простой («однослойный») терминологический. Производится по одному или нескольким терминам. Результат: совокупность релевантных абзацев (включая абзацы сносок и примечаний) из выбранной пользователем «корзины ресурсов». Поиск ведется с учетом лексико-грамматической парадигмы слова. Многослойный терминологический. Производится по нескольким терминам, которые одновременно: – а) принадлежат разным тематическим «слоям» терминов, определяемых пользователем, при этом количество слоев варьируется и – б) находятся на определенном «расстоянии» между собой в пределах авторского абзаца. Результатом запроса является совокупность абзацев из выбранного произведения, содержащих указанную многослойную терминологическую структуру. Конкорданс (поиск по словосочетанию) Производится по произвольному словосочетанию. Результатом запроса являются авторские абзацы, содержащие именно это словосочетание.
Пользовательский раздел Полнотекстовый поиск Виды частотно-ориентированных запросов: Абсолютный частотный –Создает частотно-ранжированный список слов (существительных, приведенных к нормальной форме) по «корзине ресурсов» (произведению или произведениям). Результатом запроса является таблица, содержащая столбец с частотно- ранжированным списком слов, а также столбцы с указанием абсолютной и относительной частоты встречаемости слова (в промилле). Глубина ранжирования может варьироваться пользователем. Относительный частотный –Для указанного пользователем: а) опорного термина и б) произведения или совокупности произведений запрос сначала выбирает те абзацы, которые содержат этот термин, а затем производит на заданную глубину частотное ранжирование существительных, содержащихся в выбранном подмножестве абзацев. –Запрос позволяет эксплицировать терминологические поля, соотнесенные с термином, выбранном в качестве опорного (последний в итоговой таблице выделен полужирным шрифтом).
Форма запроса («корзина» ресурсов, параметры) Пользовательский раздел, подсистема «Полнотекстовый поиск», запрос «Многослойный терминологический»
Запрос «Многослойный терминологический» Результат запроса (презентация одного из абзацев)
Пользовательский раздел, подсистема «Полнотекстовый поиск», запрос «Многослойный терминологический» Описание предыдущего слайда: Найден удовлетворяющий условиям запроса абзац из произведения М.В.Ломоносова «Письмо о пользе стекла». Вверху слайда указано это произведение, имеется возможность его репрезентации в виде файла (из Депозитария). Поля «Оценка абзаца» и «Комментарий» заполняются пользователем для последующей генерации итогового суммарного файла с выбранными абзацами. Возможен выбор выделения терминов либо только цветом шрифта (синим – всех тех, которые были введены пользователем в форму запроса, красным – тех, которые удовлетворяют дополнительным условиям поиска), либо дополнительно еще и цветом фона. Результат запроса (презентация одного из абзацев)
Результат запроса (словосочетание «ценность личности») Пользовательский раздел, подсистема «Полнотекстовый поиск», запрос «Конкорданс»
Пользовательский раздел, подсистема «Полнотекстовый поиск», запрос «Абсолютный частотный» Форма и результат запроса по «корзине» ресурсов
Пользовательский раздел, подсистема «Полнотекстовый поиск», запрос «Относительный частотный» Форма и результат запроса по «корзине» ресурсов (относительно термина «стекло»)
Административный раздел, подсистема «Оператор ресурсов» Меню подсистемы
Каталог Депозитарий Полнотекстовый поиск Папки с файлами Подготовка ресурсов Импорт ресурсов Автоматизированная или ручная подготовка ресурсов Автоматический импорт во все подсистемы T-Libra Административный раздел, подсистема «Оператор ресурсов» Схема импорта ресурсов
Административный раздел, подсистема «Оператор словаря» Форма генерирования/редактирования парадигмы
Административный раздел, подсистема «Администратор» Назначение прав доступа пользователей к ресурсам
Функциональное расширение ИС T-Libra (семейство информационных систем T-System) ИС T-Libra – общая функциональная и технологическая основа семейства интегрированных информационных систем T-System. Использование архитектуры и функционала T-Libra, а именно: –основных модулей административного раздела, –поиска по интегрированному Каталогу, –ресурсов Депозитария, –результатов Полнотекстового поиска в других специализированных модулях и программных оболочках семейства T-System: –учетно-фондовой системе, –электронном архиве, –электронной тематической коллекции, –электронной интерактивной экспозиции, –виртуальном музее, –мультимедийной энциклопедии, –исследовательской лаборатории, –образовательном модуле, –и т.д.
Публикации С.Х.Ляпин, А.В.Куковякин. Концепт-ориентированный поиск в электронной полнотекстовой библиотеке с мультимодальным расширением // Труды 6-й Всеросс. науч. конф. RCDL2004, Пущино, 29 сент. - 1 окт г. - С , Ляпин С.Х., Куковякин А.В. Методология и технология создания многоцелевой информационной среды T-System на базе электронной библиотеки с гибким полнотекстовым поиском // Труды Седьмой Всероссийской научной конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции", RCDL'2005, Ярославль, 4-6 окт г. – Ярославль: Изд-во ЯрГУ, 2005, см. также в: Ляпин С.Х., Куковякин А.В. Гибкий поиск и его модификации в многофункциональной информационной среде T-System // Материалы международной конференции «EVA-2005, Москва», 28 ноября - 02 декабря 2005 г., г. Москва, Всероссийская государственная библиотека иностранной литературы им. М.И.Рудомино, Поисковая система Yandex по запросу «T-Libra» выдает (на март 2007 года) около 20 релевантных ссылок.
Контакты ООО «Константа»: Россия, , г. Архангельск, а/я Представитель на Украине: Специализированный центр ООО «БАЛИ», Украина, 04107, г. Киев, ул. Отто Шмидта, 26Б,