Электронная библиотека и электронная коллекция в составе интегрированной информационной среды (проекты АОЦПК и АОКМ) С.Х.Ляпин, А.В.Куковякин ООО «Константа» (Россия, г. Архангельск); Архангельский областной центр повышения квалификации специалистов культуры (АОЦПК) V міжнародна науково–практична конференція «ДОКУМЕНТОЗНАВСТВО. БІБЛІОТЕКОЗНАВСТВО. ІНФОРМАЦІЙНА ДІЯЛЬНІСТЬ: ПРОБЛЕМИ НАУКИ, ОСВІТИ ТА ПРАКТИКИ». Державна академія керівних кадрів культури і мистецтв, Київ, Україна, травня 2008 р.
Содержание T-Libra 6.x: назначение и архитектура Функциональная структура ИС T-Libra: – пользовательский раздел –административный раздел Презентация работы ИС T-Libra v.6.1 Развитие ИС T-Libra Функциональная структура ИС VT-Collection: – пользовательский раздел –административный раздел Презентация работы ИС VT-Collection v.2.0 Развитие ИС VT-Collection Взаимодействие T-Libra и VT-Collection в составе интегрированной среды (проекты АОЦПК и АОКМ).
ИС T-Libra 6.x ® : разработчик и статус программы Специализированное программное обеспечение Информационная система «T-Libra 6.x» для создания многофункциональных электронных библиотек разработано ООО «Константа» (Россия), зарегистрировано в Реестре программ для ЭВМ Федеральной службой по интеллектуальной собственности, патентам и товарным знакам Российской Федерации (Свидетельство от 17 сентября 2007 года).
Назначение ИС T-Libra 6.x ® (1) Создание многофункциональных многоязычных многоплатформенных электронных библиотек в Интернет/Интранет-архитектуре с возможностями: –автоматического импорта и индексации электронных полнотекстовых ресурсов, подготовленных в соответствии с требованиями ИС T Libra 6.x; –автоматизированной подготовки (с использованием специализированных АРМов) электронных полнотекстовых ресурсов различного вида и формата для последующего ввода их в ИС T Libra 6.x; –импорта / экспорта библиографических данных в формате ISO 2709 из существующих MARC-ориентированных АБИС («электронных каталогов») в ИС T Libra 6.x. и обратно;
Назначение ИС T-Libra 6.x ® (2) с возможностями (продолжение): –автоматического пополнения (при импорте полнотекстовых ресурсов) и «ручного» редактирования многоязычного электронного словаря словоформ; –поиска по интегрированному Каталогу с настраиваемыми полями и встроенной в них булевой алгеброй, а также встроенным в функционал одного из полей предметным мультирубрикатором, содержащим библиотечные классификаторы и рубрикаторы (УДК, ББК, ВАК, ГРНТИ и т.д.) в виде баз данных с собственными интерфейсами для их редактирования; –использования для целей хранения и презентации пополняемого файлового хранилища (Депозитария) с файлами произвольного вида и формата и собственным настраиваемым рубрикатором ресурсов;
Назначение ИС T-Libra 6.x ® (3) с возможностями (продолжение): –гибкого тематизируемого многоязычного полнотекстового поиска различного типа и вида с сортировкой, группировкой и различными формами презентации его результатов; –мультимодального расширения (графика, аудио, видео), используемого как для расширения функциональных возможностей ИС T Libra 6.0., так и для взаимодействия и интеграции с другими информационными системами, модулями и оболочками (электронными коллекциями, электронными экспозициями, мультимедиа-энциклопедиями и т.д.).
ИС T-Libra 6.x: архитектура (блок-схема) Браузер (MS IE 6 и выше) Веб-сервер (Apache) CGI-приложение Сервер приложения (объектная среда, бизнес-логика) РСУБД (MySQL) HTTP CGI named pipe ODBC КлиентСервер
ИС T-Libra 6.x: Основные характеристики Трехзвенная клиент-серверная Интернет/Интранет архитектура с «внешней логикой», встроенной в объектно-ориентированный сервер приложения: Web-browser / Web-server + Application Server / Relational DBMS, с протоколами HTTP, CGI, PIPE API, ODBC. Многоплатформенность как в плане независимости от конкретной СУБД, так и от конкретной операционной системы (возможна работа под управлением Windows и Linux). –Примечание: работа в среде Linux планируется начиная с версии 7.x Предметно-ориентированные объекты приложения (сервер приложений) разработаны на объектно-ориентированном языке C++. Для полнотекстового поиска применяется новые структуры прямого и инвертированного индекса, хранящегося в файлах, и более эффективные алгоритмы работы с ним (по сравнению с чистой SQL-версией). В результате существенно повышена скорость поиска (на два порядка).
ИС T-Libra 6.x: функциональная структура Информационная система T-Libra Пользовательский раздел Административный раздел Каталог Депозитарий Полнотекстовый поиск Оператор ресурсов Оператор словаря Администратор поиск ресурсов по каталогу со встроенным мультирубрикатором поиск и извлечение файловых ресурсов по специализированному настраиваемому рубрикатору гибкий параметризируемый поиск по полнотекстовым ресурсам пополнение ИС ресурсами различного типа пополнение и редактирование многоязычного словаря словоформ управление пользователями, назначение прав доступа к ресурсам ИС, настройки ИС
Пользовательский раздел Каталог Поиск по библиографической информации осуществляется с учетом лексико- грамматической парадигматики естественного языка по настраиваемому списку полей. –Стандартный набор полей: Автор, Заглавие, Ключевые слова, Аннотация, Год издания, Предметная область. Пополняется: –а) средствами самой ИС T-Libra (подраздел «Оператор каталога»); –б) с помощью программы импорта из электронных каталогов, поддерживающих стандарты семейства MARC, –в) из специализированных АРМ-ов для обработки внешних ресурсов. Имеется полная и краткая форма поиска (в последней поля Заглавие, Ключевые слова, Аннотация объединены логическим сложением). Булева алгебра (операции логического сложения, умножения, отрицания) включена в структуру формы поиска и функционал соответствующих полей. Поле Предметная область представляет собой настраиваемый мультирубрикатор, включающий набор стандартных классификаторов (УДК, ББК, ВАК, ГРНТИ и др.), а также рубрикатор Депозитарий, создаваемый с учетом интересов конкретного корпоративного пользователя.
Пользовательский раздел Депозитарий Подсистема представляет собой универсальное файловое хранилище информации, и содержит файловые ресурсы любого вида и формата. Имеет собственный настраиваемый рубрикатор ресурсов и позволяет получить как описания ресурсов (метаданные), так и сами электронные ресурсы: полные тексты произведений (статей, сборников статей, учебников, справочников, монографий и т.п.), архивные документы в текстовом и/или графическом формате, аудио, видео и т.д. Подсистема связана в обе стороны с другими подсистемами пользовательского раздела («Каталог» и «Полнотекстовый поиск»), а также с мультимодальными расширениями ИС T-Libra (электронными коллекциями и т.п.).
Пользовательский раздел Полнотекстовый поиск Типы запросов –Абзацно-ориентированный: в произведениях, включенных пользователем в поисковую область («корзина ресурсов»), находит множество абзацев, удовлетворяющих условиям запроса. –Частотно-ориентированный: создает частотно- ранжированный список терминов (имен существительных) из произведения / произведений на заданную глубину с указанием абсолютной и относительной частоты встречаемости термина.
Пользовательский раздел Полнотекстовый поиск Виды абзацно-ориентированных запросов (запросы 1 и 2 ведутся с учетом грамматической парадигмы слова) 1. Простой («однослойный») терминологический. Производится по одному или нескольким терминам. Результат: совокупность релевантных абзацев (включая абзацы сносок и примечаний) из выбранной пользователем «корзины ресурсов». 2. Многослойный терминологический. Производится по нескольким терминам, которые одновременно: – а) принадлежат разным тематическим «слоям» терминов, определяемых пользователем, при этом количество слоев варьируется, – б) находятся на определенном «расстоянии» между собой в пределах авторского абзаца. Результатом запроса является совокупность релевантных абзацев из выбранного произведения, содержащих указанную многослойную терминологическую структуру. 3. Конкорданс (поиск по словосочетанию) Производится по синтагматической структуре (произвольному словосочетанию). Результатом запроса являются авторские абзацы, содержащие именно это словосочетание (выделенное красным цветом в составе предложения, которое в целом выделено синим цветом в составе абзаца).
Каталог Депозитарий Полнотекстовый поиск Папки с файлами Подготовка ресурсов Импорт ресурсов Автоматизированная или «ручная» подготовка ресурсов Автоматический импорт в подсистемы T-Libra Административный раздел, подсистема «Оператор ресурсов» Обобщенная схема импорта ресурсов Словарь
Организация программной среды ИС T-Libra (словарь словоформ) Концептуальная модель Многоязычность: ориентация на унифицированное создание и использование электронных словарей основных европейских языков Многоплановое использование одного и того же словаря: –для обычного библиотечного поиска (с учетом морфологии), –для продвинутых лингвистических, текстологических и других исследований (в составе «виртуальной лаборатории»), Генерация словоизменительной парадигмы, управляемая правилами грамматики (с возможностью изменения этих правил пользователем); Автоматическое пополнение словаря (при импорте текстов) + его «ручное» редактирование с рабочего места Оператора словаря Unicode: –поддержка Unicode при импорте текстов (при создании словаря словоформ); –использование Unicode при экспорте текстов (отображении текста в окне браузера);
Организация словаря Блок-схема организации словаря «Слова» Словоформы Словарь русского языка Словарь украинского языка Словарь немецкого языка Словарь ………… языка Правила
Схема пополнения словаря (автоматически и/или вручную) Правила Парадигма Генерация парадигм, выбор лучшей Корректировка парадигмы «Слова» и словоформы Новые словоформы Оператор
Функциональное расширение ИС T-Libra (семейство информационных систем T-System) T-Libra – функционально-технологическая основа семейства интегрированных информационных систем T-System. Использование архитектуры и функционала T-Libra: –основных модулей административного раздела; –поиска по интегрированному Каталогу; –ресурсов и рубрикатора Депозитария; –результатов Полнотекстового поиска в других специализированных модулях и программных оболочках семейства T-System: –учетно-фондовой системе (библиотечной, музейной, …); –электронном архиве; –электронной тематической коллекции; –электронной интерактивной экспозиции; –виртуальном музее; –мультимедиа-энциклопедии; –исследовательской лаборатории; –образовательной системе.
Два параллельных партнерских проекта (АОЦПК и АОКМ) В рамках реализации Концепции информатизации Архангельской области идут два параллельных, дополняющих друг друга (по ресурсам и сервисам) партнерских проекта в: –Архангельском областном центре повышения квалификации специалистов культуры (АОЦПК), –Архангельском областном краеведческом музее (АОКМ) Их общие черты: –ориентация на создание в каждой из организаций горизонтально интегрированной информационной среды в современной Интернет/Интранет-архитектуре, –использование ресурсных и сервисных возможностей многофункциональной электронной библиотеки с гибким полнотекстовым поиском и мультимодальным расширением, –сотрудничество по совместному созданию цифровых информационных ресурсов (электронная библиотека, электронные коллекции, электронный архив, тематические DVD-фильмы и т.д.)
Горизонтальная интеграция: (АОЦПК) Архангельский областной центр повышения квалификации специалистов культуры Ядро интеграции: –многофункциональная электронная библиотека с гибким многоязычным полнотекстовым поиском и возможностями мультимодального расширения на базе ИС T-Libra 6.x –информационная система для учета мероприятий Расширения информационной среды: –семейство электронных тематических коллекций на базе ИС VT-Collection 2.0 с отделяемыми модулями, сохраняющими основную функциональность серверного варианта –систематизированный информационный массив компьютерных учебно-методических, научно-методических и презентационных DVD-фильмов –региональная БД «Памятники истории и культуры Архангельской области» с отделяемыми пользовательскими модулями –электронный фото-, аудио- и видеоархив сферы культуры –мультимедиа-энциклопедия с отделяемыми пользовательскими модулями, сохраняющими основную функциональность серверного варианта –образовательный сервер для апробации новых форм и дистанционных технологий обучения –виртуальная исследовательская лаборатория гуманитарной направленности
Горизонтальная интеграция: АОКМ Краткое описание ресурсов Коллекции АОКМ (без филиалов) на г.: – ед., в том числе –основной фонд = ед. хр. Археологические коллекции. Этнографические коллекции (культура русских, ненцев, саами, коми), Коллекции предметов православного культа (старопечатные и рукописные книги XVI- XVII вв., ок. 500 ед., иконы храмовые и домовые, церковное облачение) Предметы прикладного искусства. История XX века: фотографии, документы, предметы материальной культуры. Мемориальные предметы, связанные с именами Антония Сийского, Филарета, патриарха Никона, царевны Софьи, Петра I, архиепископа Афанасия, М.В. Ломоносова, Иоанна Кронштадтского, С.Г.Писахова, А.Я.Колотиловой, Ф.А.Абрамова и др. Естественнонаучные коллекции, в том числе плиты с останками животных вендского периода (ок. 550 млн. лет до н.э.), коллекция минералов. Научная библиотека: более книг, журналов, подшивки газет. Научный архив, ок. 25 тыс. кадров микрофильмов документов, более 2,6 тыс. дел, в том числе отчеты сотрудников музея об экспедициях, о формировании музейной сети Архангельской области.
Горизонтальная интеграция: (АОКМ) Архангельский областной краеведческий музей Ядро интеграции: - учетно-фондовая система (на базе АИС «Музей-3»), - музейная электронная библиотека (на базе ИС T-Libra 6.x), - музейные электронные коллекции (на базе ИС VT-Collection 2.0) с отделяемыми пользовательскими модулями Расширения информационной среды: – интерактивная экспозиционная среда с отделяемыми модулями, взаимодействующая с ядром и тематически связанная с постоянной натурной экспозицией «История Поморья с древнейших времен до наших дней» – виртуальный музей («Пространство Ломоносова») – музейный научный архив (аудио-, фото-, видео) – музейно-образовательная среда (тематические материалы для школьников и студентов) – музейно-исследовательская среда (виртуальная лаборатория по историческому краеведению) – систематизированный информационный массив (DVD-фильмы, 3D реконструкции исторических памятников и событий и т.д.)