Вопросы интеграции библиотек, архивов и музеев по научному наследию Работа поддержана грантом РФФИ а А.Б. Антопольский, д.т.н. МСЦ РАН
Цель интеграции В интегрированной системе научного наследия должны быть обеспечены: навигация пользователя и сквозной поиск объектов научного и, шире, культурного наследия в фондах различных институтов памяти; единая система доставки пользователям и визуализации электронных копий объектов.
Предпосылки интеграции Процессы хранения и обработки объектов культурного наследия в институтах памяти существенно пересекаются. Сведения, или артефакты (в том числе документы), относящиеся к персоне, событию, учреждению, территории или другой сущности можно найти в ресурсах разных институтов памяти. Исследователи вынуждены дублировать свои запросы, обращаясь к различным фондам
Препятствия интеграции Главное препятствие - различие в принципах, целях и задачах сбора и хранения объектов научного наследия в разных институтах памяти, что выражается в различных способах организации фондов, учета и каталогизации этих объектов. Поэтому стандарты метаданных существенно различаются для библиотек, архивов и музеев Другие препятствия -ведомственная разобщенность, отсутствие систем управления и финансирования для комплексных проектов такого рода
Международный опыт интеграции ATHENA собирает и объединяет (агрегирует) информационные ресурсы европейских музеев, библиотек, архивов и передает их в EUROPEANA для публикации. К началу 2011 года EUROPEANA уже предоставила открытый доступ к 14 миллионам информационных ресурсов по культуре информационных ресурсов поступило в EUROPEANA через проект ATHENA, который стал крупнейшим агрегатором информационных ресурсов для EUROPEANA
Российский опыт Президентская библиотека и ее региональные филиалы; Участие в проектах ATHENA, MINERVA и MINERVA PLUS – Центр ПИК Система Ярославского университета; Система компании Альтсофт (Электронная энциклопедия региона, Виртуальный музей Гулага); Журнал «Цифровое наследие»; Опыт НПБ им. К.Д. Ушинского
Архитектура интегрированных систем централизованное хранение и документов и метаданных. Примеры – Всемирная цифровая библиотека, Президентская библиотека им. Б.Н. Ельцина; распределенное хранение документов и централизованное хранение метаданных. Примеры – EUROPEANA, открытые архивы, использующие протокол OAI-PMH;. распределенное хранение и документов и метаданных. Примеры – АРБИКОН и другие системы, использующие протокол Z.39.50
Функциональность распределенной системы (на примере ЭБ ННР ) Доступ к ресурсам – –Навигация по иерархической классификации –Нормированный поиск по атрибутам информационных объектов –Лексический (ненормированный) поиск по наименованиям и другим текстовым реквизитам метаданных –Лексический поиск по полным текстам документов Управление ресурсом Формирование метаданных, включая индексирование, классификацию, фиксацию DRM; Управление метаданными и словарями, их создание, поддержка, модификация; Управление участниками Управление цифровой библиотекой - управление коллекциями, группами пользователей, членством; Обеспечение информационной безопасности Системное администрирование Ведение каталога ссылок на смежные российские проекты Мониторинг использования ЭБ – сбор статистики, ведение гостевых книг и форумов.
Системы метаданных библиотек МАRC в разных модификациях METS - Metadata Encoding and Transmission Standard MODS - Metadata Object Description Schema Внутренние форматы АБИС
Архивные стандарты метаданных EAD - Encoded Archival Description ISAD(G)- General International Standard Archival Description, Second Edition. ISAAR (CPF) International standard archival authority record for corporate bodies, persons and families, Second Edition
Музейные стандарты метаданных CDWA Categories for the of Works of Art (Категории для произведений искусства), разработка Getty Research Institute. MUSEUMDAT Fachgruppe Dokumentation im Deutschen Museumsbund Institut fur Museumsforschung SMB-PK Zuse-Institut Berlin. Формат для агрегирования (сбора) данных (XML схема), оптимизированный для поиска и публикации на музейных порталах, предназначен для автоматического сбора ключевых данных. OBJECT ID Стандарт для описания объектов культуры. Разработан в результате сотрудничества музейного сообщества, правоохранительных органов, таможни, коммерческих структур, страховых агентств и оценщиков произведений искусства и древностей. SPECTRUM Разработчик - The UK Museum Documentation Standard, 3rd Edition (Version 3.1). Стандарт для музейной документации и управления коллекциями.
Универсальные и обобщенные системы метаданных Dublin Core V-card (метаданные для персон и учреждений) CIDOC-CRM Conceptual Reference Model41 Концептуальная образцовая модель CIDOC, которая обеспечивает расширяемую онтологию для концепций и информации по культурному наследию и музейной документации. VRA Разработчик - Visual Resources Associations Data Standards Committee (Комитет стандартов данных Ассоциации визуальных ресурсов) Набор элементов метаданных Набор элементов дает возможность организации категорий описания произведений визуальной культуры, а также изображений. LIDO Lightweight Information Describing Objects (облегченный стандарт информации для описания объектов), разработчик - Европейская Комиссия ATHENA44. Описание и агрегирование ресурсов музеев, библиотек, архивов; совмещение схем метаданных в сфере культуры. LIDO был обнародован и одобрен на ежегодном заседании CIDOC, которое состоялось на конференции международного комитета музеев ICOM в ноябре 2010 года.
Принципы формирования логической структуры интегрированных систем Устанавливается единый список сущностей Каждый информационный объект относится к определенной сущности. Устанавливаются наборы метаданных по каждой сущности – обязательные и факультативные На обязательных метаданных должны строиться навигация и атрибутный поиск. Количество обязательных метаданных для каждой сущности должно быть невелико - в пределах 3-5 признаков. Обязательные метаданные должны совпадать с метаданными систем поставщиков Навигация и атрибутный поиск обычно дополняется лексическим поиском по текстовым объектам
Перечень базовых сущностей интегрированной системы Европейские рекомендации предлагают следующий список сущностей для информационных объектов: Тексты (электронные или на бумаге) Физические объекты Мультимедиа объекты (изображение, звук, видео) Программное обеспечение Персоны Организации Территории События Идеи Собрания всего вышеперечисленного (коллекции, базы данных, фонды)
Пример навигации интегрированной системы (Виртуальный музей Гулага) Категории информационных объектов (музеи, экспонаты, некрополи, памятники, изображения); Тематика; Персоны (поиск имен); География (поиск по географическим названиям); Учреждения; Источники и библиография Карта; Хронограф; Словарь терминов
Принципиальные вопросы проектирования интегрированной системы При разработке концепции интегрированной системы необходимо: Выбрать архитектуру системы и протоколы взаимодействия; Определить функциональность системы в целом и особенно ее централизованного блока; Выбрать стандарты метаданных, используемые в системе; Определить состав сущностей, к которым могут быть отнесены информационные объекты в системе; Определить состав признаков для навигации и атрибутного поиска.