Концептуальная модель электронной библиотеки Резниченко В.А., Проскудина Г.Ю. Кудим К.А.
RCDL2009, г.Петрозаводск 2 Проблемы интеграция информации различных ЭБ; сравнение ЭБ по предоставляемой функциональности; оценка и сравнение производительности различных систем ЭБ; добавление новых типов хранимых объектов; добавление новых функциональных возможностей; резервное копирование.
RCDL2009, г.Петрозаводск 3 План Обзор и анализ некоторых известных связанных проектов: СIDOC CRM; FRBR и FRBRоо; DELOS DLRM; Информационная модель ЭБ
RCDL2009, г.Петрозаводск 4 Концептуальная эталонная модель СIDOC CRM РАЗРАБОТАНА Международным комитетом по документации Международного совета музеев (начиная с 1996 года). Первая ее версия была представлена в 1998 году. НАЗНАЧЕНИЕ: интеграция, посредничество и обмен информацией в области мирового культурного наследия и связанных областей.
RCDL2009, г.Петрозаводск 5 Сейчас модель СIDOC CRM стала стандартом ISO 21127:2006 – "Эталонная онтология для обмена информацией культурного наследия" ("A reference ontology for the interchange of cultural heritage information").
RCDL2009, г.Петрозаводск 6 Цели CIDOC CRM обмен и интеграция; семантические определения и разъяснения ; надинституционная, абстрагированная от конкретного локального контекста модель.
RCDL2009, г.Петрозаводск 7 Также CIDOC CRM стремится служить - руководством по концептуальному моделированию для разработчиков ; - общим языком для экспертов в области культуры и IT-разработчиков; - формальным языком для идентификации общего информационного содержания; - ПОДДЕРЖКОЙ запросов к интегрированным ресурсам
RCDL2009, г.Петрозаводск 8 Объектно-ориентированная терминология CIDOC CRM Cущность (entity) называют « классом» (class). Связь ( relationship ) называют « свойством » ( property ). Свойства определяют как комбинацию области определения ( domain ) и области значения ( range ); т.е. они привязывают экземпляр (instance) класса, который служит областью определения свойства, к экземпляру класса, который служит областью значения свойства. Атрибуты также моделируются с помощью свойств.
RCDL2009, г.Петрозаводск 9 Версия модели CIDOC CRM (март 2009 г.) состоит из 90 классов и 148 свойств, описывающих предметы, понятия, людей, события, место, время и их отношения Две корневых сущности: Простое значение (Primitive Value): Число; Строка; Простое время (Time primitive) Сущность CRM (СRM Entity): все другие сущности универсума CIDOC CRM
RCDL2009, г.Петрозаводск 10 Часть иерархии классов в модели СIDOC CRM
RCDL2009, г.Петрозаводск 11 Часть иерархии классов СIDOC CRM, ветка – E77 Постоянная сущность
RCDL2009, г.Петрозаводск 12 Пример декларирования класса Е73 Информационный объект «Подкласс для:» – E28 Концептуальный объект, Е72 Легальный Объект «Суперкласс для:» – E29 Проект или процедура, E31 Документ, E33 Лингвистический объект, E36 Визуальный элемент (item) «Комментарий:» включает идентифицируемые нематериальные объекты, такие как стихи, шутки, наборы данных, изображения, тексты, мультимедийные объекты, процедурные предписания, компьютерные программы, алгоритм или математические формулы, которые имеют объективно распознаваемую структуру и зарегистрированы как единое целое. «Примеры:» Поэма А.С. Пушкина «Полтава», фильм Акиры Куросавы «Семь самураев»; уравнения Максвелла «Свойства:» – P67 может ссылаться на любой другой объект E1 Cущность CRM, (P67.1 имеет тип E55 Тип); P106 может состоять из E73 Информационный объект, P129 имеет тему E1 Cущность CRM
RCDL2009, г.Петрозаводск 13 Принципы моделирования CIDOC Открытый мир ( Open World ) Монотонность Минимальность Сокращения Непересекаемость Типы Расширяемость Охват
RCDL2009, г.Петрозаводск 14 Модель CIDOC CRM. Итоги (+) формальный подход (совместимый формализмом с RDF); обобщая все многообразие музейных коллекций и задач, модель содержит широкий набор универсальных понятий; важную роль здесь играют временные сущности, т.к. они связывают объекты (концептуальные или физические) с временным диапазоном, местом и субъектами; CIDOC CRM уже является стандартом ISO. (-) некоторые понятия CRM разработаны неполно, например классы E39 Актор и E30 Право.
RCDL2009, г.Петрозаводск 15 Модель FRBR " Функциональные требования к библиографическим записям " разработана Международной федерацией библиотечных ассоциаций и учреждений IFLA Концептуальная ER-модель: сущности, атрибуты, связи Используется в качестве информационной модели в библиографических системах
RCDL2009, г.Петрозаводск 16 Модель FRBR различает три группы сущностей: для описываемых объектов: произведение (work), выражение (expression), воплощение (manifestation), экземпляр (item); для описателей-субъектов: человек (person) и организация (corporate body); для описателей-объектов: концепт, объект, событие и место (concept, object, event, place).
RCDL2009, г.Петрозаводск 17 Модель FRBR
RCDL2009, г.Петрозаводск 18 Сущности 1-й группы FRBR Произведение (Work) – индивидуальное интеллектуальное или художественное творение Выражение (Expression) - интеллектуальная или художественная форма реализации произведения Воплощение (Manifestation) – физическая реализация выражения произведения. Воплощением может быть сборник произведений, отдельное произведение или составная часть произведения. Воплощение может представлять собой одну или несколько физических единиц. Экземпляр (Item) – один экземпляр воплощения.
RCDL2009, г.Петрозаводск 19 Примеры произведения (w1), выражения(e1 и e2), воплощения (m1) и экземпляра (i1): (w1) Приключения Оливера Твиста Диккенса (e1) оригинальный текст на английском языке (e2) перевод на русский язык Кривцовой (m1) роман опубликован в 1969 году в издательстве «Художественная литература» (i1) экземпляр, хранящийся в моей личной библиотеке
RCDL2009, г.Петрозаводск 20 Модель FRBR. Связи 1. Описаны все логические связи, изображенные на ER-диаграмме: 1. Между сущностями 1-й группы (произведение, выражение и воплощение, экземпляр); 2. Связи с сущностями человек и организация; 3. Предметные (тематические) связи. 2. Другие ( контентные ) связи между сущностями 1-й группы (произведение-произведение, выражение- выражение (два вида), произведение-выражение, воплощение-воплощение (два вида), воплощение- экземпляр, экземпляр-экземпляр, а также связи типа часть/целое для каждой сущности).
RCDL2009, г.Петрозаводск 21 Например, в группе связей произведение-произведение выделены такие типы связей: имеет продолжение; имеет приложение (сходство, соответствие); имеет резюме (обзор, аннотацию); имеет адаптацию (свободный перевод); имеет преобразование (стихотворную форму); имеет имитацию (пародию).
RCDL2009, г.Петрозаводск 22 Модель FRBR. Итоги (+) предлагает универсальные библиографические записи для всех типов материалов и пользовательских задач, связанных с библиографическими ресурсами; богатый набор атрибутов и отношений; (-) размыты границы между сущностями произведение и выражение; сущностей всего 10, что явно недостаточно для большинства библиотечных приложений (например, отсутствие «понимания» события).
RCDL2009, г.Петрозаводск 23 Модель FRBRоо FRBRoo = FRBR + CIDOC CRM FRBRoo – самостоятельный документ, в котором концепция FRBR представлена с использованием объектно-ориентированной методологии и аппарата CIDOC CRM. FRBRoo следует рассматривать как интерпретацию FRBR, а не ее новую версию или замену.
RCDL2009, г.Петрозаводск 24 Дополнения FRBR благодаря СІDOC CRM Произведение: Индивидуальное произведение (Individual Work); Составное произведение (Complex Work); Произведение контейнер (Container Work); Агрегатное произведение (Aggregation Work); Сериальное произведение (Serial Work); Издательское произведение (PublicationWork); Исполнительское произведение (Performance Work); Записанное произведение (Recording Work).
RCDL2009, г.Петрозаводск 25 DELOS DLRM (Digital Library Reference Model ) В гг. разработали эталонную модель ЭБ DELOS. Цель проекта – разобраться с фундаментальными понятиями, существенными объектами и их отношениями, стандартными функциональными и структурными блоками и процессами, из которых состоит универсум ЭБ.
RCDL2009, г.Петрозаводск 26 DELOS DLRM и понятие ЭБ: ЭБ – конкретная ЭБ с ее пользователями, правилами, содержимым, интернет-сайтом и ведущей организацией. Например: библиотека института программных систем ISS EPrints система ЭБ – программное обеспечение, на основе которого создаются ЭБ. Например: EPrints 3.0; система управления ЭБ – программное обеспечение для создания и управления системами ЭБ. Например: система OpenDLib.
RCDL2009, г.Петрозаводск 27 DELOS DLRM, категории пользователей ЭБ: конечный пользователь ЭБ; разработчик ЭБ; системный администратор ЭБ; разработчик приложений для ЭБ. Соответственно DELOS DLRM имеет четыре уровня пользовательских представлений.
RCDL2009, г.Петрозаводск 28 В DELOS DLRM универсум ЭБ разбит на шесть областей: контент; пользователь; функциональные возможности; качество; политики; архитектура.
RCDL2009, г.Петрозаводск 29 Иерархия областей ЭБ в модели DELOS DLRM:
RCDL2009, г.Петрозаводск 30 Ресурс ЭБ в DELOS DLRM: имеет идентификатор; организован в соответствии с форматом ресурса. Формат здесь выражен онтологией. Ресурс может быть сложным и структурированным, состоять из меньших ресурсов и иметь связи с др. ресурсами; может выражаться, напр., через информационный объект; быть описан или дополнен информационным объектом, обычно – метаданными и аннотациями ; характеризоваться параметрами качества ; регулироваться политиками, управляющими его жизненным циклом
RCDL2009, г.Петрозаводск 31 Область контента ЭБ в модели DELOS DLRM
RCDL2009, г.Петрозаводск 32 Область контента в DELOS DLRM Информационный объект (ИО) по уровню абстракции: - произведение, - выражение, - воплощение по связи: - первичный ИО, - метаданные, - аннотация
RCDL2009, г.Петрозаводск 33 Область пользователя в DELOS DLRM содержит все объекты, которые являются "внешними по отношению к системе ЭБ и с ней взаимодействуют: люди и неодушевленные объекты, например, программы или физические инструменты или даже другая ЭБ может быть пользователем ЭБ". Главная сущность в этой области – актор является ресурсом, наследует все его свойства.
RCDL2009, г.Петрозаводск 34 Область функций в DELOS DLRM Здесь наиболее общим понятием является функция. Каждая функция является ресурсом и потому наследует все его свойства. Все функции разделены на пять классов: доступа к ресурсам; управления ресурсами; совместной работы; управления ЭБ; настройки ЭБ.
RCDL2009, г.Петрозаводск 35 Модель DELOS DLRM. Итоги (+) наибольшая полнота охвата среди существующих концептуальных моделей ЭБ (-) недостаточно формализованы определения, оставляющие размытыми границы многих сущностей (например, сущности, заимствованные из FRBR, или граница между метаданными и аннотацией); в некоторых местах остаются не ясными критерии выделения сущностей; неоднородность описания различных областей ЭБ, скрытая за внешне однообразным описанием.
RCDL2009, г.Петрозаводск 36 Информационная модель ЭБ: иерархия сущностей
RCDL2009, г.Петрозаводск 37 Типы хранимых объектов в ЭБ Предусматривается хранение: рукотворных объектов – основного типа объектов информационного контента, а также некоторых других объектов, имеющих к ним отношение: организации, отделы организаций и издательства, где создавались или публиковались рукотворные объекты; люди (на схеме это объект человек), работающие в этих организациях (отделах) – авторы рукотворных объектов; проекты в рамках которых создаются рукотворные объекты; научные журналы (периодические издания) и конференции их публикующие
RCDL2009, г.Петрозаводск 38 Свойства хранимых объектов в ЭБ Объект (в тексте доклада физический объект) – корневой объект в иерархии представляемой модели идентификатор физического объекта; название; тема; ключевые слова; версия; аннотация. Эти свойства наследуются всеми другими объектами представленной иерархии
RCDL2009, г.Петрозаводск 39 Информационная модель ЭБ, связи
RCDL2009, г.Петрозаводск 40 А что же дальше будет? Дальнейший выбор объектов ЭБ, их наименование и определение их свойств с учетом известных моделей (CIDOC, FRBR…). Типизация связей. Хорошо разработана связь наследования (является), а агрегирования (содержит, состоит из)? Рассмотрение временного аспекта модели. … СПАСИБО!