Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках Новицкий А.В. Институт программных систем НАН Украины
Цели Выделить проблемы интеграции данных при онтологическом подходе Сделать обзор существующих проектов по интеграции данных в электронной библиотеке Семантической аннотации как необходимый компонент интеграции данных 2 RCDL 2009
Что такое интеграция данных (ИД) ? Под процессом интеграции данных мы понимаем построение единого унифицированного метода доступа к гетерогенным распределенным преимущественно структурированным данным 3 RCDL 2009
Проблемы интеграции данных Гетерогенность: Синтаксическая Структурная Семантическая 4 RCDL 2009
семантическая гетерогенность семантические конфликты описательные конфликты структурные конфликты 5 RCDL 2009
Виды сопоставлений онтологий: Расширение Гармонизация Выравнивание 6 RCDL 2009
Семантическая интерпарабельность в Европейских проектах Проект SWHi Проект eCulture Проект IPISAR (Испания) Проект EPOCH и AMA 7 RCDL 2009
Проект SWHi Онтология SWHi для ЭБ, построенная на базовой онтологии PROTON в результате сопоставления с отологиями: таксономии предметной классификации NewsBank/Readex Дублинского Ядра словаря FOAF Vocabulary 8 RCDL 2009
Проект eCulture eCulture это семантическая поисковая система для одновременного поиска в нескольких коллекциях учреждений культурного наследия 9 RCDL 2009
IPISAR 10 RCDL 2009
Проект EPOCH и AMA библиотек культурного наследия EPOCH представляет собой библиотечную сеть из более ста европейских культурных институтов Для интеграции и обмена используется модель данных CIDOC CRM AMA Mapping Tool - для отображения источников данных (неструктурированная информация) в онтологию CIDOC CRM 11 RCDL 2009
Семантическая аннотация Для автоматической обработки контента ЭБ метаданных недостаточно. Необходимы более детальные формальное объяснения (аннотации), доступные через Интернет. Эти механизмы заложены в Sematic Web. 12 RCDL 2009
Проблемы Semantic Web Множество рекомендаций и направлений Отсутствие онтологий и RDF данных Отсутствие приложений для роботы с семантическими данными 13 RCDL 2009
RDFa это способ выражения RDF-данных в XHTML, в рамках которого данные, предназначенные для человека, используются повторно для автоматической обработки. 14 RCDL 2009
Пример 15 RCDL 2009
Пример работы GRDDL (Gleaning Resource Descriptions from Dialects of Languages) 16 RCDL 2009
Использование в ЭБ (автоматическая публикация) 17 RCDL 2009 Liked Data
Дальнейшее развитие Связывание аннотированных документов с моделью данных Linked Data Расширение построенной модели с хранилищем Linked Open Data 18 RCDL 2009
Linked Open Data RCDL
Спасибо за внимание ! 20 RCDL 2009
Принципы Linked Data Use URIs as names for things Use HTTP URIs so that people can look up those names. When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) Include links to other URIs. so that they can discover more things. RCDL