ОНТОЛОГИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ПУБЛИКАЦИЯ ДАННЫХ ОБ ОСОБО ОХРАНЯЕМЫХ ПРИРОДНЫХ ТЕРРИТОРИЯХ К. А. Кузнецов, В. А. Серебряков, К. Б. Теймуразов, Е. С. Устинова, Д. А. Малахов
Пространственные данные в сети Интернет Широко распространенный тип данных Хорошо структурированы и стандартизированы Служат мостом между различными предметными областями Существует развитая культура обмена пространственными данными Слабо интегрированы в глобальное информационное пространство 2
Проект Linked Open Data Linked Open Data – открытый проект при поддержке W3C, цель которого состоит в распространении в сети связанных массивов RDF данных Проект рекомендует ряд правил публикации данных в сети с использованием стека технологий Семантического Веб, которые : способствуют повторному использованию данных ; уменьшают общую избыточность данных ; повышают реальную и потенциальную степень взаимосвязанности данных ; позволяют улучшать ценность данных за счет сетевых эффектов. 3
Принципы Linked Open Data Использовать URIs для именования вещей всего чего угодно, а не только документов Использовать HTTP URIs глобально уникальные имена, распределенная собственность позволяют людям находить вещи по именам Предоставлять информацию о вещах в формате RDF в ответ на запрос URI Включать в RDF ссылки на другие URI используются уже существующие словари позволяет находить релевантную информацию 4
Облако Link Open Data 5
Предпосылки работы Коллектив ВЦ РАН работает над публикацией научных данных в Веб Технологии Семантического Веб ранее использовались нами в основе некоторых проектов, но никогда выставлялись наружу У нас есть данные, которые мы хотели бы сделать доступными в пространстве Linked Open Data Для первого опыта были взяты наборы данных об Особо Охраняемых Природных Территориях ( ООПТ ) 6
Что необходимо сделать Предложить единую модель данных об ООПТ Создать хранилище данных Опубликовать данные в пространстве LOD представить модель данных об ООПТ в форме OWL онтологии установить связи со внешними наборами данных 7
Модель данных : основы Основывается на схемах имеющихся у нас наборов данных об ООПТ ( наборов.shp файлов ) Удовлетворяет требованиям ФЗ РФ Совместима с распространенными в мире стандартами на публикацию пространственных данных и данных об ООПТ в частности 8
Исходные наборы данных информация об объекте « охраняемая территория » информация об охраняемых объектах вспомогательные объекты, связанные с тематическими нетематические объекты 9
Исходные наборы данных 10
Требования законодательства Закон " Об особо охраняемых природных территориях ' от 14 марта 1995 г. Выделяет следующие классы : « ООПТ » со свойствами « граница », « граница охранной зоны », « выделенные зоны », « категория » и « статус » « Функциональная Зона » со свойствами « назначение » и « граница » 11
Используемые международные стандарты Пространственные данные стандарты серии технического комитета ISO/TC 211 стандарты OGC стандарты CEN ( Европа ) стандарты FGDC ( США ) стандарты INSPIRE ( Европа ) Прикладная область ООПТ представлена только в INSPIRE INSPIRE Data Specification on Protected Site Прикладная схема FULL INSPIRE Data Specification on Geographical Names INSPIRE Guidelines for the encoding of spatial data 12
Объединенная схема данных 13
Ключевые классы Geometry ProtectedSite RestrictedZone FunctionalZone Forestry Quarter GeographicalName BioGeographicalRegion HabitatsAndBiotopes SpeciesDistribution 14
Хранилище данных Используется PostgreSQL с модулем PostGIS Схема базы данных создана вручную Данные загружаются из.shp файлов вручную 15
Инструментарий Linked Open Data На данный момент не существует средств для комплексной поддержки наборов данных LOD Средства публикации D2R Server OpenLink Virtuoso Universal Server Генераторы связей SILK, LIMES Библиотеки поддержки стека технологий Semantic Web доступны для распространенных языков программирования 16
Онтология ООПТ Использовались следующие словари LOD: Набор данных о пространственных объектах и их названиях GeoNames; Набор данных о биологических видах GeoSpecies; RDF словарь W3C Basic Geo Vocabulary; RDF словарь NeoGeo Geometry Ontology; 17
Онтология ООПТ 18
Публикация Используется D2R Server Правила отображения сгенерированы автоматически и вручную совмещены с онтологией Осуществляет дереференсирование HTTP URI, а также предоставляет SPARQL доступ 19
Связывание Генератор связей основан на инструменте SILK Внешние наборы данных и правила связывания задаются вручную Генерируемые связи имеют атрибут « степень идентичности » При публикации используются предикаты owl:sameAs, rdf:seeAlso Возможна генерация транзитивных связей 20
Хранилище связей 21
Дальнейшая работа Интеграция данных из нескольких источников Генерация схемы БД, онтологии, правил отображения и идентичности по прикладной GML схеме Поддержка WFS, WMS, KML … Поддержка GeoSPARQL Улучшение механизма генерации связей 22
СПАСИБО ЗА ВНИМАНИЕ 23