Архитектура метаданных WWW. Язык RDF Архитектура метаданных WWW RDF
Архитектура метаданных WWW. Документы. Метаданные. Связи. В WWW Ресурс=Документ=Объект. Метаданные – машинопонятная информация о web ресурсах и других сущностях. Пример. Объект, извлеченный из сети по протоколу http может иметь доп. информацию (Метаданные): Дата создания или дата прекращения действия Владелец Автор Ключевые слова Аксиома 1. Метаданные это – данные.
Способы получения и передачи метаданных 1. Метаданные хранятся и передаются внутри документа (тег HEAD в html, данные о документе MS Word.) 2. Передача метаданных происходит во время HTTP-передачи - при GET от сервера к клиенту - при post, put от клиента к серверу 3. Метаданные могут храниться в другом документе
Форма метаданных Аксиома 2. Архитектура, представляемая метаданными, является набором независимых высказываний. Ресурс – атрибут – значение. Пример 2. – Date – ; – From – Vasya; Общий вид высказывания (A u1 p q …) Где А – имя (идентификатор) для типа высказывания (Author, Date …) u1 – URI ресурса, о котором делается высказывание p,q, … - другие параметры зависящие от типа высказывания.
Пространство имен атрибутов использование пространства URL адресов для имен атрибутов Пример 3. Словари с именами атрибутов 1) HTML элементы внутри элемента HEAD 2) Заголовки HTTP запроса, уточняющие атрибуты объекта (оба и 1) и 2) определены внутри конкретных спецификаций) Сравнение с языками программирования Сравнение с ER-моделью.
Связи Отношение между двумя ресурсами будем называть связью. (A u1 u2) А – тип отношения u1 – первый URI u2 – второй URI Способы передачи связей Самоописывающаяся информация
Краткие итоги (1) Метаданные это – данные Метаданные могут ссылаться на любой ресурс, имеющий URI Метаданные могут храниться в любом ресурсе вне зависимости от того на какой ресурс они ссылаются Метаданные могут пониматься как набор высказываний о ресурсе в форме (A u1 …)
Краткие итоги (2) Высказывания, устанавливающие отношения между двумя ресурсами, называются связями и имеют форму (A u1 u2) Типы высказываний (в том числе и связи) являются объектами первого класса (first class object), т.е. их можно определять в адресуемом ресурсе и ссылаться на них по адресу этого ресурса: «тип А находится в ресурсе u». Разработка новых типов высказываний и связей выполняется так, что новые виды высказываний понимаются и людьми и ПО.
RDF RDF – язык представления информации о ресурсах WWW. Назначение языка описания метаданных
Модель данных RDF – RDF-граф RDF-граф = набор троек (или триплетов) (S,P,O). где S-субъект, P- предикат и O-объект картинка Subject и Predicate идентифицируются при помощи URI. Объектом может быть как ресурс, имеющий URI, так и RDF-литерал.
RDF-литералы (символьные константы) Виды RDF-литералов типизированные не типизированные. Любой литерал имеет лексическую (словарную) форму Простой литерал имеет необязательную ссылку на тег языка (ru, en…). Типизированный литерал имеет URI типа данных
Сравнение литералов Литералы равны, если: Строки обеих лексических форм совпадают посимвольно Либо оба литерала имеют совпадающие теги языка, либо оба не имеют их Либо оба литерала имеют посимвольно совпадающие URI типа данных, либо оба не имеют их
Определение значения типизированного литерала Пример: Представим множество {T, F} В языках программирования {1, 0} (1 соответствует T, 0 соответствует F), либо {true, false}, либо {истина, ложь}. Фактически задается некоторое отображение множества значений истинности на множество чисел или строк символов. Подобное отображение используется при определении значения типизированного RDF- литерала. Оно определяется по URI типа данных и зависит от конкретного типа.
Вопросы к лекции 1. Почему AND-список высказываний может быть представлен неупорядоченным множеством? 2. Чем отличаются понятия ресурс, объект и документ в контексте Web? 3. Какие модели (или формы) представления высказываний вам известны? 4. Что такое RDF? 5. Что представляет собой модель данных RDF и на чем они основана?