XML Язык разметки Набор языков для хранения, обработки и представления документов Технологии обработки и обмена информацией.

Презентация:



Advertisements
Похожие презентации
XPath Набор синтаксических правил для адресации элементов XML-документа.
Advertisements

Язык запросов XML. XML (Extensible Markup Language) - это новый SGML-производный язык разметки документов, позволяющий структурировать информацию разного.
БАЗЫ ДАННЫХ ЛЕКЦИЯ 14. тема: XML-ТЕХНОЛОГИИ В БАЗАХ ДАННЫХ.
XML eXtensible Markup Language 1.Пространства имён (Namespaces) 2.Язык навигации внутри XML-документа (XPath)
XML eXtensible Markup Language 1.Определение типа документов (DTD) 2.Язык навигации внутри XML-документа (XPath)
XSLT-ТРАНСФОРМАЦИЯ XML- ТЕХНОЛОГИИ Лекция 4. Трансформация XML- данных Категории трансформации Структурные трансформации – трансформация одного словаря.
Java Advanced XML Transformations 1.0 (XSLT 1.0).
XML eXtensible Markup Language 1.Язык навигации внутри XML-документа (XPath) 2.Пространства имён (Namespaces) 3.Язык трансформаций (XSLT)
Язык HTML HyperText Markup Language Язык разметки гипертекста.
ЯЗЫКИ РАЗМЕТКИ введение. Категории информационных ресурсов Данные – сведения о сущностях предметной области, их свойствах и связях с другими сущностями.
Автоматическая обработка естественного языка I. Обработка письменного текста.
XSL eXtensible Stylesheet Language среда, 11 декабря 2013 г.среда, 11 декабря 2013 г.среда, 11 декабря 2013 г.среда, 11 декабря 2013 г.среда, 11 декабря.
XML и XSLT (2) Матросов Александр Васильевич Санкт-Петербургский государственный университет.
XML - ПРАВИЛА ПОСТРОЕНИЯ ДОКУМЕНТОВ. Элементы электронного УМК Учебный план Программа дисциплины Структура курса Электронный конспект Обучающие и аттестующие.
Современные языки и технологии программирования Использование XML.
WEB- ТЕХНОЛОГИИ Лекция 4. Задача преобразования XML- данных 1 Задача преобразования Для передачи данных между разными приложениями необходимо преобразовать.
Структура XML-документов По материалам курса University of Washington
XML - расширенный язык разметки Моисеевой О. Макушиной Д. (eXtensible Markup Language)
XML- технологии Лекция 3 XPath- адресация. Что такое XPath? XPath - это синтаксис для адресации частей XML- документа XPath использует пути для адресации.
Java Advanced XML Path Language 1.0 (XPath 1.0). 2 СПбГУ ИТМО Georgiy KorneevJava Advanced / XPath 1.0 Содержание 1.Введение 2.Пути 3.Выражения 4.Функции.
Транксрипт:

XML Язык разметки Набор языков для хранения, обработки и представления документов Технологии обработки и обмена информацией

HTML SGML, HTML XML Языки разметки SGML (Standart Generalised Markup Language, 1986 год) SGML HTML упрощение, фиксирован один язык XML

eXtensible Markup Language HTML – управление представлением + средства определения структуры + средства верификации Основная функция – описание структурированной текстовой информации Скорее не язык, а средство определения языков (мета-язык)

Определение XML-языков Общий синтаксис XML Общие грамматические ограничения = корректные документы (well-formed) DTD (document type definition) – декларация типа документа = действительные документы (valid) XML-синтаксис + DTD-грамматика = класс XML-документов

XML-языки (приложения) MathMl (Mathematical Markup Language) – запись математических формул XQL (Extensible Query Language) – запросы к базам данных KML – Google Earth XML-синтаксис + DTD-грамматика = класс XML-документов

Синтаксис XML (сравнение с HTML) Заголовок, вложенные теги Для каждого открывающегося тега должен быть закрывающийся Строгая вложенность Учитывается регистр в именах тегов Более строгие синтаксические правила

Элементы синтаксиса XML Символы, спецсимволы:,&,, Теги, атрибуты Директивы Комментарии Ссылки на сущности Секции CDATA

Синтаксис XML Использование символа & в гипертекстах Иванов И.И. Теги Директива (заголовок) Комментарий Ссылка на символ Секция CDATA

Структура: элементы Элемент Тип элемента Символьные данные Содержимое элемента Пустой элемент Использование символа & Иванов И.И.

Использование символа & Иванов И.И. Атрибуты элементов Значение Имя атрибута

один два три Модель документа a: b: один b: два c: три a: b: один b: два c: три Дерево (ребра упорядочены) a(b(один), b(два),c(три)) Терм (с произвольным количеством аргументов) XML

Использование символа & в гипертекстах Иванов И.И. Питер 2003 XML и HTML Библиография Использование символа & в гипертекстах, Иванов И.И., Питер, 2003 Определяет содержание, не зависящее от представления Ясна структура документа Не определяет представление Возможна частичная верификация Определяет содержание неотделённое от представления Невозможно автоматически выявить структуру Невозможна верификация

Использование символа & в гипертекстах Иванов И.И. Питер 2003 XML и LaTeX \begin{thebibliography}{9} \bibitem{ivanov2003} {\em Иванов И.И.} Использование символа $\amp$ в гипертекстах -- Питер, \end{thebibliography}

Использование символа & в гипертекстах Иванов И.И. Питер 2003 XML и LaTeX \begin{thebibliography}{9} \begin{book}{ivanov2003} \bibauthor{\em Иванов И.И.} \bibtitle{Использование символа $\amp$ в гипертекстах} \bibpublisher{Питер} \bibyear{2003} \end{book} \end{thebibliography} Определяет содержание, не зависящее от представления Ясна структура документа Не определяет представление Возможна частичная верификация Определяет содержание и представление Есть возможности задавать структуру Для понимания структуры нужна информация о командах Невозможна верификация

Добавление специфики Декларации типа документа (DTD) Определяют структуру документа (множество элементов и правила их вложимости) Схемы XML (XML Schema) Описывают структуру xml-документов Создается наследственная система элементов. Новые элементы определяются расширением и наложением ограничений. Мощнее и сложнее DTD Пространства имен XML (XML Namespaces) Обеспечивают глобальную уникальность имен тегов

Классы документов Использование символа & Иванов И.И. Питер 2003

DTD bibliography paper* paper title authors publisher year source? authors author+ Слева – имя элемента справа – регулярное выражение над элементами и текстовыми данными XML DTD Контекстно-свободная грамматика

Синтаксис DTD Декларация типа элемента Декларация списка атрибутов

Синтаксис DTD Последовательность книг (возможно пустая) Последовательность авторов Символьные данные Пустой элемент Заголовок, затем автор, затем издательство, затем год и может быть source

Синтаксис DTD Имя элемента Имя атрибута Тип атрибута Атрибут обязательный

… … Синтаксис DTD Тип атрибутассылка на ID Тип атрибута ID IDREF атрибут ID атрибут

MathML Сохраняет возможности LaTeXа структурированной разметки формул Два типа разметки: Разметка представления (как в LaTeXе) Разметка содержания (для работы собственно с формулами, а не их изображениями) Не привязан к полиграфии

1 α + β 2 MathML Пример формулы \[ \frac{1} {(\alpha+\beta)^2} \] LaTeX

Представление XML- документов – XSLT XSLT – Extensible Stylesheet Language – Transformations (расширяемый язык таблиц стилей – преобразования) отделение содержания (XML) от представления (XSLT) CSS и XSLT XSLT обладает большими возможностями: отбор элементов трансформации XML-деревьев внешний вид, основанный на содержании (результат может зависеть от данных)

XSL(T) XSL использует синтаксис XML Компоненты XSL: 1. Язык XSLT для трансформации XML- документов 2. Словарь для форматирования XML. FO (Formatting Objects – свойства форматирования как в CSS)

Работа XSLT XML исходное дерево XML,HTML,csv, текст… результат XSLT таблица стилей Трансформация

Элементы XSLT корневой элемент содержимое для замены Определяет правило: шаблон содержимое для замены Применить правило к выбранному потомку (ко всем)

Алгоритм работы XSLT Основные шаги сопоставляет шаблон элементам в исходном дереве, находит элементы, подходящие под шаблон, заменяет элемент на содержимое (из правила), выбирает узлы для дальнейшей обработки Управление Рекурсивная обработка ( ) Применение части правила для выбранных элементов (,

Использование символа & Иванов И. Использование символа < Петров П. Пример применения XSLT Список книг Тип элемента Шаблон Текст замены Результат Список книг 1.Использование символа &Иванов И. 2.Использование символа

XML Applications & Industry Initiatives Advertising: adXML place an ad onto an ad network or to a single vendor adXML Literature: Gutenberg convert the worlds great literature into XML Gutenberg Directories: dirXML Novells Directory Services Markup Language (DSML) dirXMLDSML Web Servers: apacheXML parsers, XSL, web publishingapacheXML Travel: openTravel information for airlines, hotels, and car rental placesopenTravel News: NewsML creation, transfer and delivery of newsNewsML Human Resources: XML-HR standardization of HR/electronic recruiting XML definitionsXML-HR International Dvt: IDML improve the mgt. and exchange of info. for sustainable developmentIDML Voice: VoxML markup language for voice applicationsVoxML Wireless: WAP (Wireless Application Protocol) wireless devices on the World Wide WebWAP Weather: OMF Weather Observation Markup Format (simulation)OMFsimulation Geospatial: ANZMETA distributed national directory for land informationANZMETA Banking: MBA Mortgage Bankers Association of America --> credit report, loan file, underwriting…MBA Healthcare: HL7 DTDs for prescriptions, policies & procedures, clinical trialsHL7 Math: MathML (Mathematical Markup Language)MathML Surveys: DDI (Data Documentation Initiative) codebooks in the social and behavioral sciencesDDI

1 2 Язык XPath Набор синтаксических правил для адресации элементов XML-документа Подобен синтаксису файловой системы. Корневой элемент - /, далее указывается тип вложенного элемента Отличается возможным множественным выбором Пример: 1. /html 2. /html/p 3. /html/div/img

XPath 2.0 Язык позволяет строить выражения для указания элементов xml-документа Результатом выражений являются последовательности элементов Последовательности «плоские», т.е. вложение одной последовательности в другую даёт вложение элементов Типы данных: элементы булевый тип численный тип (с плавающей точкой) строковый тип

XPath 2.0

Функции last() position() count( последовательность ) id( элемент ) local-name( последовательность ) namespace-uri( последовательность ) name( последовательность ) Операторы and or not = != < >=

XPath 2.0 Оси ИмяОписание selfСам узел childДочерние узлы parentРодительский узел descendantПотомки узла descendant-or-selfУзел и его потомки ancestorПредки узла ancestor-or-selfСам узел и его предки followingВсе узлы после данного following-siblingВсе узлы этого же уровня после данного precedingВсе узлы перед данным preceding-siblingВсе узлы этого же уровня перед данным attributeУзлы аттрибутов namespaceУзлы пространства имен

XPath 2.0 Язык XML Иванов И. Стихи Петров П. Иванов И. Сказки Петров П. /biblio/book/* /biblio/*[year]/author /biblio/book[author='Ива нов И.']/title ='2003']/../author ='2003']/author /biblio/book[1] /biblio/book[last()] //book[not(year)] /biblio/book[count(autho r)=2] //author[following- sibling::* | preceding- sibling::* = 'Иванов И.']