Язык запросов XML
XML (Extensible Markup Language) - это новый SGML-производный язык разметки документов, позволяющий структурировать информацию разного типа, используя для этого произвольный набор инструкций.
XML предназначен для: хранения структурированных данных; для обмена информацией между программами; для создания на его основе более специализированных языков разметки иногда называемых словарями; средство для описания грамматики других языков; средство контроля за правильностью составления документов.
Достоинства XML: XML это формат, одновременно понятный и человеку и компьютеру; XML формат, основанный на международных стандартах; Иерархическая структура XML подходит для описания практически любых типов документов; XML представляет собой простой текст, свободный от лицензирования и каких-либо ограничений; XML не зависит от платформы; XML не накладывает требований на расположение символов на строке.
Недостатки XML: Синтаксис XML избыточен. XML не содержит встроенной в язык поддержки типов данных; Пространства имён XML сложно использовать; Существуют другие, обладающие сходными с XML возможностями, текстовые форматы данных, которые обладают более высоким удобством чтения человеком.
Язык SGML SGML (Standard Generalized Markup Language) - это метаязык, на котором можно определять язык разметки для документов. Три основные части SGML документа: 1. SGML декларация; 2. Document Type Definition; 3. Содержимое SGML-документа, по крайней мере, должен быть корневой элемент.
XML-генераторы XML-документы могут служить промежуточным форматом для передачи информации от одного приложения к другому, поэтому их содержимое иногда генерируется и обрабатывается программами автоматически.
Объектная модель документа (DOM) Объектная модель XML документов является представлением его внутренней структуры в виде совокупности определенных объектов,которые организуются в древообразную структуру данных - каждый элемент документа может быть отнесен к отдельной ветви, а все его содержимое представляется в этой структуре поддеревьями.
Дерево элементов: tree node-level 1 node-level 2 text node-level3 text
DOM DOM является стандартным способом построения объектной модели любого HTML или XML документа, при помощи которой можно производить поиск нужных фрагментов, создавать, удалять и модифицировать его элементы.
Правила создания XML-документа: В заголовке документа помещается объявление XML; Каждый открывающий тэг должен обязательно закрываться; В XML учитывается регистр символов. Все значения атрибутов, используемых в определении тэгов, должны быть заключены в кавычки; необходимо следить за порядком следования открывающих и закрывающих тэгов; Вся информация, располагающаяся между тэгами, рассматривается как данные и поэтому учитываются все символы форматирования.
Структура документа Тэги служат для разметки основного текста документа; Тело документа XML состоит из элементов разметки и содержимого документа – данных; XML- документ должен всегда начинаться с инструкции, внутри которой можно задавать номер версии языка и другие параметры.
Конструкции языка 1. набор элементов (структурная единица XML- документа) ; 2. секций CDATA (задает область документа, рассматриваемую как простой текст ); 3. директив анализатора (специальные тэги - для управления процессом разбора документа ) ; 4.комментариев( ); 5. спецсимволов (для определения каких-либо конструкций языка ); 6. текстовых данных.
Определение типа документа (DTD) DTD ( Document Type Definition ) язык описания структуры XML-документа. В XML- документах DTD : определяет набор действительных элементов (определяется с помощью дескриптора !ELEMENT, в котором указывается название элемента и структура его содержимого); идентифицирует элементы, которые могут находиться в других элементах; различает действительные атрибуты для каждого из них.
Пример DTD-описания <! DOCTYPE journal [ ]>...
Схемы данных По сравнению с DTD, схемы обладают: более мощными средствами для определения сложных структур данных; обеспечивают более понятный способ описания грамматики языка; способны легко модернизироваться и расширяться.
Пример схемы-данных:
Язык запросов XQuery XQuery язык запросов, разработанный для обработки данных в формате XML. Он использует XML как свою модель данных.
XPath XPath (XML Path Language) является языком для обращения к частям XML-документа. Т.к. XML документ имеет древовидную структуру, XPath призван помочь обходить всевозможные деревья, вытаскивать необходимые элементы из другой ветви относительно точки обхода. Это полноценный язык навигации по дереву.
Структура путей адресации путь адресации шаг ось условие проверки узлов предикат
Стилевые таблицы XSL Стилевыми таблицами принято называть специальные инструкции, управляющие процессом отображения элемента в окне программы-клиента. Преимущества стилевых таблиц: стилевые таблицы XSL позволяют определять оформление элемента в зависимости от его месторасположения внутри документа; XSL более универсален; таблицы XSL не являются каскадными.