Представление математических текстов в Интернет
Математический текст представляет собой сложную структуру, состоящую из математических формул, выражений, а также текста, к которому может быть применимо форматирование различного вида. Существенным элементом реализации цифровых библиотек научной информации является поддержка математических данных (математических конструкций). С этим связаны вопросы организации создания, хранения, представления математических материалов, обеспечение возможности поиска математических выражений и т.п. Наиболее распространенными являются редакционно- издательские системы, подготавливающие математические тексты в формате TeX.
Основная трудность при представлении математических текстов в Веб заключается в необходимости фиксирования как его представления, так и содержания, не теряя высокоразвитой знаковой системы математики и возможности взаимосвязи с внешним программным обеспечением.
Для решения данной проблемы консорциум World Wide Web (W3C) в 1994 году создал рабочую группу по разработке языка математической разметки. Была предложена спецификация MathML. Язык MathML создан на основе расширяемого языка разметки XML. К настоящему времени консорциум W3C опубликовал вторую редакцию версии 2.0 спецификации языка MathML. Язык MathML позволяет представлять математический материал в виде презентационной и содержательной разметки. Презентационная разметка передает математическую нотацию, содержательная разметка отражает математическое знание.
Презентационная разметка MathML фиксирует синтаксис математического выражения. Данная разметка позволяет кодировать синтаксис математического выражения достаточно абстрактно, что может быть удобно для медиа-приложений. Одна и та же презентационная разметка для математического выражения может быть использована для отображения на экране, в приложениях речевого воспроизведения, при выводе на печать и т.д.
Содержательная разметка MathML фиксирует содержание (семантику) математического выражения. Данная разметка позволяет кодировать содержание математического выражения достаточно регулярным образом, чтоможет быть удобно для обработки программным обеспечением
Пример: a-b Презентационная a - b
Пример: a-b Содержательная a b
Общий принцип использования MathML состоит во встраивании математических конструкций в XHTML/HTML-документ.
Средства отображения TeX и MathML Использование браузеров, которые поддерживают возможность отображения математических формул, выражений. Amaya, Dadzilla, Firefox 1.1 или Mozilla 1.0, Netscape 7.0. Использование обычных браузеров, функциональность которых расширяется специальными дополнительными модулями, называемыми «плагинами» (plug-in, add-on), реализующими возможность отображения математических формул, выражений. IE + Math Player IE + IBM techexplorer Netscape + IBM techexplorer IE + Integre techexplorer Netscape + Integre techexplorer.
Браузеры (browsers) Netscape и Mozilla /Firefox являются браузерами Gecko- поколения, которые поддерживают такие стандарты Интернет, как HTML 4.0, CSS 1/2, W3C Document Object Model, XML 1.0, RDF, и JavaScript. NetscapeMozilla /Firefox Gecko- Воспроизводят презентационную разметку MathML Данные браузеры при работе с MathML могут потребовать установку дополнительных шрифтов CMYS10, CMEX10, Math1, Math2, Math4, которые можно взять по адресу
AmayaAmaya - браузер для просмотра математических текстов в формате MathML презентационного вида, включает редактор подготовки математических текстов в этом же формате
Плагины Math Player является продуктом компании Design Science. Это быстродействующий плагин показа MathML для веб-браузера Microsoft's Internet Explorer версии 5.5 и выше. Поддерживает презентационную разметку MathML. Math Player является свободно распространяемым. Math Player Integre techexplorer Hypermedia Browser - это плагин к браузерам IE, NN 4.0 (6.0, 7.0), Mozilla для работы с большими и расширенными математическими выражениями в Интернете, представленными в LaTeX- и MathML-формате презентационного и содержательного вида. Допускает смешанное представление математических выражений в HTML- документе LaTeX- и MathML-формата. Integre techexplorer Hypermedia Browser IBM techexplorer Этот плагин динамически формирует и отображает документы, которые содержат выражения TeX /LaTeX, поддерживаемые только частично. Является свободно распространяемым продуктом для академических структур. IBM techexplorer
Браузер MS IE + MathPlayer Математические выражения могут быть записаны внутри тега … презентационной разметкой MathML. …
Браузер MS IE + Integre techexplorer Возможно включать как TeX -выражения, так и MathML –выражения обеих видов разметки. Следует обратить внимание, что для TeX-выражений параметр обращения к типу данных выглядит следующим образом: а для MathML-выражений как.
Для ТеХ (Браузер MS IE + Integre techexplorer)
Для MathML-выражений (Браузер MS IE + Integre techexplorer)
Возможно создание HTML-страницы, где присутствуют и Tex-, и MathML-выражения. Разрешено включать MathML-выражения в TeX-выражения. При этом параметр value равен: 0 в обращении к типу данных. 0 TeX/LaTeX данные, 1 MathML-выражения, 2 TeX /LaTeX файл, 3 MathML файл
MathML-выражения заключаются внутри конструкции \begin{MathML}… \end{MathML}.
Браузер MS IE + IBM techexplorer Внутри тега необходимо объявить пространство имен MathML в параметре xmlns. Here is a simple equation
Браузеры Amaya, Firefox или Mozilla 1.0, Netscape 7.0 MathML на HTML-странице браузерами Gecko-поколения воспроизводится некорректно. Данную проблему позволяет решить программа, написанная Питером Джипсеном. (Peter Jipsen) на языке JavaScript.Питером Джипсеном. Параметр xmlns указывает пространство имен MathML через префикс m, что является необходимым для работы программы Питера Джипсена.
Пример работы программы Питера Джипсена на HTML-странице можно посмотреть по адресу … function convert() { … } …
Средства создания MathML-документов Средства презентационной разметки MathML языка состоят из 30 элементов и 50 атрибутов. Средства содержательной разметки языка MathML состоят из 120 элементов и 12 атрибутов. MathML-документ можно создавать либо вручную, напрямую программируя формулы, либо используя многочисленные редакторы. Поскольку большая часть математических текстов представлена в TeX-формате, появляется необходимость в конвертировании TeX-документов в MathML-документы.
Можно выделить следующие способы создания MathML-документов: прямое программирование формул с 1.использованием описаний на языке MathML 2.использование редакторов 3.использование конвертеров из TeX-формата в MathML- формат.
Редакторы MathML Equation Editor - редактор, предлагаемый фирмой Integre, позволяет выполнять описание математических выражений в виде содержательной и презентационной разметки MathML Equation Editor
Презентационная форма
Содержательная форма
EzMathEzMath - Приложение EzMath позволяет вводить математические выражения в текстовом виде на английском языке в стиле WYSIWYG - What you see is what you get". Воспроизводит визуально и генерирует содержательную разметку MathML
MathType MathType является профессиональной версией приложения Equation Editor, которое представлено в Microsoft Office Word. MathType – это редактор для набора математических выражений, работает с текстовыми процессорами, презентационными программами, HTML-редакторами. Включает транслятор математических выражений в MathML-формат. MathType позволяет не только возвращать вводимую формулу в MS Word, но и конвертировать ее в буфере обмена в одну из версий языков представления формул – MathML или TEX.
Пример формулы, набранной в MathType, и той же формулы, скопированной и вставленной в Блокнот в формате MathML
WebEQ WebEQ – это мощный программный инструмент, который позволяет создавать веб-страницы с использованием интерактивной математики. WebEQ реализован на Java-технологиях, что обеспечивает его платформо- и браузеро-независимость. WebEQ включает модули WebEQ Editor и WebEQ Publisher, позволяющие генерировать разметку MathML как презентационного, так и содержательного вида.WebEQ EditorWebEQ Publisher WebEQ Editor – это редактор для набора математических выражений с интуитивно понятным интерфейсом пользователя.WebEQ Editor Генерирует выходные данные в трех видах: презентационный и содержательный MathML, в виде графического изображения (PNG, JPG, GIF), в виде аплета. WebEQ Publisher позволяет публиковать данные в веб-формате.
Входными данными могут быть MathML и WebTeX. Результатом работы могут быть опять же данные в виде MathML-формата, графического изображения и аплета.MathML
В силу исторически сложившихся условий, огромное количество математических документов представлено в TeX-формате, вследствие чего приобретают актуальность конвертеры из TeX-формата в MathML-формат и обратно. На основе программных продуктов можно получить следующий цикл преобразований:
Пакет Mathematica позволяет в ряде случаев генерировать содержательный MathML. Из свободно распространяемого программного обеспечения можно выделить: Конвертер из TeX/LaTex в MathML (ORCCA) onlineonline Конвертер из MathML в LaTeX (ORCCA) onlineКонвертер из MathML в LaTeX (ORCCA)online Конвертер из содержательного в презентационный MathML (ORCCA) Mimetex (CGI-программа)
Спасибо за внимание!