Трансляция - процесс перевода программы, из алгоритмического языка на машинный язык (в коды компьютера). Транслятор - программа-переводчик. ТРАНСЛЯЦИЯ КОМПИЛЯЦИЯИНТЕРПРЕТАЦИЯ
Program A1; var a, b, s: integer; Begin Write (введите а); Read (a); Write (введите b); Read (b); S:=a+b; Write (S=, S); End Транслятор – программа, которая преобразует программу, написанную на языке высокого уровня в программу, состоящую из машинных команд. Интерпретатор – переводит и выполняет программу построчно Компилятор – читает программу целиком, переводит и создает законченный вариант программы на машинном языке, который затем и выполняется
Этапы трансляции КОМПИЛЯЦИЯ КОМПОНОВКА И ЗАГРУЗКА ВЫПОЛНЕНИЕ исходный модуль (*.c *.cpp *.pas) объектный модуль (*.obj) загрузочный модуль (*.exe) исходные данные результаты ошибки компоновка редактирование связей
КОМПИЛЯЦИЯ И ИНТЕРПРЕТАЦИЯ Во время компиляции процесс трансляции и выполнения программы четко разделены во времени. В процессе интерпретации последовательно чередуются перевод инструкций языка в коды и их выполнение.
КОМПИЛЯЦИЯ И ИНТЕРПРЕТАЦИЯ Сравнение: Компиляция выгодней по времени выполнения и расходуемой памяти. Интерпретация удобней для организации диалоговых программ и отладки.
Что такое компилятор Компилятор – это программа, которая считывает текст программы, написанной на одном языке – исходном и переводит его в текст эквивалентной программы на другом языке – целевом. Если в исходном тексте программы имеются ошибки, компилятор сообщает о них пользователю.
Место компилятора в программном обеспечении Компиляторы составляют существенную часть программного обеспечения ЭВМ. Это связано с тем, что языки высокого уровня стали основным средством разработки программ. Сегодня только очень малая часть программного обеспечения, требующая особой эффективности, разрабатывается с помощью ассемблеров. В настоящее время имеет применение довольно много языков программирования. Наряду с традиционными языками, такими, например, как Фортран, широкое распространение получили так называемые "универсальные" языки (Паскаль, Си, Модула-2, Ада и другие), а также некоторые специализированные (например, язык обработки списочных структур Лисп).
Место компилятора в программном обеспечении Кроме того, большое распространение получили языки, связанные с узкими предметными областями, такие, как входные языки пакетов прикладных программ. Для ряда названных языков имеется довольно много реализаций. Так, на рынке программного обеспечения представлены десятки реализаций языков Паскаля, Модулы-2 или Си для ЭВМ типа IBM PC.
Место компилятора в программном обеспечении С другой стороны, постоянно растущая потребность в новых компиляторах связана с бурным развитием архитектур ЭВМ. Это развитие идет по различным направлениям. Наряду с возникновением новых архитектур, совершенствуются старые архитектуры как в концептуальном отношении, так и по отдельным, конкретным параметрам. Это можно проиллюстрировать на примере микропроцессора Intel-80X86. Последовательные версии этого микропроцессора 8086, 80186, 80286, 80386, 80486, отличаются не только техническими характеристиками, но и, что более важно, новыми возможностями и, значит, изменением (расширением) системы команд. Естественно, это требует новых компиляторов (или модификации старых).
Место компилятора в программном обеспечении В рамках традиционных последовательных машин развивается большое число различных направлений архитектур. Примерами могут служить архитектуры CISC, RISC. Такие ведущие фирмы, как Intel, Motorola, Sun, начинают переходить на выпуск машин с RISC- архитектурами. Естественно, для каждой новой системы команд требуется полный набор новых компиляторов с распространенных языков. Наконец, бурно развиваются различные параллельные архитектуры. Среди них отметим векторные, многопроцессорные, с широким командным словом архитектуры (вариантом которых являются суперскалярные ЭВМ).
Место компилятора в программном обеспечении На рынке уже имеются десятки типов ЭВМ с параллельной архитектурой, начиная от супер-ЭВМ (Cray, CDC и другие), через рабочие станции (например, IBM RS/6000) и кончая персональными компьютерами (например, на основе микропроцессора I-860). Естественно, для каждой из новых машин создаются новые компиляторы для многих языков программирования. Здесь необходимо также отметить, что новые архитектуры требуют разработки совершенно новых подходов к созданию компиляторов, так что наряду с собственно разработкой компиляторов ведется и большая научная работа по созданию новых методов.
Фазы компиляции Промежуточное представление Исходная программа Целевая программа Фаза анализа Фаза синтеза Компиляция состоит из двух этапов: анализ и синтез. На этапе анализа программа разбивается на составные части и создается ее промежуточное представление. На этапе синтеза по построенному внутреннему представлению генерируется исполняемый код.
Структура компилятора Обобщенная структура компилятора и основные фазы компиляции показаны на рисунке. На начальной фазе лексического анализа входная программа, представляющая собой поток литер, разбивается на лексемы - слова в соответствии с определениями языка. Основными формализмами, лежащим в основе реализации лексических анализаторов, являются конечные автоматы и регулярные выражения. Лексический анализатор может работать в двух основных режимах: либо как подпрограмма, вызываемая синтаксическим анализатором для получения очередной лексемы, либо как полный проход, результатом которого является файл лексем.
Устройство компилятора Лексический анализатор Синтаксический анализатор Семантический анализатор Генератор промежуточного кода Оптимизатор кода Генератор кода Диспетчер таблицы символов Обработчик ошибок Исходная программа Целевая программа
Устройство компилятора Лексический анализатор Синтаксический анализатор Семантический анализатор Генератор промежуточного кода Оптимизатор кода Генератор кода Диспетчер таблицы символов Обработчик ошибок Исходная программа Целевая программа На этапе лексического анализа из входной строки выделяются лексемы – единицы исходного языка. 'm', 'y', 'v', 'a', 'r' myvar (идентификатор)
Лексический анализатор В процессе выделения лексем лексический анализатор может как самостоятельно строить таблицы объектов (чисел, строк, идентификаторов и так далее), так и выдавать значения для каждой лексемы при очередном к нему обращении. В этом случае таблицы объектов строятся в последующих фазах (например, в процессе синтаксического анализа). На этапе лексического анализа обнаруживаются некоторые (простейшие) ошибки (недопустимые символы, неправильная запись чисел, идентификаторов и другие).
Устройство компилятора Лексический анализатор Синтаксический анализатор Семантический анализатор Генератор промежуточного кода Оптимизатор кода Генератор кода Диспетчер таблицы символов Обработчик ошибок Исходная программа Целевая программа На фазе синтаксического анализа и синтаксически управляемой трансляции анализируется иерархическая структура программы Если A, B – выражения, то A+B – выражение.
Синтаксический анализатор Центральная задача синтаксического анализа - разбор структуры программы. Как правило, под структурой понимается дерево, соответствующее разбору в контекстно-свободной грамматике языка. В настоящее время чаще всего используется либо LL(1)-анализ (и его вариант - рекурсивный спуск), либо LR(1)-анализ и его варианты (LR(0), SLR(1), LALR(1) и другие). Рекурсивный спуск чаще используется при ручном программировании синтаксического анализатора, LR(1) - при использовании систем автоматического построения синтаксических анализаторов.
Устройство компилятора Лексический анализатор Синтаксический анализатор Семантический анализатор Генератор промежуточного кода Оптимизатор кода Генератор кода Диспетчер таблицы символов Обработчик ошибок Исходная программа Целевая программа На фазе синтаксического анализа и синтаксически управляемой трансляции анализируется иерархическая структура программы Если A, B – выражения, то A+B – выражение.
Синтаксический анализатор Результатом синтаксического анализа является синтаксическое дерево со ссылками на таблицы объектов. Ошибки, связанные со структурой программы, также обнаруживаются в процессе синтаксического анализа. На этапе контекстного анализа выявляются зависимости между частями программы, которые не могут быть описаны контекстно-свободным синтаксисом. Это, в основном, связи "описание-использование", в частности, анализ типов объектов, анализ областей видимости, соответствие параметров, метки и другие. В процессе контекстного анализа таблицы объектов пополняются информацией об описаниях (свойствах) объектов.
Устройство компилятора Лексический анализатор Синтаксический анализатор Семантический анализатор Генератор промежуточного кода Оптимизатор кода Генератор кода Диспетчер таблицы символов Обработчик ошибок Исходная программа Целевая программа На фазе семантического анализа проверяется наличие семантических (смысловых) ошибок в исходной программе и накапливается информация о типах для следующей стадии – генерации промежуточного кода
Семантический анализатор Основным формализмом, используемым при контекстном анализе, является аппарат атрибутных грамматик. Результатом контекстного анализа является атрибутированное дерево программы. Информация об объектах может быть как рассредоточена в самом дереве, так и сосредоточена в отдельных таблицах объектов. В процессе контекстного анализа также могут быть обнаружены ошибки, связанные с неправильным использованием объектов.
Устройство компилятора Лексический анализатор Синтаксический анализатор Семантический анализатор Генератор промежуточного кода Оптимизатор кода Генератор кода Диспетчер таблицы символов Обработчик ошибок Исходная программа Целевая программа Таблица символов представляет собой структуру данных, содержащую записи о каждом идентификаторе с полями для его атрибутов. Эта структура позволяет быстро найти, изменить или добавить информацию о любом идентификаторе
Устройство компилятора Лексический анализатор Синтаксический анализатор Семантический анализатор Генератор промежуточного кода Оптимизатор кода Генератор кода Диспетчер таблицы символов Обработчик ошибок Исходная программа Целевая программа На каждой фазе компиляции могут встретиться ошибки. Но, после их обнаружения, необходимо предпринять какие-то действия, чтобы продолжить компиляцию и выявить остальные ошибки
Устройство компилятора Лексический анализатор Синтаксический анализатор Семантический анализатор Генератор промежуточного кода Оптимизатор кода Генератор кода Диспетчер таблицы символов Обработчик ошибок Исходная программа Целевая программа После синтаксического и семантического анализа некоторые компиляторы генерируют явное промежуточное представление исходной программы, которое можно рассматривать как программу для абстрактной машины
Генератор промежуточного кода Затем программа может быть переведена во внутреннее представление. Это делается для целей оптимизации и/или удобства генерации кода. Еще одной целью преобразования программы во внутреннее представление является желание иметь переносимый компилятор. Тогда только последняя фаза (генерация кода) является машинно-зависимой. В качестве внутреннего представления может использоваться префиксная или постфиксная запись, ориентированный граф, тройки, четверки и другие способы.
Устройство компилятора Лексический анализатор Синтаксический анализатор Семантический анализатор Генератор промежуточного кода Оптимизатор кода Генератор кода Диспетчер таблицы символов Обработчик ошибок Исходная программа Целевая программа При оптимизации кода производятся попытки улучшить промежуточный код, чтобы получить более эффективный машинный код.
Оптимизатор кода Оптимизации обычно делят на машинно-зависимые и машинно-независимые, локальные и глобальные. Определенная часть машинно-зависимой оптимизации выполняется на фазе генерации кода. Глобальная оптимизация пытается принять во внимание структуру всей программы, локальная - только небольших ее фрагментов. Глобальная оптимизация основывается на глобальном потоковом анализе, который выполняется на графе программы и представляет по существу преобразование этого графа. При этом могут учитываться такие свойства программы, как межпроцедурный анализ, межмодульный анализ, анализ областей жизни переменных и так далее.
Устройство компилятора Лексический анализатор Синтаксический анализатор Семантический анализатор Генератор промежуточного кода Оптимизатор кода Генератор кода Диспетчер таблицы символов Обработчик ошибок Исходная программа Целевая программа Последняя фаза компиляции состоит в генерации целевого кода, обычно перемещаемого машинного кода или ассемблерного кода
Генератор кода Наконец, генерация кода - последняя фаза трансляции. Результатом ее является либо ассемблерный модуль, либо объектный (или загрузочный) модуль. Для генерации кода разработаны различные методы, такие как таблицы решений, сопоставление образцов, включающее динамическое программирование, различные синтаксические методы. Конечно, те или иные фазы транслятора могут либо отсутствовать совсем, либо объединяться. В простейшем случае однопроходного транслятора нет явной фазы генерации промежуточного представления и оптимизации, остальные фазы объединены в одну, причем нет и явно построенного синтаксического дерева.
Байт-код
В программировании, байт-код или байткод (англ. bytecode, иногда также используется термин псевдокод и p-code) это промежуточное представление, в которое может быть переведена компьютерная программа. По сравнению с исходным кодом, удобным для создания и чтения человеком, байт-код это компактное представление программы, уже прошедшей синтаксический и семантический анализ. В нём в явном виде закодированы типы, области видимости и т. п. С технической точки зрения, байт-код представляет собой машинно-независимый код низкого уровня, генерируемый транслятором из исходного кода. Многие современные языки программирования, особенно интерпретируемые, используют байт-код для облегчения и ускорения работы интерпретатора. Трансляция в байт-код является методом, промежуточным по эффективности между прямой интерпретацией и компиляцией в машинный код.
Байт-код
По форме байт-код похож на машинный код, но предназначен для исполнения не реальным процессором, а виртуальной машиной. В качестве виртуальной машины обычно выступает интерпретатор соответствующего языка программирования. Байт-код называется так, потому что длина каждого кода операции традиционно составляет один байт. Каждая инструкция обычно представляет собой однобайтовый код операции (от 0 до 255), за которым могут следовать различные параметры, например, номер регистра или адрес в памяти.
Распространены платформы, использующие байт-коды Байт-код Java (стековая виртуальная машина), исполняемый различными виртуальными машинами Java (англ. Java Virtual Machine, JVM). Платформа была создана компанией Sun для языка Java, но стала использоваться и для других языков; существуют десятки высокопроизводительных реализаций JVM, использующих JIT- компиляторы. Платформа Microsoft.NET использует стековый байт-код Intermediate Language (CIL, MSIL, исполняемый с помощью Common Language Runtime (CLR). Данная платформа была создана Microsoft для языков C# и других. Скриптовый язык JavaScript выполняется различными высокопроизводительными движками, в основном, встроенными в веб- браузеры, часто с возможностью JIT-оптимизации. Многие движки построены с применением байт-кода, однако программы на Javascript распространяются в виде исходных кодов. Скриптовый язык ActionScript транслируется в стековый байт-код, распространяется в составе swf и pdf файлов, и выполняется виртуальными машинами в Adobe Flash и Adobe Acrobat.