Кодирование текстовой информации
Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называется текстовой информацией. Для обработки текстовой информации на компьютере необходимо представить ее в двоичной знаковой системе. Для кодирования каждого знака требуется количество информации равное 8 битам и каждому знаку необходимо поставить в соответствие уникальный двоичный код из интервала до ( в десятичном коде от 0 до 255).
Присваивание знаку конкретного двоичного кода – это вопрос соглашения, который фиксируется в кодовой таблице. Структура существующих кодовых таблиц: Десятичные коды с 0 до 33 – соответствуют операциям; С 33 до 127 – являются интернациональными и соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания; С 128 до 255 – являются национальными.
В настоящее время существуют пять различных кодировочных таблиц для русских букв : Windows, MS-DOS, Mac, ISO, КОИ-8 Тексты, созданные в одной кодировке не будут правильно отображаться в другой. За перекодировку текста отвечают специальные программы – конверторы.
Сейчас широкое распространение получил международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов). Согласно этому стандарту можно закодировать символов. Такого количества достаточно для кодирования русского и латинского алфавита, цифр, знаков и математических символов и других алфавитов.
Одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 КОИ8 ("Код обмена информацией, 8-битный"). Задание: Закодируйте фразу Я изучаю информатику успешно.