1 Двоичное кодирование символьной информации
2 При двоичном кодировании текстовой информации каждому символу ставится в соответствие своя уникальная последовательность из восьми нулей и единиц, свой уникальный код от до (десятичный код от 0 до 255)
3 Присвоение символу конкретного двоичного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 33 кода (с 0 до 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и т.д.). Коды 33 до 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
4 Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы. К сожалению, в настоящее время существует 5 различных кодовых таблиц для русских букв, поэтому тексты созданные в одной кодировке, не будут правильно отображаться в другой.
5 Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ – 8 («Код обмена информационный – 8 битный»). Эта кодировка применяется в компьютерах с операционной системой UNIX.
6 Наиболее распространенная кодировка – это стандартная кириллистическая кодировка Microsoft Windows, обозначаемая сокращением CP1251 («CP» означает «Code Page»). Все Windows – приложения, работающие с русским языком, поддерживают эту кодировку.
7 Для работы в среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft – кодировка CP 866.
8 Фирма Apple разработала для компьютеров Macintosh свою собственную кодировку русских букв (Mac)
9 Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859 – 5.
10 1.КОИ-8 - UNIX 2.CP1251 («CP» означает «Code Page») - Microsoft Windows 3. CP MS-DOS 4. Mac - Macintosh 5. ISO 8859 – 5 Стандарты кодировок:
11 Таблица кодировки символов Двоичный код Десятичный код КОИ8CP1251CP866MacISO ……… Удаление последнего символа (клавиша Backspace) ……… Перевод строки (клавиша Enter) ……… Пробел ! ……… Z ……… ………128-ЪААК ……… БВ--Т ……… ЛМ::Ь ……… ЩЭ-ЁН ……… Ья Нераз. пробел п
12 В последнее время появился новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и поэтому с его помощью можно закодировать не 256 символов, 2 16 = различных символов. Эту кодировку поддерживает платформа Microsoft Windows&Office97.
13