Кодирование текстовой информации
Кодировка ASCII (American Standard Code for Information Interchang) кодирующая первую половину символов с числовыми кодами от 0 до 127 1) #32 - пробел. (коды от 0 до 32 отведены не символам, а функциональным клавишам).
Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 ("Код обмена информацией, 8-битный"). КОИ8
Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251 ("CP" означает "Code Page", "кодовая страница").CP1251
В конце 90-ых годов появился новый международный стандарт Unicode, который отводит под один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов
Пример 1. Представьте в форме шестнадцатеричного Пример 1. Представьте в форме шестнадцатеричного кода слово «ЭВМ» во всех пяти кодировках. Воспользуйтесь компьютерным калькулятором для перевода чисел из десятичной в шестнадцатеричную систему счисления
Ответ Последовательности десятичных кодов слова «ЭВМ» в различных кодировках составляем на основе кодировочных таблиц: КОИ8-Р: КОИ8-Р: CP1251: CP1251: CP866: CP866: Mac: Mac: ISO: ISO: Переводим с помощью калькулятора последовательности кодов из десятичной системы в шестнадцатеричную: КОИ8-Р: КОИ8-Р: FC F7 ED CP1251: CP1251: DD C2 CC CP866: CP866: 9D 82 8C Mac: Mac: 9D 82 8C ISO: ISO: CD B2 BC
Для преобразования русскоязычных текстовых документов из одной кодировки в другую используются специальные программы-конверторы. Одной из таких программ является текстовый редактор Hieroglyph, который позволяет осуществлять перевод набранного текста из одной кодировки в другую и даже использовать различные кодировки в одном тексте