Кодирование символов : ASCII, KOI8, UNICODE
Все, что мы видим на экране монитора это символы. Для вывода каждого символа нужен машинный код, который будет соответствовать только этому символу, или же правило, организующее корректный вывод каждого символа на дисплей. Попробуем прикинуть, сколько же нужно всего символов пользователю: для начала, 26 букв английского алфавита (строчных), во-вторых, 26 прописных, пробел, 10 цифр, 9 знаков препинания (., : ! " ; ? ( ) ), 5 арифметических действий (+,,*, /, ^) и спецсимволы ( % _ # $, ^, &, >,
ASCII Для отображения всех этих символов была создана таблица ASCII (англ. American Standard Code for Information Interchange) американский стандартный код для обмена информацией; произносится [э́ски].
Изначально разработана как 7-битная, потом ASCII стала восприниматься как 8-битная. Так выглядят таблицы ASCII- кодов с печатаемыми и непечатаемыми символами (для удобства в таблицах приведены коды в шестнадцатеричной системе счисления). ASCII-кодировка: печатаемые символы
Дальнейшее развитие привело к появлению понятия «кодовая страница», т.е. набор из 256 символов для определения группы языков (например, некоторые славянские языки с латинским алфавитом, турецкий, мальтийский, эсперанто и т.д.), но она не позволяла смешивать языки, и к тому же, не могла создать кодовые страницы японского и китайского языков. Но скоро набора кодов стало не хватать. Возникла новая таблица кодировок, названная «расширенная таблица ASCII», число знакомест в которой возросло до 256. Таблица имела полностью восьми битный код Latin-1.
КОИ-8 KOI8 восьмибитовая ASCII-совместимая кодовая страница, созданная для кодирования букв кириллических алфавитов. В КОИ-8 символы русского алфавита поместили в верхнюю часть кодовой таблицы так, что позиции кириллических символов соответствуют их фонетическим аналогам в английском алфавите в нижней части таблицы. Это значит, что убрав в тексте, написанном в КОИ-8, восьмой бит каждого символа, то получится текст, написанный латинскими символами. Например, слова «Кодировка» превратились бы в «kODIROVKA».
ASCII-кодировка: непечатаемые символы
UNICODE Юнико́д стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Это новая система кодирования символов, способная закодировать символов (code points). Большинство символов, используемых в основных языках мира занимают code points. Остальные (более миллиона) code points вполне достаточно для кодирования всех известных символов, включая даже исторические знаки и редкие языки. Стандарт UNICODE очень обширен, имеет три формы: 32-битную (UTF-32), 16- битную (UTF-16) и 8-битную (UTF-8). Весьма распространенная восьми битная форма UTF-8 была создана для удобной совместимости с ASCII- ориентированными системами кодирования
Решение примера. При перекодировке в 8-битный код, каждый символ уменьшился в «объеме» в два раза (было 16 бит стало 8). Следовательно, и все сообщение (сумма кодов символов) тоже уменьшилось в 2 раза. Т.к. полученное сообщение стало меньше на 480 бит, то умножив его на 2, мы получим длину исходного. Это 960 бит. Изначально кодировка была 16-битная, значит разделив исходную длину 960 бит на 16 разрядов, получим кол-во символов. 960/16=60 символов (вариант 2). Ответ:вариант 2 60 символов. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах? Варианты: