Двоичное кодирование текстовой информации
Для кодирования одного символа требуется 1 байт информации. Если рассматривать символы как возможные события, то всего различных символов можно закодировать: N=2 8 =256.
Такое количество символов вполне достаточно для представления текстовой информации, включая прописные и строчные буквы русского и латинского алфавита, цифры, знаки, графические символы и пр. Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от до
Присвоение символу определенного числового кода – это вопрос соглашения. В качестве международного стандарта принята кодовая таблица ASCII, кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам).
Международная кодировка ASCII
Национальные стандарты кодировочных таблиц включают международную часть кодовой таблицы без изменений, а во второй половине содержат коды национальных алфавитов, символы псевдографики и некоторые математические знаки. Существует несколько различных кодировок кириллицы (КОИ8, СР1251, СР866, Мас, ISO), что вызывает дополнительные трудности при работе с русскоязычными документами, так как тексты, созданные в одной кодировке, не будут правильно отображаться в другой.
Кодировка КОИ8-Р
Кодировка СР1251
В настоящее время широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, поэтому с его помощью можно закодировать не 256, а 2 16 =65536 различных символов. Эту кодировку поддерживает Microsoft Windows&Office.
Решение задач 1. (Устно) Каков информационный объем текста, содержащего слово ИНФОРМАТИКА, в 8- битовой кодировке? В 16-битовой кодировке? 2. (Устно) Во сколько раз уменьшится информационный объем страницы текста при его преобразовании из кодировки Unicode в кодировку Windows СР1251?
Решение задач 3. В текстовом режиме экран обычно разбивается на 25 строк по 80 символов в строке. Определите объем текстовой информации, занимающей весь экран монитора, в кодировке Unicode.
Д/з И. Семакин Информатика и ИКТ 8 класс, §13 Задача. Сколько страниц в книге, если информация, которую несет книга, равна 937,5 Кбайт, а на каждой странице 80 строк по 60 символов?