Кодирование текстовой информации © Кошля Л.Н. учитель информатики
Кодирование текстовой информации. Для кодирования одного символа текстовой информации используется количество информации, равное 1 байту, то есть I=1 байт=8 бит. Для кодирования одного символа требуется 1 байт (I=1 байт=8 бит) информации. Если рассматривать символы как возможные события, то по формуле можно вычислить, какое количество различных символов можно закодировать:. Такое количество символов вполне достаточно для представления текстовой информации, включая прописные и строчные буквы русского и латинского алфавита, цифры, знаки, графические символы и пр.
Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от до Таким образом, человек различает символы по их начертаниям, а компьютер – по их кодам. При вводе в компьютер текстовой информации происходит её двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает 1 байт. Кодирование текстовой информации.
Присвоение символу определенного числового кода – это вопрос соглашения. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange), кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам).кодовая таблица ASCII Рис. 1. Международная кодировка ASCII
В конце 90-ых годов появился новый международный стандарт Unicode, который отводит под один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов. Кодирование текстовой информации.
Определение числового кода символа. 1.Запустить текстовый редактор MS Word. Ввести Команду [Вставка Символ…]. На экране появится диалоговая панель Символ. Центральную часть диалогового окна занимает таблица символов для определенного шрифта (например, Times New Roman). Выбрать символ и в раскрывающимся списке из: тип кодировки. В текстовом поле Код знака: появится его числовой код.
Ввод символов по числовому коду. 1. Запустить стандартную программу Блокнот. С помощью дополнительной цифровой клавиатуры при нажатой клавише {Alt} ввести число 0224, отпустить клавишу {Alt}. В документе появится символ «а». Повторить процедуру для числовых кодов от 0225 до В документе появится последовательность из 12 символов «абвгдежзий» в кодировке Windows. 2. С помощью дополнительной цифровой клавиатуры при нажатой клавише {Alt} ввести число 224, в документе появится символ «р». Повторить процедуру для числовых кодов от 225 до 233, в документе появится последовательность из 12 символов «рстуфхцчшщ» в кодировке MS- DOS.