Кодирование текстовой информации
Содержание Вопросы для повторения Двоичное кодирование текстовой информации в компьютере Кодовая таблица Код ASCII Принцип последовательного кодирования алфавита Различные кодировки знаков Примеры Тестовая проверочная работа
Вопросы для повторения Какие виды информации по способу представления вы знаете? Кодирование каких видов информации вы изучили на прошлых уроках? Вспомните главную форму информатики? Что принято за единицу количества информации? Назовите производные единицы измерения количества информации.
Двоичное кодирование текстовой информации в компьютере Для представления текстовой информации достаточно 256 различных символов. N = 2 I, 256 = 2 I, 2 8 = 2 I,I = 8 битов Для кодирования каждого знака требуется количество информации, равное 8 битам. Для представления текста в памяти компьютера необходимо представить его в двоичной знаковой системе. Каждому знаку необходимо поставить в соответствие уникальный двоичный код в интервале от до (в десятичном коде от 0 до 255)
Кодовая таблица Для представления символов и соответствующих им кодов используется кодовая таблица. В качестве стандарта во всем мире принята таблица ASCII (American Standard Code for Information Interchange – Американский стандартный код для обмена информацией). Условно таблица разделена на части: от 0 до 32 коды соответствуют операциям; с 33 по 127 соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания; со 128 по 255 являются национальными.
! # $ % & ( ) * , / : ; < = > ? A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ ] ^ _ a b c d e f g h i j k l m n o p q r s t u v w x y z { | } ~
Принцип последовательного кодирования алфавита: В кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Данное правило соблюдается и в других таблицах кодировки. Благодаря этому и в машинном представлении для символьной информации сохраняется понятие «алфавитный порядок».
Различные кодировки знаков В настоящее время существуют пять различных кодировок для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO), поэтому тексты созданные в одной кодировке не будут правильно отображаться в другой. В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов), что позволило закодировать многие алфавиты в одной таблице. N = 2 I, N = 2 16, N = 65536
Пример 1 Буква «i» в таблице кодировки символов имеет десятичный код 105. Что зашифровано последовательностью десятичных кодов: ? При расшифровке данной последовательности кодов не нужно обращаться к таблице кодировки символов. Необходимо учесть принцип последовательного кодирования алфавитов и вспомнить порядок букв в латинском алфавите (…i, j, k, l, m, n, o, …) Закодировано: «link»
Пример 2 С помощью последовательности десятичных кодов: закодировано слово «computer». Какая последовательность десятичных кодов будет соответствовать этому же слову, записанному заглавными буквами? При шифровке слова не пользоваться таблицей кодировки символов. Необходимо учесть, что разница между десятичным кодом строчной буквы латинского алфавита и десятичным кодом соответствующей заглавной буквы равна 32. Если «с» имеет код 99, то «С» имеет код 99-32=67. COMPUTER –
Пример 3 Какое количество информации необходимо для кодирования одного символа компьютерного алфавита? Слова «компьютер»? Слова «алфавит»?
Тестовая проверочная работа Вариант 1 1. Полный набор символов, используемый для кодирования, называют: 1) шифром2) алфавитом3) синтаксисом4) семантикой 2. Минимальным объектом, используемым для кодирования текста, является: 1)бит 2) пиксель 3) символ 4) растр 3. Количество битов, необходимое для кодирования одного символа алфавита в коде Unicode, равно: 1) 82) 163) 324) Сообщение «урок» содержит следующее количество информации: 1) 4 бита2) 32 бита3) 8 байт4) 32 байта 5. Какие символы могут быть зашифрованы кодами таблицы ASCII 119 и 251? 1) «д» и «ш»2) «j» и «s»3) «d» и «D»4) «w» и «ы» Вариант 2 1. Таблица кодировки символов устанавливает соответствие между: 1) символами, их десятичными номерами и двоичными кодами 2) символами разных алфавитов 3) символами и количеством байтов, которые они занимают 4) символами и номерами ячеек памяти, которые они занимают 2. Минимальным объектом, используемым для кодирования текста, является: 1) бит 2) пиксель 3) символ 4) растр 3. Количество битов, необходимое для кодирования одного символа алфавита в коде ASCII, равно: 1) 1 2) 8 3) 32 4) В сообщение «класс!» содержится следующее количество информации: 1) 5 битов2) 6 битов 3) 5 байтов4) 6 байтов 5. Код буквы «О» в некоторой таблице кодировки символов равен 142. Что зашифровано с помощью последовательности кодов: ? 1) CPORT2) SPORT 3) СПОРТ4) SNORT
Ответы для проверки Вариант 1 Вариант
Домашнее задание 1. Повторить изученный материал, воспользовавшись конспектом лекции и учебником стр , ответить на контрольные вопросы. 2. Выполнить задания 2.1, 2.2 по учебнику 3. В таблице ниже представлена часть кодовой таблицы ASCII: Определить 16-ричный код символа q. Символ 15АВQab Десятичный код ричный код