Информация, выраженная с помощью естественных и формальных языков в письменной форме, называется текстовой информацией
Двоичное кодирование текстовой информации Для кодирования 1 символа используется 1 байт информации. 1 байт 256 символов 66 букв русского алфавита 52 буквы английско- го алфавита 0-9 цифры Знаки препинания
При обработке текстовой информации в компьютере каждый символ представляется двоичным кодом 1 символ 8 битов От до Присвоение знаку конкретного двоичного кода – это вопрос соглашения, которое фиксируется в кодовой таблице
Кодовая таблица ASCII American Standard Code for Information Interchange коды от 0 до 32 функциональные клавиши коды от 33 до 127 буквы английского алфавита, знаки математических операций, знаки препинаний
Таблицы кодировки русскоязычных символов КОИ-8MAC ISO
Кодировка Unicode 1 символ - 2 байта (16 бит), которыми можно закодировать символов
Кодирование информации Кодирование – это операция преобразования знаков или группы знаков одной знаковой системы в знаки или группы знаков другой знаковой системы.
Таблицы кодирования, которые надо знать! ASCII (American Standard Code for Information Interchange) ASCII (American Standard Code for Information Interchange) КОИ7 (Код обмена информацией, 7-битный) КОИ7 (Код обмена информацией, 7-битный) КОИ8 (Код обмена информацией, 8-битный) КОИ8 (Код обмена информацией, 8-битный) СР1251 (Кодовая страница «Cod Page») MS Windows СР1251 (Кодовая страница «Cod Page») MS Windows СР866 (Кодовая страница «Cod Page») MS DOS СР866 (Кодовая страница «Cod Page») MS DOS Mac (Macintosh) OS Macintosh Mac (Macintosh) OS Macintosh ISO (Международная организация по стандартам «International Standards Organization») ISO (Международная организация по стандартам «International Standards Organization») Unicode (Международный стандарт) Unicode (Международный стандарт)
Количество символов, которое можно закодировать, используя таблицы кодирования, вычисляется по формуле: Количество символов, которое можно закодировать, используя таблицы кодирования, вычисляется по формуле: N=2 I Где N - количество символов I - количество бит отводимых для кодирования одного символа
КОИ7 (Код обмена информацией, 7-битный) I = 7 бит N=2 7 =128 символов
ASCII, КОИ8, СР1251, СР866, Mac, ISO I = 8 бит = 1 байт N=2 8 =256 символов
Unicode (Международный стандарт ) I = 16 бит = 2 байта N = 2 16 = символов
Единицы измерения информации 1 байт = 8 бит 1 Кбайт = 2 10 байт ( 1024 байт) 1 Мбайт = 2 10 Кбайт = 2 20 байт 1 Гбайт = 2 10 Мбайт = 2 20 Кбайт = 2 30 байт
Задача 1 Текстовый файл содержит данные в кодировке КОИ-7, и занимает в памяти 56 Кбайт. Определить: сколько будет занимать этот файл в кодировке КОИ-8. Определить: сколько будет занимать этот файл в кодировке КОИ кБ кБ кБ кБ
Решение задачи 1 КОИ7 1 символ = 7 бит КОИ7 1 символ = 7 бит КОИ8 1 символ = 8 бит КОИ8 1 символ = 8 бит 1 Кбайт = 2 10 байт = 2 10* 2 3 бит 1 Кбайт = 2 10 байт = 2 10* 2 3 бит Количество символов, которые закодированы: N = 56*2 10 *2 3 /7 = 8*2 10 *2 3 Объём памяти в КОИ8 Объём памяти в КОИ8 8*2 10 *2 3 *8 =64* 2 10 *2 3 бит = 64 Кбайта 8*2 10 *2 3 *8 =64* 2 10 *2 3 бит = 64 Кбайта
Задача 2 Текстовое сообщение в кодировке ASCII было переведено в кодировку Unicode. Как изменится объём этого сообщения, если оно состояло из фразы В.И. Даля: Текстовое сообщение в кодировке ASCII было переведено в кодировку Unicode. Как изменится объём этого сообщения, если оно состояло из фразы В.И. Даля: Язык есть вековой труд целого поколения. 1. Увеличится на 41 бит 2. Уменьшится на 320 бит 3. Увеличится на 40 байт 4. Уменьшится на 39 байт
Задача 3 При шифровании текста использовался восьмибитовый способ кодирования символов. Оцените объём (в битах) предложения в этой кодировке: Для большинства людей исправиться – значит поменять свои недостатки
Задача 5 Задача 5 При кодировке текстового сообщения, состоящего из сорока символов на русском языке, потребовалось 320 бит, а при дальнейшем изменении кодировки на другую, его итоговый объём составил 40 байт. Какое преобразование кодировок производилось? 1. ASCII – Unicode 2. Unicode – ASCII 3. КОИ8 - Unicode 4. КОИ8 - ASCII