Рассматриваемые вопросы: - исторический экскурс; - двоичное кодирование текстовой информации; - расчет количества текстовой информации.
Историческая справка Криптография - это тайнопись, система изменения письма с целью сделать текст непонятным для непосвященных лиц Азбука Морзе или неравномерный телеграфный код, в котором каждая буква или знак представлены своей комбинацией коротких элементарных посылок электрического тока (точек) и элементарных посылок утроенной продолжительности (тире) Сурдожесты - язык жестов, используемый людьми с нарушениями слуха Вопрос: Какие примеры кодирования текстовой информации можно привести еще?
Код Цезаря А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я1 Юлий Цезарь (I век до н.э.) Замени каждую букву шифруемого текста на другую путем смещения в алфавите от исходной буквы на фиксированное количество символов! Закодируем Б А Й Т – сместим на 2 символа вправо Получим: Г ВЛФ
Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.
Для кодирования одного символа требуется один байт информации. Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов. 2 8 =256
Двоичное кодирование текстовой информации Для кодирования 1 символа используется 1 байт информации. 1 байт256 символов 66 букв русского алфавита 52 буквы английско- го алфавита 0-9 цифры
Кодирование заключается в том, что каждому символу ставиться в соответствие уникальный двоичный код от до (или десятичный код от 0 до 255). Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.
Таблица кодировки Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки. Для разных типов ЭВМ используются различные кодировки. С распространением IBM PC международным стандартом стала таблица кодировки ASCII (American Standart Code for Information Interchange) – Американский стандартный код для информационного обмена.
Кодовая таблица ASCII American Standard Code for Information Interchange коды от 0 до 32 Управляющие символы коды от 33 до 127 буквы английского алфавита, знаки математических операций и т.д.
Стандартная часть таблицы кодов ASCII
Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита. В настоящее время существует 5 разных кодовых таблиц для русских букв (КОИ8, СР1251, СР866, Mac, ISO).
Таблицы кодировки русскоязычных символов КОИ8-РCP1251 CP866
Mac ISO
2-я часть таблицы ASCII (СР 1251) Дальше
Принцип последовательного кодирования алфавита В таблице ASCII латинские и русские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений.
Решите задачу Зная, что десятичный код латинской буквы С равен 67, закодируйте в двоичном коде слово File, не используя таблицу кодировки. Проверить по таблице
В настоящее время получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ два байта. С его помощью можно закодировать (2 16 = ) различных символов
Решите задачу: Сколько байт содержит сообщение: «Один килограмм равен 1000 грамм.», записанное в кодировке Unicode?