Кодирование текстовой информации Привет!
Кодирование и декодирование Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код. Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.
Информация, выраженная с помощью естественных и формальных языков в письменной форме, называется текстовой информацией Текстовая информация
Двоичное кодирование текстовой информации 256 символов 66 символов русского алфавита 52 символа английского алфавита 0-9 ( 10 цифр) знаки препинания, знаки действий, спецсимволы
Двоичное кодирование текстовой информации Для обработки текстовой информации на компьютере необходимо представить ее в двоичном коде. 2 8 =256 Для кодирования одного символа требуется 8 бит=1 байт информации. Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.
Таблицы кодировки Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки. Кодирование заключается в том, что каждому символу ставится в соответствие уникальный двоичный код от до (или десятичный код от 0 до 255).
Различные кодировки символов. ASCII Стандартной в этой таблице является только первая половина, т.е. символы с номерами от 0 ( ) до 127 ( ). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита. В настоящее время существует 5 разных кодовых таблиц для русских букв (КОИ8, СР1251, СР866, Mac, ISO). В настоящее время получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ два байта. С его помощью можно закодировать (2 16 = ) различных символов.
ASCII
Обратите внимание! Цифры кодируются по стандарту ASCII в двух случаях – при вводе-выводе и когда они встречаются в тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование в другой двоичных код (см. урок «представление чисел в компьютере»). Возьмем число 57. При использовании в тексте каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII. В двоичной системе это – При использовании в вычислениях, код этого числа будет получен по правилам перевода в двоичную систему и получим –
Вопросы и задания: В чем заключается кодирование текстовой информации в компьютере? Закодируйте с помощью ASCII-кода свою фамилию, имя, номер класса. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия: Певец-Давид был ростом мал, Но повалил же Голиафа!