Алфавитный подход к определению количества информации
При хранении и передаче информацию можно рассматривать как последовательность знаков (букв, цифр и др. символов),отвлекаясь от её смыслового содержания.
Алфавитный подход I c = I 1 K I c – кол-во информации в сообщении, I 1 – кол-во информации одного знака (информационная ёмкость знака), K – кол-во знаков в сообщении.
Информационная ёмкость знака Если появление каждого знака в сообщении равновероятно, то I русского символа = log 2 32 = 5 бит, т. е. 2 5 = 32. зависит от мощности алфавита знаковой системы, т. е. количества знаков в нём. Пример
1. В какой телеграмме русской или английской больше I (кол-во информации), если в них одинаковое количество символов? 2. В русской или китайской книге, если в них одинаковое количество страниц? Вопросы
Частоты появления символов в русском сообщении Таблица 2.1 Буквапробелое, ёаитнс Относительная частота 0,1750,0900,0720,062 0,053 0,045 Буква рвлкмдпу Относительная частота 0,0400,0380,0350,0280,0260,0250,0230,021 Буква яызь, ъбгчй Относительная частота 0,0180,016 0,014 0,0130,0120,010 Буква хжюшцщэф Относительная частота 0,0090,0070,006 0,0040,003 0,002
С учетом частот появления символов применение формулы Шеннона даст: для русского символа I = 4,36 бит, для английского – I = 4,04 бит, для французского – I = 3,96 бит, для немецкого – I = 4,1 бит, для испанского – I = 3,98 бит.
Какова мощность алфавита, с помощью которого записано сообщение, содержащее 2048 символов, если его информационный объем составляет 1/512 Мб? Задача