(Алфавитный подход)
Как можно измерить количество информации?
Для измерения величин существуют эталонные единицы измерения. Например: Расстояние измеряют в миллиметрах, сантиметрах, дециметрах… Массу измеряют в граммах, килограммах, тоннах… Время измеряют в секундах, минутах, сутках, годах… Следовательно, для измерения информации должна быть введена своя эталонная единица.
Существует два подхода к измерению информации Содержательный (вероятностный) Содержательный (вероятностный) Алфавитный Позволяет измерять информационный объём текста на любом языке (естественном или формальном), при использовании данного подхода объём информации не связывают с содержанием текста, в данном случае, объём зависит от информационного веса символов. Количество информации связывается с содержанием (смыслом) полученного сообщения или с учётом вероятности событий.
Алфавитный подход к измерению информации
В алфавит включают и пробел (пропуск между словами). Мощность алфавита - полное число символов в алфавите. Например: Например: мощность алфавита русских букв и используемых символов равна 54: 33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел. Алфавит Алфавит – весь набор букв, знаков препинания, цифр, скобок и других символов, используемых в тексте.
Наименьшую мощность имеет алфавит, используемый в компьютере (машинный язык), его называют двоичным алфавитом, т.к. он содержит только два знака «0», «1». Информационный вес символа двоичного алфавита принят за единицу измерения информации и называется1 бит Информационный вес символа двоичного алфавита принят за единицу измерения информации и называется 1 бит.
Пример: Информация, записанная на машинном языке, весит: 5 бит 6 бит 3 бита 13 бит
При алфавитном подходе считают, что каждый символ текста, имеет информа- ционный вес. Информационный вес символа зависит от мощности алфавита. С увеличением мощности алфавита, уве- личивается информационный вес символа.
Для измерения объёма информации необходимо определить сколько раз информация равная 1 биту содержится в определяемом объёме информации. Возьмём четырёхзначный алфавит (придуманный) Порядковый номер Символ Двузначный двоичный код 4321 Четырёхзначный алфавит Все символы исходного алфавита можно закодировать всеми возможными комбинациями из двух цифр двоичного алфавита. Получим двоичный код каждого символа алфавита. Следовательно, каждый символ четырёхзначного алфавита весит 2 бита.
Четырёхзначный алфавит Порядковый номер Двузначный двоичный код Алфавит мощностью 8 знаков можно закодировать на машинном языке с помощью трёх символов двоичного алфавита Следовательно, каждый символ восьмизначного алфавита весит 3 бита.
Алфавит из шестнадцати символов можно закодировать с помощью четырёхзначного двоичного кода. Какой объём информации содержат 3 символа 16 – символьного алфавита? Решение: 1)Так как каждый символ алфавита мощностью 16 знаков можно закодировать с помощью четырёхзначного двоичного кода, каждый символ исходного алфавита весит 4 бита. 2)Так как всего использовали 3 символа алфавита мощностью 16 символов, следовательно: 4 бит 3 = 12 бит 3)Ответ: 3)Ответ: объём информации записанный 3 знаками алфавита мощностью 16 символов равен 12 бит
Следовательно. N = 2 b Информационный вес каждого символа, выраженный в битах (b), и мощность алфавита (N) связаны между собой формулой: N = 2 b Запишем таблицу соответствия мощности алфавита (N) и количеством знаков в коде (b) - разрядностью двоичного кода. N24816 b1 бит2 бита3 бита4 бита Заметим, что 2 = 2 1, 4 = 2 2, 8 = 2 3, 16 = 2 4
N = 2 b Воспользуемся формулой N = 2 b и узнаем мощность алфавита, в зависимости от объёма информации, содержащегося в одном символе данного алфавита. *Используйте калькулятор Мощность алфавита Количество бит в одном символе алфавита b = log 2 N Если необходимо найти количество информации содержащееся в одном символе алфавита заданной мощности используют формулу b = log 2 N
Алфавит из которого составляется на компьютере текст (документ) состоит из 256 символов. Этот алфавит содержит символы: строчные и прописные латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания… Из формулы N = 2 b следует 256 = 2 8 Значит, каждый символ алфавита используемого в компьютере для печати документов весит 8 бит. Эту величину приняли так же за единицу измерения информации и дали название байт. 8 бит = 1 байт
Пример. Пример. Статья содержит 30 страниц, на каждой странице - 40 строк, в каждой строке 50 символов. Какой объём информации содержит статья? 1) На каждой странице = 2000 символов; 2) во всей статье = символов; 3) т. к. вес каждого символа равен 1 байту, следовательно, информационный объём всей статьи = байт или = бит Как видно из задачи байт «мелкая» единица измерения информационного объёма текста, поэтому для измерения больших объёмов информации используются более крупные единицы.
1 килобайт1024 байт 1 килобайт = 1 Кб = 2 10 байт = 1024 байт 1 мегабайт1024 Кб 1 мегабайт = 1 Мб = 2 10 Кб = 1024 Кб 1 гигабайт1024 Мб 1 гигабайт = 1 Гб = 2 10 Мб = 1024 Мб Единицы измерения информационного объёма Значит, если перевести результат предыдущей задачи в более крупные единицы измерения получим: байт 58,59375 Кб байт 0,057 Мб