Измерение информации. Представление чисел в компьютере
Алфавитный подход к измерению информации Применяется в цифровых системах хранения и передачи информации. Объём информации равен длине двоичного кода. Основная единица измерения информации – 1 бит (один разряд двоичного кода)
Алфавитный подход к измерению информации Алфавит любого языка можно заменить двоичным алфавитом. Каждый символ некоторого сообщения имеет определённый информационный вес – несёт фиксированное количество информации. Все символы одного алфавита имеют один и тот же вес, зависящий от мощности алфавита(N). Для кодирования N символов произвольного алфавита требуется i-разрядный двоичный код. i - информационный вес символа = разрядность двоичного кода.
Алфавитный подход к измерению информации М i М = 2 i Ближайшая к N сверху целая степень двойки Информационный вес символа алфавита ПРИМЕР: Алфавит состоит из 86 символов. Вычислим информационный вес символа в данном алфавите. 64 < 86 < < 86 < 2 7 Информационный вес символа данного алфавита равен 7 битам.
Информационный объем сообщения Информационный объём I сообщения равен произведению количества K символов в сообщении на информационный вес i символа алфавита: K i I = K*i Количество символов в сообщении Количество символов в сообщении Информационный вес символа алфавита
Единицы измерения информации КОМПЬЮТЕРНЫЙ АЛФАВИТ русские (РУС) буквы латинские (LAT) буквы цифры (1, 2, 3, 4, 5, 6, 7, 8, 9, 0) математические знаки (+, -, *, /, ^, =) прочие символы («»,, %,, :, ;, #, &) Компьютерный алфавит содержит 256 символов. 1 байт - информационный вес символа алфавита мощностью байт = 8 битов 256 = 2 8, i=8
1 байт = 2 3 бит = 8 бит 1 Кбайт = 2 10 байт = 1024 байт 1 Мбайт = 2 10 Кбайт = 1024 Кбайт 1 Гбайт = 2 10 Мбайт = 1024 Мбайт 1 Тбайт = 2 10 Гбайт = 1024 Гбайт Единицы информации
Считая, что каждый символ кодируется 1 байтом, определите информационный объем следующего предложения из пушкинских строк: Певец Давид был ростом мал, но повалил же Голиафа! Задача 1 1) 400 бит 2) 50 бит 3) 400 байт 4) 5 байт Решение типовых задач Решение: i = 1 байт К = 50 I – ? I = 50*1. I = 50 байт = (50*8) бит = 400 бит Ответ: 1. I = K*i
Задача 2 Информационное сообщение объёмом 4 Кбайта состоит из 4096 символов. Каков информационный вес символа этого сообщения? Сколько символов содержит алфавит, с помощью которого записано это сообщение? I = 4 Кб, K = 4096; i – ? N – ? Ответ: информационный вес символа = 8, алфавит содержит 256 символов. N = 2 8 = 256 (символов) N = 2 i, I = K*i, i = I/K i = 4*1024*8/4096 = 8 (битов) I = 4 (Кб) = 4*1024*8 (битов) Решение:
Содержательный подход к измерению информации Прочитать стр учебника Сообщение, уменьшающее неопределённость знания об исходе некоторого события в два раза, несёт 1 бит. Измеряется количество информации в сообщении об исходе некоторого события. Никакой результат не имеет преимущества перед другими. Главная формула информатики: 2 i = N
Содержательный подход к измерению информации Формула Хартли: i = log 2 N Здесь i – количество информации, содержащееся в сообщении об одном из N равновероятных исходов события.
Двоичная система счисления Двоичная система счисления позиционная система счисления с основанием 2. Используются цифры 0 и 1. Правила представления данных: Данные в памяти компьютера хранятся в двоичном виде. Представление данных в компьютере дискретно. Множество представляемых в памяти компьютера величин ограничено и конечно.
Алфавит десятичной, двоичной, восьмеричной и шестнадцатеричной систем счисления Система счисления Основание Алфавит цифр Десятичная 100, 1, 2, 3, 4, 5, 6, 7, 8, 9 Двоичная 20, 1 Восьмеричная 80, 1, 2, 3, 4, 5, 6, 7 Шестнадцатерич ная 160, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F
Соответствие десятичной, двоичной, восьмеричной и шестнадцатеричной систем счисления p= p= p= p= ABCDEF10 Количество используемых цифр называется основанием системы счисления. При одновременной работе с несколькими системами счисления для их различения основание системы обычно указывается в виде нижнего индекса, который записывается в десятичной системе: это число 123 в десятичной системе счисления; то же число, но в двоичной системе. Двоичное число можно расписать в виде: = 1* * * * *2 0 = =
Перевод чисел из одной системы счисления в другую Перевод из десятичной системы счисления в систему счисления с основанием p осуществляется последовательным делением десятичного числа и его десятичных частных на p, а затем выписыванием последнего частного и остатков в обратном порядке. Переведем десятичное число в двоичную систем счисления. В итоге получили =
Представление чисел в компьютере Целые числа Вещественные числа Со знаком Без знака М*2 Р М - двоичная мантисса, Р – двоичный целый порядок Диапазон: [-2 N-1, 2 N-1 -1] Диапазон: [0, 2 N ] Диапазон ограничен максимальными значениями М и Р Формат с фиксированной запятой Формат с плавающей запятой
Домашнее задание 1.Считая, что каждый символ кодируется 1 байтом, определите информационный объем слова: Математика 2. Для записи текста использовался 64-символьный алфавит. Какой объём информации в байтах содержат 10 страниц текста, если на каждой странице расположено 32 строки по 64 символа в строке? Ответ дайте в байтах. 3. Перевести в двоичную систему число Перевести в десятичную систему число ) 80 бит 2) 50 бит 3) 80 байт 4) 5 байт