Измерение информации ГБОУ Школа 2098 Учитель ИиИКТ Федорова С.В.
Подходы к измерению информации Содержательный Количество информации в сообщении, получаемом человеком или системой. зависит от содержания Алфавитный Количество информации в тексте, представленном в виде последовательности символов некоторого алфавита. не зависит от содержания
Измерение информации (Содержательный)
Содержательный подход к измерению информации Для человека информация это знания человека. Получение новой информации приводит к расширению знаний. Если некоторое сообщение приводит к уменьшению неопределенности нашего знания, то можно говорить, что такое сообщение содержит информацию. Вывод: сообщение информативно (т.е. содержит ненулевую информацию), если оно пополняет знания человека. Например, прогноз погоды на завтра информативное сообщение, а сообщение о вчерашней погоде неинформативно, т.к. нам это уже известно. Нетрудно понять, что информативность одного и того же сообщения может быть разной для разных людей. Например: «2x2=4» информативно для первоклассника, изучающего таблицу умножения, и неинформативно для старшеклассника.
Единица измерения информации Нужна единица измерения, тогда мы сможем определять, в каком сообщении информации больше, в каком меньше. Единица измерения информации была определена в науке, которая называется теорией информации. Эта единица носит название «бит». Ее определение звучит так: Сообщение, уменьшающее неопределенность знаний в два раза, несет 1 бит информации. Неопределенность знаний о некотором событии это количество возможных результатов события.
Дается формула вычисления единицы измерения информации Если обозначить возможное количество событий, или, другими словами, неопределенность знаний N, а буквой I количество информации в сообщении о том, что произошло одно из N событий, то можно записать формулу: формула Хартли 2 i = N (формула Хартли для равновероятностных событий) Количество информации, содержащееся в сообщении о том, что произошло одно из N равновероятных событий, определяется из решения показательного уравнения: 2 i = N..
Задание 1 Сколько информации содержит сообщение о том, что из колоды карт достали король пик?
Решение зад.1 В колоде 32 карты. В перемешенной колоде выпадение любой карты равновероятное событие. N = 32 2 I = N 2 I = 32 2^5 = 32 I = 5 бит
Задача 2 Сколько информации содержит сообщение о выпадении грани с числом 3 на шестигранном игральном кубике?
Решение зад. 2 N = 6 2 I = N 2 I = 6 2^2 < 6 < 2^3 I = 3 бит
Разновероятностные события Существует множество ситуаций, когда возможные события имеют различные вероятности реализации. Примеры таких событий: 1. При случайном падении бутерброда вероятность падения его маслом вниз (более тяжёлой стороной) больше, чем маслом вверх. 2. В коробке 16 карандашей, из них 4 красных и 5 чёрных. Вероятность вытащить наугад красный карандаш больше, чем чёрный
Для вычисления количества информации в сообщении о неравновероятном событии используют следующую формулу: I=log 2 (1/p) (формула Шеннона) где I – это количество информации, р – вероятность события. Или 1/p= 2 I
Задание 1 В коробке 16 шаров, из них 4 белых. Определить количество информации в сообщении о вытаскивании наугад белого шара? P=4/16 Используем формулу 2 I= 1/p 1/(4/16)= 2 I 16/4=4= 2 I I= 2 бит
Задание 2 В корзине лежат 32 клубка красной и черной шерсти. Среди них 4 клубка красной шерсти. Сколько информации несет сообщение, что достали клубок красной шерсти?
Измерение информации (Алфавитный подход)
Алфавитный подход - это способ измерения информационного объема текста, не связанного с его содержанием.
Алфавит : набор букв; знаков препинания; цифр; скобок и других символов, используемых в тексте; пробел между словами.
МОЩНОСТЬ РУССКОГО АЛФАВИТА: 33 буквы 10 цифр 11 знаков препинания скобки пробел
N = 2 i где N – количество символов знаковой системы (мощностью алфавита); i – информационный вес символа.
Самое наименьшее число символов в алфавите: 2 (0 и 1)- двоичный алфавит. Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 БИТ.
Алфавит, из которого составляется «компьютерный текст», содержит 256 символов. 1 символ компьютерного алфавита «весит» 8 битов. N = 2 i 256 = 2 8 следовательно
Единицы измерения информации: 1 килобайт = 1024 байта 1 мегабайт = 1024 килобайта 1 гигабайт = 1024 мегабайта
Задачи Сообщение записанное буквами из 128 –символьного алфавита, содержит 30 символов. Какой объем информации оно несет?
1-г, 2-б, 3-б, 4-а. N = 2 i N= 128= 2 7, i = 7 бит (вес одного символа). Сообщение содержит 30 символов, следовательно 7×30= 210 бит
Сколько байтов составляет сообщение, содержащее 1000 бит? ОТВЕТ: 1 байт = 8 бит 1000: 8 = 125 байт
Информационное сообщение объёмом 5 Кбайт содержит 8192 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?
РЕШЕНИЕ: 5 Кб = 5120 байт = бит Сообщение содержит 8192 символа, следовательно i = 40960:8192 = 5 бит (вес одного символа). N=2 5 = 32 N = 2 i
Для записи текста использовался 32 – символьный алфавит. Каждая страница содержит 40 строк по 50 символов в строке. Какой объем информации содержит 7 страниц текста?
РЕШЕНИЕ: N= 32 = 2 5 i = 5 бит (вес одного символа) Вес одной страницы = 40×50×5 = бит = 1250 байт Объём 7 страниц = 7×1250 = 8750 байт N = 2 i
Сообщение занимает 5 станиц по 35 строк. В каждой строке записано по 60 символов. Сколько символов в алфавите, если все сообщение содержит 3750 байтов?
РЕШЕНИЕ: 3750 байт = бит 5×25×60= 7500 символов Один символ «весит» 30000: 7500 = 4 бита N= 2 4 = 16 N = 2 i
«Измерение информации» Тест
Вопрос 1. Наименьшая единица информации: A. Байт. Б. Кбайт. B. Бит. Г. Код. Д. Мбайт.
Вопрос 2. Байт это: A. Единица количества информации, изображаемая I или 0. Б. Средство изменить код буквы в ОЗУ. B. Последовательность из восьми бит. Г. Комбинация из четырех шестнадцатеричных цифр. Д. Максимальная единица измерения количества информации.
Вопрос 3. В одном килобайте содержится: А байт. Б бита. В. 8 байт. Г бит. Д байта.
Вопрос 4. Для кодирования одного символа используется: A. 1 байт. Б. 1 бит. B. 1 Кбайт. Г. 1 двоичное число. Д. 8 байт.
Вопрос 5. Вы спросили, знает ли учитель, сколько битов информации содержит молекула ДНК. Он ответил: «Нет». Ответ учителя содержит следующее количество информации: А. 1 бит Б. 3 бита В. 10 битов Г бита Д. 3 байта
Вопрос 6. В какой из последовательностей единицы измерения указаны в порядке возрастания А. байт, килобайт, мегабайт, гигабайт Б. гигабайт, килобайт, мегабайт, байт В. гигабайт, мегабайт, килобайт, байт Г. мегабайт, килобайт, байт, гигабайт
Правила оценивания: 6 вопросов – «5», 5 вопросов – «4», вопроса – «3», 2 и меньше – «2»
Домашнее задания 1. В классе 32 ученика. Какое количество информации содержится в сообщении о том, что к доске пойдёт Коля Сидоров.
2. Сообщение о том, что из корзины с разноцветными шарами (все шары разного цвета) достали зелёный шар, содержит 4 бита информации. Сколько шаров было в корзине?
4. В доме 4 подъезда, в каждом из которых по 16 этажей. Какое количество информации содержится в сообщении о том, что Иван живёт на пятом этаже в третьем подъезде?
5. Книга напечатана на ПК. Имеет 100 стр., на странице 70 строк, на строке 50 символов. Какой объем памяти ПК занимает книга (в Кбайт).
6. На ПК напечатана фраза: Каждый охотник желает знать, где сидит фазан. Какой объем памяти ПК занимает фраза в кодировке UNICODE (1 символ =2 байт).