Формула Шеннона
Задача: Какое сообщение содержит большее количество информации? В библиотеке 8 шкафов. Книга нашлась в 3-м шкафу; Вася получил за экзамен оценку 4 (по 5-бальной системе единицы не ставят). Бабушка испекла 12 пирожков с капустой, 12 пирожков с повидлом. Маша съела один пирожок. Бабушка испекла 8 пирожков с капустой, 16 пирожков с повидлом. Маша съела один пирожок. Существует много таких ситуаций, у которых вероятности реализации различаются. Например, если бросают несимметричную монету или "правило бутерброда". Сегодня на уроке мы должны ответить на вопрос: как вычислить количество информации в сообщении о неравновероятном событии.
Вычисление количества информации в сообщении о неравновероятном событии Для вычисления количества информации в сообщении о неравновероятном событии используют следующую формулу: I=log 2 (1/p) где I – это количество информации, р – вероятность события. Вероятность события выражается в долях единицы и вычисляется по формуле: р=K/N, где К – величина, показывающая сколько раз произошло интересующее нас событие, N – общее число возможных исходов какого-то процесса.
Вернемся к нашей задаче. Пусть К 1 – это количество пирожков с повидлом, К 1 =24 К 2 – количество пирожков с капустой, К 2 =8 N – общее количество пирожков, N = К 1 +К 2 =24+8=32 Вычислим вероятность выбора пирожка с разной начинкой и количество информации, которое при этом было получено. Вероятность выбора пирожка с повидлом: р 1 =24/32=3/4=0,75. Вероятность выбора пирожка с капустой: р 2 =8/32=1/4=0,25. Обратим внимание на то, что в сумме все вероятности дают 1. Вычислим количество информации, содержащееся в сообщении, что Маша выбрала пирожок с повидлом: I 1 =log 2 (1/p 1 )= log 2 (1/0,75)= log 2 1,3=1,15470 бит. Вычислим количество информации, содержащееся в сообщении, если был выбран пирожок с капустой: I 2 =log 2 (1/p 2 )= log 2 (1/0,25)= log 2 4=2 бит.
Зависимость между вероятностью и количеством информации При сравнении результатов вычислений получается следующая ситуация: вероятность выбора пирожка с повидлом больше, чем с капустой, а информации при этом получилось меньше. Это не случайность, а закономерность. Качественную связь между вероятностью события и количеством информации в сообщении об этом событии можно выразить так: чем меньше вероятность некоторого события, тем больше информации содержит сообщение об этом событии. Ответить на этот вопрос нам поможет формула вычисления количества информации для событий с различными вероятностями, которую предложил в 1948 г. американский инженер и математик К.Шеннон.
Формула Шеннона Если I-количество информации, N-количество возможных событий, р i - вероятности отдельных событий, где i принимает значения от 1 до N, то количество информации для событий с различными вероятностями можно определить по формуле: можно расписать формулу в таком виде: Рассмотрим формулу на нашем примере: I = - (р 1 log 2 p 1 + р 2 log 2 p 2 )= - (0,25 log 2 0,25+0,75 log 2 0,75) -(0,25(-2)+0,75(-0,42))=0,815 бит
Задача В корзине лежат 32 клубка красной и черной шерсти. Среди них 4 клубка красной шерсти. Сколько информации несет сообщение, что достали клубок красной шерсти? Сколько информации несет сообщение, что достали клубок шерсти любой окраски? Дано: К к =4;N=32. Найти: I к, I. Решение: Найдем количество клубков черной шерсти: К ч =N- К к ; К ч =32-4=28 Найдем вероятность доставания клубка каждого вида: p к = К к /N=4/32=1/8; p ч = К ч /N=28/32=7/8. Найдем количество информации, которое несет сообщение, что достали клубок красной шерсти: I к = log 2 (1/p к )= log 2 (1:(1/8))= log 2 8=3 бит Найдем количество информации, которое несет сообщение, что достали клубок шерсти любой окраски: Ответ: I к =3 бит; I=0,547 бит
Применение ЭТ Excel для решения задач на нахождение количества информации Задача 2 В озере обитает окуней, пескарей, а карасей и щук по Какое количество информации несет сообщение о ловле рыбы каждого вида. Сколько информации мы получим, когда поймаем какую-нибудь рыбу? Дано: К о =12500; К п =25000; К к = К щ =6250 Найти: I о, I п, I к, I щ, I Решение: Найдем общее количество рыбы: N= К о +К п +К к +К щ. Найдем вероятность ловли каждого вида рыбы: p о = К о /N; p п = К п /N; p к = p щ = К к /N. Найдем количество информации о ловле рыбы каждого вида: I о = log 2 ( 1/p о ); I п =log 2 (1/p п ); I к = I щ = log 2 (1/p к ) Найдем количество информации о ловле рыбы любого вида: I= p о log 2 p о + p п log 2 p п +p к log 2 p к +p щ log 2 p щ
Применение ЭТ Excel для решения задач на нахождение количества информации Рис. 1. Режим отображения формул Рис. 2. Отображение результатов вычислений
Практическая работа Задание: 1. Сделать табличную модель для вычисления количества информации. 2. Используя табличную модель, сделать вычисления к задаче 2 (рис.3), результат вычисления занести в тетрадь. 3. Используя таблицу-шаблон, решить задачи 3,4 (рис.4, рис.5), решение оформить в тетради. 4. Сохранить таблицы в своих папках под именем «инф_вероятность». Задача 2 В классе 30 человек. За контрольную работу по информатике получено 15 пятерок, 6 четверок, 8 троек и 1 двойка. Какое количество информации несет сообщение о том, что Андреев получил пятерку? Задача3 В коробке лежат кубики: 10 красных, 8 зеленых, 5 желтых, 12 синих. Вычислите вероятность доставания кубика каждого цвета и количество информации, которое при этом будет получено. Задача4 В непрозрачном мешочке хранятся 10 белых, 20 красных, 30 синих и 40 зеленых шариков. Какое количество информации будет содержать зрительное сообщение о цвете вынутого шарика?
Ответы: Рис. 3 Рис. 4 Рис. 5
Домашнее задание: Подготовиться к контрольной работе!