Учитель информатики : Константинова Елена Ивановна Муниципальное образовательное учреждение Раменская средняя общеобразовательная школа 8.

Презентация:



Advertisements
Похожие презентации
Алгоритм построения орграфа Хаффмана (алгоритм сжатия) Учитель информатики: Константинова Елена Ивановна Муниципальное образовательное учреждение Раменская.
Advertisements

Сжатие информации Алгоритм Хаффмана. Сжатие информации Сжатие данных – сокращение объема данных при сохранении закодированного в них содержания.
Тема урока: «Алгоритмы сжатия текстовой информации» Учитель информатики МОУ школа 8 Зайцев А. И. г. о. Жуковский, 2013.
ИЗМЕРЕНИЕ ИНФОРМАЦИИ. ОБЪЁМНЫЙ ПОДХОД ИНФОРМАЦИЯ.
Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой.
1 из 25 Ответы I вариант 1) ) ) ) II вариант 1) ) )
Выполнила: Медведева Анастасия, Ученица 11А класса, МОУ СОШ 3. Руководитель: Глазунова Ольга Петровна, учитель информатики. «Сжатие данных. Алгоритм Хаффмана»
Презентацию подготовила Машкина Татьяна Анатольевна, учитель информатики МБОУ «СОШ 92»
Кодирование текстовой информации. Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называет­ся текстовой информацией.
Алфавитный подход к определению количества информации.
это информация, выраженная в письменной форме преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код. преобразование.
Алфавитный подход к определению количества информации Глава Н. Угринович. Базовый курс. 8 класс.
Двоичное кодирование текстовой информации. Для кодирования одного символа требуется 1 байт информации. Если рассматривать символы как возможные события,
Системы счисления и кодирование информации Вербицкая Ольга Владимировна, Заозерная школа 16 Подготовка к ЕГЭ Занятие 1.
Текстовая информация. Кодирование текстов Мощность алфавита символов Двоичный код каждого символа в тексте – 1 байт Таблица кодировки- таблица соответствия.
Измерение информации. Представление чисел в компьютере.
Измерение информации. Алфавитный подход. Алфавитный (объемный) подход к измерению информации применяется в цифровых (компьютерных) системах хранения и.
Кодирование текстовой информации. Историческая справка.
Кодирование, декодирование информации. Демонстрационный материал при подготовке к экзаменам в 11 классе.
Транксрипт:

Учитель информатики : Константинова Елена Ивановна Муниципальное образовательное учреждение Раменская средняя общеобразовательная школа 8

Давид Хаффман ( ) Давид начал свою научную карьеру студентом в Массачусетсом технологическом институте (MIT), где построил свои коды в начале пятидесятых годов прошлого века.

авд,енрот_ авд,енрот_ Вначале нужно подсчитать количество вхождений каждого символа в тексте. Создаем первый узел

авд,енрот_ авд,енрот_ Создаем еще один узел

авд,енрот_ авд,енрот_

авд,енрот_

авд,енрот_

авд,енрот_

авд,енрот_

ТЕПЕРЬ ОПРЕДЕЛЯЕМ КОДЫ СИМВОЛОВ, ДВИГАЯСЬ ОТ КОРНЯ К СООТВЕТСТВУЮЩЕМУ СИМВОЛУ. В ТРЕТЬЕЙ СТРОКЕ ТАБЛИЦЫ УКАЗАНЫ СКОЛЬКО РАЗ ВСТРЕЧАЕТСЯ ДЛИННАЯ БУКВА В СООБЩЕНИИ. авд, енрот _

ПОДСЧИТАЕМ, СКОЛЬКО ДВОИЧНЫХ СИМВОЛОВ ОКАЖЕТСЯ В СООБЩЕНИИ « НА _ ДВОРЕ _ ТРАВА,_ НА _ ТРАВЕ _ ДРОВА » ДЛЯ ЭТОГО НАДО НАЙТИ ПРОИЗВЕДЕНИЕ ЧИСЛА СИМВОЛОВ В КОДЕ КАЖДОЙ БУКВЫ НА КОЛИЧЕСТВО РАЗ, КОТОРОЕ ЭТА БУКВА ВСТРЕЧАЕТСЯ В СООБЩЕНИИ, А ЗАТЕМ ПОЛУЧЕННЫЕ ПРОИЗВЕДЕНИЯ СЛОЖИТЬ. ПОЛУЧАЕМ : 2*6+ 3*4+ 4*2+ 4*1+ 4*2+ 4*2 +3*4 +4*2 +4*2 +3*5 = 95

ПОСКОЛЬКУ В СООБЩЕНИИ ИСПОЛЬЗУЕТСЯ 10 РАЗЛИЧНЫХ СИМВОЛОВ, ДЛЯ ИХ КОДИРОВАНИЯ ТРЕБУЕТСЯ КАК МИНИМУМ ЧЕТЫРЕХБИТОВЫЕ ЦЕПОЧКИ. ПОЭТОМУ ПОСЛЕ КОДИРОВАНИЯ ДАННОГО СООБЩЕНИЯ ПОЛУЧИТСЯ ЦЕПОЧКА ОБЪЕМОМ 120 БИТ. КОЭФФИЦИЕНТ СЖАТИЯ ЭТО ОТНОШЕНИЕ ОБЪЕМА ИСХОДНОГО СООБЩЕНИЯ К ОБЪЕМУ СЖАТОГО. В НАШЕМ СЛУЧАЕ ЭТО ОТНОШЕНИЕ РАВНО 120/95 = 120/95 = 1,26.

НА САМОМ ДЕЛЕ ДАННОЕ СООБЩЕНИЕ В ПАМЯТИ КОМПЬЮТЕРА ЗАКОДИРОВАНО С ПОМОЩЬЮ ASCII, ПОЭТОМУ НА КАЖДЫЙ СИМВОЛ ОТВЕДЕНО 8 БИТ. ТЕМ САМЫМ, ОБЪЕМ ИСХОДНОГО СООБЩЕНИЯ 240 БИТ, А КОЭФФИЦИЕНТ СЖАТИЯ СОСТАВЛЯЕТ 240/95 = 2,53. ИЗ ЭТОГО ВИДНО, КАКОЙ ВЫИГРЫШ МЫ ПОЛУЧИЛИ, ЕСЛИ ЭТО СООБЩЕНИЕ НУЖНО БЫЛО БЫ ПЕРЕДАТЬ ПО КАНАЛУ СВЯЗИ ИЛИ СОХРАНИТЬ НА КАКОМ - ЛИБО НОСИТЕЛЕ.

ДЛЯ ДЕКОДИРОВНИЯ СЖАТОГО СООБЩЕНИЯ ВМЕСТЕ С НИМ ОБЫЧНО ПЕРЕСЫЛАЮТ НЕ КОДЫ ИСХОДНЫХ СИМВОЛОВ ( Т. Е. ПЕРВЫЕ ДВЕ СТРОКИ ), А САМ ОРГРАФ ХАФФМАНА ( БЕЗ УКАЗАНИЯ ВЕСА КОРНЯ И РАЗМЕТКИ НА ДУГАХ, ИБО ОНА СТАНДАРТНА : ДУГА, ИДУЩАЯ ВЛЕВО, РАЗМЕЧАЕТСЯ 0, А ИДУЩАЯ ВПРАВО -1). НА ЭТОМ, ОКАЗЫВАЕТСЯ, ТО ЖЕ МОЖНО СЭКОНОМИТЬ. МАТЕМАТИКИ ДОКАЗАЛИ, ЧТО СРЕДИ АЛГОРИТМОВ КОДИРУЮЩИХ КАЖДЫЙ СИМВОЛ ПО ОТДЕЛЬНОСТИ И ЦЕЛЫМ КОЛИЧЕСТВОМ БИТ АЛГОРИТМ ХАФФМАНА ОБЕСПЕЧИВАЕТ НАИЛУЧШЕЕ СЖАТИЕ.

Используемая литература : А. Г. Гейн. Математические основы информатики. Педагогический университет « Первое сентября », 2008 г.