Приемы и методы работы со сжатыми данными Борисов В.А. КАСК – филиал ФГБОУ ВПО РАНХ и ГС Красноармейск 2011 г.
22 Теоретические основы сжатия данных
3 Система кодирования Степеньизбыточности Тип данных
4 Архиваторы Программные средства, выполняющие сжатие данных.
5Объектысжатия файлы папки диски
6 Обратимость сжатия
7 Способыуменьшенияизбыточности изменение содержания и структуры данных изменение структуры данных изменение содержания данных
8 Характерные форматы сжатия с потерей информации.JPG для графических данных;.MPG для видеоданных;.МРЗ для звуковых данных.
9 Характерные форматы сжатия без потери информации.GIF,.TIF,.PCX и многие другие для графических данных;.AVI для видеоданных;.ZIP,.ARJ,.RAR,.LZH,.LH,.CAB и др. для любых типов данных.
10 Алгоритмы обратимых методов
11 Теорема 1 Для любой последовательности данных существует теоретический предел сжатия, который не может быть превышен без потери части информации.
12 Теорема 2 Для любого алгоритма сжатия можно указать такую последовательность данных, для которой он обеспечит лучшую степень сжатия, чем другие методы.
13 Теорема 3 Для любого алгоритма сжатия можно указать такую последовательность данных, для которой данный алгоритм вообще не позволит получить сжатия.
14 Свойства алгоритмов сжатия
15 Алгоритм RLE Выявляет повторяющиеся последовательности данных и заменяет их простой структурой, в которой указывается код данных и коэффициент повтора.
16 Пример: 0; 0; 0; 127; 127; 0; 255; 255; 255; 255
17 Алгоритм KWE Кодирует лексические единицы исходного документа группами байтов фиксированной длины.
18 Токен Пары байтов, образующиеся при двухбайтной кодировке слов англоязычных текстов.
19 Алгоритм Хаффмана В основе этого лежит кодирование битовыми группами.
20 Кодирование русского алфавита по алгоритму Хаффмана
21 Синтетические алгоритмы Предварительно просматривают и анализируют исходные данные для индивидуальной настройки алгоритма на особенности обрабатываемого материала.
22 Программные средства сжатия данных
23 Базовые требования к диспетчерам архивов Современные средства архивации данных называют диспетчерами архивов.
24 Базовые функции диспетчеров архивов извлечение файлов из архивов; создание новых архивов; добавление файлов в имеющийся архив; создание самораспаковывающихся архивов;
25 Базовые функции диспетчеров архивов создание распределенных архивов на носителях малой емкости; тестирование целостности структуры архивов; полное или частичное восстановление поврежденных архивов; защита архивов от просмотра и несанкционированной модификации.
26 Самораспаковывающиеся архивы Готовятся на базе обычного архива путем присоединения к нему небольшого программного модуля.
27 Распределенные архивы Один архив распределяют в виде малых фрагментов на нескольких носителях.
28 Оптимальный режим работы с распределенными архивами создание набора файлов распределенного архива в папке на жестком диске; копирование файлов распределенного архива на отдельные сменные носители; перенос сменных носителей в место назначения; копирование файлов распределенного архива со сменных носителей в одну папку на конечном жестком диске; распаковка распределенного архива.
29 Защита архивов В большинстве случаев выполняется с помощью пароля, который запрашивается при попытке просмотреть, распаковать или изменить архив.
30 Дополнительные требования к диспетчерам архивов Сервисные функции, делающие работу более удобной, реализуются внешним подключением дополнительных служебных программ
31 Функции диспетчеров архивов просмотр файлов различных форматов без извлечения их из архива; поиск файлов и данных внутри архивов; установка программ из архивов без предварительной распаковки; проверка отсутствия компьютерных вирусов в архиве до его распаковки;
32 Функции диспетчеров архивов криптографическая защита архивной информации; декодирование сообщений электронной почты; «прозрачное» уплотнение исполнимых файлов.ЕХЕ и.DLL; создание самораспаковывающихся многотомных архивов; выбор или настройка коэффициента сжатия информации.
33 Программные средства уплотнения носителей
34 Уплотнение носителей Сжатие данных за счет уменьшения избыточности путем изменения структуры.
35 Особенности уплотнения носителей процесс уплотнения носителей является относительным; процесс сжатия данных происходит под управлением программ, работающих автоматически в фоновом режиме; наблюдаемое приращение емкости носителя не является величиной постоянной; размер свободного пространства на сжатом томе определяется как произведение реального свободного пространства и предполагаемого коэффициента сжатия.
36 Практическая реализация концепции уплотнения дисков
37 Файл сжатого тома Скрытый файл, предназначенный для записи сжатых данных.
38 Несущий диск Физический диск, на котором размещен файл сжатого тома.
39 «Присоединение» уплотненного диска ОС может рассматривать его как обычный несущий диск, на котором расположен файл сжатого тома; ОС может рассматривать тот же диск через посредство драйвера сжатого тома.
40 Целесообразность уплотнения носителей Наличие такого носителя в компьютерной системе затрудняет ее обслуживание и снижает надежность.