Сжатие двоичного кода
Для того чтобы сэкономить место на внешних носителях (винчестерах, флэш дисках) и ускорить передачу информации по компьютерным сетям, нужно ее сжать – уменьшить информационный объем, сократить длину двоичного кода. Возможны две ситуации при сжатии: 1) Потеря информации в результате сжатия недопустима; 2) Допустима частичная потеря информации в результате сжатия. При упаковке данных в файловые архивы производится их сжатие без потери информации. Сжатие с частичной потерей информации производится при сжатии кода изображения (графики, видео) и звука. Сжатие без потери информации: - использование неравномерного кода; - выявление повторяющихся фрагментов кода.
Коэффициентом сжатия называют отношение длины кода в байтах после сжатия к его длине до сжатия. Раскодирование (распаковка) текста производится с помощью двоичного дерева кодирования Хаффмана. Деревом называется графическое представление (граф) структуры связей между элементами некоторой системы. Двоичным деревом называется дерево, в котором любая вершина, имеет не более двух потомков. Корнем дерева называется единственная вершина, не имеющая родительской вершины. Листьями дерева называются вершины, не имеющие потомков.