Разрешение и графические форматы
Формула Шеннона H = P 1 *log 2 (1 / P 1 ) P n *log 2 (1 / P n ), где H - количество бит информации в одном символе сообщения, или энтропия символа сообщения; P 1,..., P n - вероятность появления символа в тексте сообщения
Методысжатияизображений С потерями Без потерь
В основе всех методов сжатия лежит простая идея: если представлять часто используемые элементы короткими кодами, а редко используемые - длинными кодами, то для хранения блока данных требуется меньший объем памяти, чем если бы все элементы представлялись кодами одинаковой длины
Сжатие без потерь Сжатием блока без потерь называется такое его описание, при котором создаваемый сжатый блок содержит меньше битов, чем исходный, но по нему возможно однозначное восстановление каждого бита исходного блока
Сжатие с потерями (lossy compression) - это два разных процесса: 1) выделение сохраняемой части информации с помощью модели, зависящей от цели сжатия и особенностей источника и приемника информации; 2) собственно сжатие, без потерь.
Эффективность сжатия учитывает не только степень сжатия (отношение длины несжатых данных к длине соответствующих им сжатых данных), но и скорость сжатия. Эффективность сжатия учитывает не только степень сжатия (отношение длины несжатых данных к длине соответствующих им сжатых данных), но и скорость сжатия. Коэффициент сжатия, определяется как отношение длины сжатых данных к длине соответствующих им несжатых. Коэффициент сжатия, определяется как отношение длины сжатых данных к длине соответствующих им несжатых.
Базовые стратегии сжатия 1. Преобразование потока ("Скользящее окно-словарь"); 2. Статистическая стратегия: а) адаптивная (поточная); б) блочная; 3. Преобразование блока.
Преобразование потока Представляет собой описание поступающих данных через уже обработанные, т. е. комбинации поступающих элементов предсказуемы по уже обработанным комбинациям. В результате преобразования может быть сформировано несколько потоков. Даже если суммарный объем потоков увеличивается, их структура улучшается и последующее сжатие можно осуществить проще, быстрее и лучше.
Статистическая стратегия а) Адаптивная (поточная). Основывается на вычислении вероятностей для поступающих данных на основании статистики по уже обработанным данным. Считаются вероятными все комбинации, даже те, которые еще не встречались в потоке и скорее всего никогда не встретятся. б) Блочная. Отдельно кодируется и добавляется к сжатому блоку его статистика.
Преобразование блока Входящие данные разбиваются на блоки, которые затем трансформируются целиком, а в случае блока однородных данных лучше брать весь блок, который требуется сжать.
Особенности изображений 1. Изображение (как и видео) обычно требует для хранения гораздо большего объема памяти, чем текст 2. Человеческое зрение при анализе изображения оперирует контурами, общим переходом цветов и сравнительно нечувствительно к малым изменениям в изображении. 3. Изображение обладает избыточностью в двух измерениях
Основополагающие алгоритмы сжатия Символ, встречающийся в тексте часто кодировался кодом меньшей длины (алгоритмы Шеннона и Хаффмана) Символ, встречающийся в тексте часто кодировался кодом меньшей длины (алгоритмы Шеннона и Хаффмана) Формирование «словаря» общих последовательностей ( алгоритмы Лемпеля и Зива) Формирование «словаря» общих последовательностей ( алгоритмы Лемпеля и Зива) Арифметическое кодирование не только следит за частотой появления байта в файле, но и оценивает частоту его появления в определенном контексте Арифметическое кодирование не только следит за частотой появления байта в файле, но и оценивает частоту его появления в определенном контексте
Недостатки алгоритмов сжатия возможно увеличение размера файла возможно увеличение размера файла удаление файла вместо архивирования удаление файла вместо архивирования ухудшение качества изображения ухудшение качества изображения
Разрешение Пространственное разрешение характеризует количество мельчайших элементов информации, из которых состоит изображение. Пространственное разрешение характеризует количество мельчайших элементов информации, из которых состоит изображение. Яркостное (цветовое) разрешение или глубина цвета характеризует количество уровней яркости, которые может воспринимать отдельный пиксел. Яркостное (цветовое) разрешение или глубина цвета характеризует количество уровней яркости, которые может воспринимать отдельный пиксел.
Определение размера файла Размер файла (Кбайт) = Ширина Высота (Пространственное разрешение) 2 Цветовое разрешение, где Ширина и Высота измеряются в единицах длины Пространственное разрешение в ppi или dpi Цветовое разрешение в байтах (1 байт=8 бит)
Единицы измерения разрешения Spi (элементов на дюйм) Spi (элементов на дюйм) Dpi (точек на дюйм) Dpi (точек на дюйм) Ppi (пикселов на дюйм) Ppi (пикселов на дюйм) Lpi (линий на дюйм) Lpi (линий на дюйм)
Растровая графика файл Графическая информация информация Неграфическаяинформация
Методы хранения хранения данных Полноцветныеизображения Ограниченныйцветовойдиапазон
Полноцветные изображения Пиксель может принимать любое из более чем 16 миллионов значений, поэтому цвет пикселя хранится как 24-разрядное значение - по 8 битов на красную, зеленую и синюю компоненты цвета
Ограниченный цветовой диапазон Цветовая информация хранится с использованием палитры. Информация о пикселе указывает на строку в палитре, а она, в свою очередь, содержит цвет
Алгоритм архивации без потерь RLE Изображение вытягивается в цепочку байт по строкам растра. Сжатие происходит за счет того, что в исходном изображении встречаются цепочки одинаковых байт. Замена их на пары уменьшает избыточность данных. Алгоритм рассчитан на деловую графику - изображения с большими областями повторяющегося цвета.
Алгоритм архивации без потерь LZW Последовательно считываются символы входного потока и проверяется, есть ли в созданной хэш-таблице такая строка. Если строка есть, то считывается следующий символ, а если строки нет, то строка заносится в таблицу и поиск начинается снова. LZW реализован в форматах GIF и TIFF
Алгоритм архивации Хаффмана без потерь Использует частоту появления одинаковых байт в изображении. Сопоставляет символам входного потока, которые встречаются большее число раз, цепочку бит меньшей длины. И, напротив, встречающимся редко - цепочку большей длины. Для сбора статистики требует двух проходов по изображению.
Алгоритм архивации с потерями JPEG Оперирует областями 8 х 8 пиксель, на которых яркость и цвет меняются сравнительно плавно. Вследствие этого, при разложении матрицы такой области в двойной ряд по косинусам значимыми оказываются только первые коэффициенты. Таким образом, сжатие в JPEG осуществляется за счет плавности изменения цветов в изображении.
Достоинства алгоритма: задается степень сжатия задается степень сжатия выходное цветное изображение может иметь 24 бита на точку. выходное цветное изображение может иметь 24 бита на точку. Недостатки алгоритма: при повышении степени сжатия изображение распадается на отдельные квадраты (8x8) при повышении степени сжатия изображение распадается на отдельные квадраты (8x8) проявляется эффект Гиббса - ореолы по границам резких переходов цветов. проявляется эффект Гиббса - ореолы по границам резких переходов цветов.
Фрактальный алгоритм архивации с потерями Фрактальная компрессия - это поиск самоподобных областей в изображении и определение для них параметров аффинных преобразований. Преобразованию подвергаются точки в трехмерном пространстве (х_координата, у_координата, яркость).
Волновой алгоритм архивации с потерями Исходит из идеи использования когерентности областей в изображении. Ориентирован на цветные и черно-белые изображения с плавными переходами. Идея заключается в том, что в файл сохраняется разница между средними значениями соседних блоков в изображении, которая обычно принимает значения, близкие к 0.
Форматы документов растровой графики
Формат TIFF доступен весь диапазон цветовых моделей доступен весь диапазон цветовых моделей используются дополнительные альфа-каналы сохранения масок используются дополнительные альфа-каналы сохранения масок является лучшим выбором при импорте растровой графики в векторные программы является лучшим выбором при импорте растровой графики в векторные программы
Формат BMP хранится информация о каждой точке изображения (координата и цвет) хранится информация о каждой точке изображения (координата и цвет) цвет выбирается из таблицы цветов, формируемой в зависимости от возможностей монитора и типа сохраняемого файла цвет выбирается из таблицы цветов, формируемой в зависимости от возможностей монитора и типа сохраняемого файла
Формат GIF использует LZW-компрессию использует LZW-компрессию позволяет записывать изображение "через строчку" позволяет записывать изображение "через строчку" можно назначить один или более цветов прозрачными, и они станут невидимыми в интернетовских браузерах и некоторых других программах можно назначить один или более цветов прозрачными, и они станут невидимыми в интернетовских браузерах и некоторых других программах позволяет создавать GIF-анимацию позволяет создавать GIF-анимацию
Формат PNG используется эффективный алгоритм чересстрочности используется эффективный алгоритм чересстрочности позволяет сохранять всю цветовую информацию и информацию об альфа-каналах масок и слоев позволяет сохранять всю цветовую информацию и информацию об альфа-каналах масок и слоев позволяет хранить полноцветные изображения с цветовой глубиной 24 и 48 бит/пиксел позволяет хранить полноцветные изображения с цветовой глубиной 24 и 48 бит/пиксел позволяет хранить в файле коэффициент яркости дисплея, на котором было создано изображение позволяет хранить в файле коэффициент яркости дисплея, на котором было создано изображение
Формат PSD Позволяет сохранять изображение с массой дополнительных атрибутов, включая слои, их маски дополнительные альфа-каналы, каналы плашечных цветов, контуры и все остальное, что может делать Photоshop
Универсальные и векторные графические форматы Большинство векторных форматов могут содержать внедренные в файл растровые объекты или ссылку на растровый файл (технология OPI)
Форматы PDF- формат WMF – формат Djvu- формат