Курсовая работа по теме Алгоритмы и технологии сжатия цифрового видео Выполнил: студент гр с-54 Куликов В.А
Основные проблемы с несжатым видео: -Большой видео поток -Несжатые данные занимают очень много места -Каналы передачи и возможности хранения ограничены Пример: Видео 720х576 пикселов 25 кадров в секунду в системе RGB и прогрессивной развертке потребует потока данных примерно в 240 Мбит/сек (т.е. 1.8 Гб в минуту). На DVD-ROM диск размером 4.7Гб войдет всего 2.5 минуты. => Нужно сжатие в 35 раз для записи фильма. Причины сжатия видео
Не существует метода оценки кадра полностью адекватному человеческому восприятию Не существует метода оценки пропущенных кадров, полностью адекватного человеческому восприятию Разные кодеки "затачиваются" под разные типы фильмов. Качество сжатия конкретного фильма может сильно зависеть от параметров кодирования. Любой кодек дает разное качество по кадрам одного и того же фильма
Технологии сжатия Без потерь качества С потерями качества Без потерь с точки зрения восприятия С естественной потерей качества С неестественными потерями качества
Что используется при сжатии Используется избыточность: Пространственная ( используется DCT или Wavelet преобразования) Временная (между кадрами, сжимается межкадровая разница) Цветового пространства ( RGB переводится в YUV и цветовые компоненты прореживаются) Когерентность областей изображения малое локальное изменение цвета Избыточность в цветовых плоскостях используется большая важность яркости для восприятия Подобие между кадрами на скорости 25 кадров в секунду соседние кадры, как правило, изменяются незначительно
Просторанственная и временная избыточность Пространственная избыточность – цвет большинства соседних точек одинаков. Временная избыточность – кадры весьма похожи
Межкадровая разница Именно такие кадры (с учетом поправки на компенсацию движения) и сжимает кодек. Их больше 99% в потоке. (Амплитуды – малы, изображение практически однородно)
Последовательное кодирование длины ПКД Особенности: 1)Хорошо подходит для черно-белых или 8 разрядных графических изображений, таких как кадры анимации. 2)Не подходит для естественных изображений с высоким разрешением. Кодек, использующий ПКД - Microsoft RLE (MRLE) КРАТКОЕ ОПИСАНИЕ ПКД кодирует последовательность пикселей одинакового цвета (например, черного или белого) как одиночное ключевое слово. Так, например, последовательность пикселей: может быть закодирована как 7 77 (семь 77).
Векторная квантизация VQ Особенности: 1)Процесс кодирования в вычислительном отношении интенсивен и не может быть выполнен в реальном времени без специализированных аппаратных средств. 2)Быстрый процесс декодирования. 3)Появление блочных артефактов при высоком сжатии. Кодеки, использующие VQ - Indeo, Cinepak КРАТКОЕ ОПИСАНИЕ При векторной квантизации изображение делится на блоки. Кодер идентифицирует класс подобных блоков и заменяет их на "универсальный" блочный представитель, составляет поисковую таблицу коротких двоичных кодов к "универсальным" блокам. Декодер использует поисковую таблицу, чтобы транслировать приблизительное изображение, составленное из "универсальных" блоков согласно поисковой таблице.
Дискретное косинус преобразование ДКП Особенности: 1)Появление блочных артефактов при высоком сжатии. 2)Излом острых граней. Случайное размытие в острых граней. 3)Большие требования к вычислительным мощностям. Кодеки, использующие ДКП - Motion JPEG, MPEG-1,MPEG-2, MPEG-4, H.261, H.263, H.266 КРАТКОЕ ОПИСАНИЕ ДКП - широко используемое преобразование при сжатии изображения. Данные о яркости и цвете сохраняются в виде коэффициента частоты.
Дискретное преобразование элементарной волны DWT Особенности: 1)большинство DWT кодеков осуществляют преобразование без блочных артефактов. 2)Алгоритмы сжатия, основанные на DWT, часто превосходят по быстродействию ДКП. 3)Субъективное качество видеоизображений, сжатых с DWT, может быть лучше, чем при ДКП с таким же коэффициентом сжатия. Кодеки, использующие DWT - - VxTremem, Intel Indeo 5.x, Intel Indeo 4.x
Кодирование разности кадров Особенности: 1)Может достигать лучшего сжатия, чем независимое кодирование отдельных кадров. 2)Ошибки накапливаются в кадрах после ключевого кадра, в конечном счете, требуя следующий ключевой кадр. КРАТКОЕ ОПИСАНИЕ Обычно изменения между соседними кадрами незначительны (например, в случае шара, летящего перед статическим фоном, большая часть изображения не меняется между кадрами). На этом основан алгоритм кодирования разности кадров.
Компенсация движения КД Особенности: 1) Cжатия видео выше, чем при кодировании разности кадров. 2)Стадия кодирования алгоритма КД в вычислительном отношении интенсивна. 3)Схема КД, используемая в международных стандартах MPEG, H.261, и H.263 работает лучше всего для сцен с ограниченным движением. Кодеки, использующие КД: VxTreme, MPEG-1,2, и 4, H.261, H.263, H.264 КРАТКОЕ ОПИСАНИЕ При сжатии, изображение делится на блоки. Для каждого блока кодируется вектор движения, указывающий на блок в предыдущем или следующем кадре, который схож с кодируемым блоком. Блок ссылки может совпадать с исходным или отличаться от него. Кодеку не требуется распознавать присутствие шара или другого объекта. Он лишь сравнивает блоки пикселей в декодированном кадре и кадре ссылки.
Типы кадров в потоке I-тип - кодирования данных на основе только текущего изображения; Р-тип - кодирование на основе текущего и предыдущего кадров; В-тип - кодирование с учетом текущего предыдущего и последующего кадров;
Форматы файлов -AVI (Audio Video Interlive) -MPEG (Motion Picture Experts Group) - ASF (Advanced Streaming Format)
AVI -Формат с перемежающимися блоками аудио- и видеоинформации -«Чанковый» формат -Неприспособленность к стримингу -Ограничение на размер файла в 2Гб
MPEG-1 -Битрейт порядка 1-2 Мбит/с -Произвольный доступ к фрагментам -Обратное воспроизведение -Быстрый поиск вперед/назад -Синхронизация видео и аудио потоков -Основная сфера применения MPEG-1 - формат VideoCD -Средний размер фильма 700mb
Свойства MPEG – 2 Совместимостьс MPEG-1 Поддержка множества форматов Видеопоследовательностей Кадровая/блочная структура картинки Кадровая/блочная двунаправленная адаптивная компенсация движения Кадровое/блочное адаптивное DCT Альтернативное сканирование DCT коэффициентов Формат картинки: (4:2:0),(4:2:2),(4:4:4) Нелинейная таблица квантования Отличия от MPEG-1 Кодирование последовательностей с интерлейсингом Масштабируемость– позволяет декодировать видеопотокс меньшим качеством, разрешением и частотой кадров, чем он был закодирован
MPEG-4 -Технология фрактального сжатия - Wavelet - MC - спрайты - обьекты с прозрачным фоном -3d-рендеринг -Встроенный язык описания BIFS
H.264 Кодирование
Метрики
Где x, y – пиксели изображений; n,m – размеры по горизонтали и вертикали. PSNR Метрика, которую часто используют на практике, называется мерой отношения сигнала к шуму (peak- to-peak signal-to-noise ratio PSNR).
Blocking measure Значение метрики пропорционально визуальной степени "блочности изображения. В контрастных областях кадра границы блоков почти незаметны, а в однородных та же граница будет хорошо видна
Bluring measure Данная метрика позволяет сравнить степень размытия двух изображений, относительно друг друга. Чем ближе её значение к 0, тем больше размыто изображение. Исходное Обработанное Bluring Measure Красный цвет - первое изображение чётче второго, зелёный цвет - второе изображение чётче первого.
Конец