Обработка изображений
Общая информация Страница курса Этот курс подготовлен и читается при поддержке
На предыдущей лекции S ML Wavelength Power Камера-обскура Фотоаппарат, глаз Цвет Психологическое свойство человека Свет описывается спектром Сетчатка глаза Колбочки 3х видов Трихроматическая теория 3 канала для пиксель Адаптация зрения Цветовой баланс, «баланс белого» Серые карточки, «серый мир»
Обработка изображений Семейство методов и задач, где входной и выходной информацией являются изображения. Примеры : Устранение шума в изображениях Улучшение качества изображения Усиления полезной и подавления нежелательной (в контексте конкретной задачи) информации
Обработка изображений Зачем обрабатывать? 1.Улучшение изображения для восприятия человеком цель – чтобы стало «лучше» с субъективной точки зрения человека 2.Улучшение изображения для восприятия компьютером цель – упрощение последующего распознавания 3.Развлечение (спецэффекты) цель – получить эстетическое удовольствие от красивого эффекта
Цифровое изображение Вспоминаем процесс получения цифрового изображения…
Почему оно может получиться плохо? Ограниченный диапазона чувствительности датчика Плохой функции передачи датчика
Что такое гистограмма? Гистограмма – это график распределения яркостей на изображении. На горизонтальной оси - шкала яркостей тонов от белого до черного, на вертикальной оси - число пикселей заданной яркости
Изменение контраста изображения Что может не устраивать в полученном изображении: Узкий или смещенный диапазон яркостей пикселей (тусклое или «пересвеченое» изображение) Концентрация яркостей вокруг определенных значений, неравномерное заполнение диапазона яркостей (узкий диапазон - тусклое изображение) Коррекция - к изображению применяется преобразование яркостей, компенсирующий нежелательный эффект: y – яркость пикселя на исходном изображении, x – яркость пикселя после коррекции.
Линейная коррекция Компенсация узкого диапазона яркостей – линейное растяжение: График функции f -1 (y)
Линейная коррекция Компенсация узкого диапазона яркостей – линейное растяжение:
Линейная коррекция Линейное растяжение – «как AutoContrast в Photoshop»
Линейная коррекция Линейная коррекция помогает не всегда!
Нелинейная коррекция График функции f -1 (y) y x
Нелинейная коррекция Нелинейная компенсация недостаточной контрастности Часто применяемые функции: Гамма-коррекция Изначальная цель – коррекция для правильного отображения на мониторе. Логарифмическая Цель – сжатие динамического диапазона при визуализации данных
Гамма-коррекция Графики функции f -1 (y)
Нелинейная коррекция График функции f -1 (y)
Цветовая коррекция Изменение цветового баланса Компенсация: –Неверного цветовосприятия камеры –Цветного освещения Ряд алгоритмов рассмотрели на предыдущей лекции
Цветовая коррекция изображений Растяжение контрастности (autolevels) Идея – растянуть интенсивности по каждому из каналов на весь диапазон; Метод: Найти минимум, максимум по каждому из каналов: Преобразовать интенсивности:
Растяжение контрастности
Шумоподавление Причины возникновения шума: –Несовершенство измерительных приборов –Хранение и передача изображений с потерей данных Шум фотоаппарата Сильное сжатие JPEG
Цель: подавление шума Пусть дана камера и статичная сцена, требуется подавить шум. Простейший вариант: усреднить несколько кадров Source: S. Seitz
Заменим каждый пиксель взвешенным средним по окрестности Веса обозначаются как ядро фильтра Веса для усреднения задаются так: Усреднение box filter Source: D. Lowe
Пусть f – изображение, g -ядро. Свертка изображения f с помощью g обозначается как f * g. Определение свертки f Source: F. Durand Соглашение: ядро перевернуто MATLAB: conv2 vs. filter2 (also imfilter)
Основные свойства Линейность: filter(f 1 + f 2 ) = filter(f 1 ) + filter(f 2 ) Инвариантность к сдвигу: не зависит от сдвига пиксела: filter(shift(f)) = shift(filter(f)) Теория: любой линейный оператор, инвариантный к сдвигу, может быть записан в виде свертки Slide by S. Lazebnik
Свойства Коммутативность: a * b = b * a Нет никакой разницы между изображением и ядром фильтра Ассоциативность: a * (b * c) = (a * b) * c Последовательное применение фильтров: (((a * b 1 ) * b 2 ) * b 3 ) Эквивалентно применению такого фильтра: a * (b 1 * b 2 * b 3 ) Дистрибутивность по сложению: a * (b + c) = (a * b) + (a * c) Домножение на скаляр можно вынести за скобки: ka * b = a * kb = k (a * b) Единица: e = […, 0, 0, 1, 0, 0, …], a * e = a Slide by S. Lazebnik
Детали реализации Размер результирующего изображения? MATLAB: filter2(g, f, shape) shape = full: output size is sum of sizes of f and g shape = same: output size is same as f shape = valid: output size is difference of sizes of f and g f gg gg f gg g g f gg gg full samevalid Slide by S. Lazebnik
Детали реализации Как происходит фильтрация по краям? Окно фильтра выходит за границы изображения Необходимо экстраполировать изображение Варианты: –clip filter (black) –wrap around –copy edge –reflect across edge Source: S. Marschner
Простейшие фильтры Original ? Source: D. Lowe
Простейшие фильтры Original Filtered (no change) Source: D. Lowe
Простейшие фильтры Original ? Source: D. Lowe
Простейшие фильтры Original Shifted left By 1 pixel Source: D. Lowe
Простейшие фильтры Original ? Source: D. Lowe
Простейшие фильтры Original Blur (with a box filter) Source: D. Lowe
Сглаживание с box-фильтром Результат сглаживание с помощью усреднения отличается от разфокусированного изображения Точка света, наблюдаемая с расфокусированного объектива, выглядит как кружок света, а усреднение дает квадратик Source: D. Forsyth
Сглаживание Точка света, наблюдаемая с расфокусированного объектива, выглядит как кружок света, а усреднение дает квадратик Другой способ: взвешивает вклад пикселей по окрестности с учетом близости к центру: fuzzy blob Slide by S. Lazebnik
Point Spread Function (PSF) Point spread function (PSF) – отклик оптической системы на точечный источник света (объект)
Ядро фильтра гаусса x 5, = 1 Source: C. Rasmussen
Выбор размера ядра Размер ядра дискретного фильтра ограничен Source: K. Grauman
Выбор размера ядра Эмпирика: полуразмер фильтра равен 3σ Slide by S. Lazebnik
Сглаживание фильтром гаусса
Сравнение Slide by S. Lazebnik
Свойства фильтра Гаусса Свертка с сами собой дает тоже фильтр гаусса Сглаживание несколько раз фильтром с маленьким ядром дает результат, аналогичный свертке с большим ядром Свертка 2 раза с фильтром радиуса σ дает тот же результат, что с фильтром радиуса σ2 Source: K. Grauman
Маленькая экскурсия к Фурье + Низкие частоты Высокие частоты
Фильтр Гаусса (gaussian blurring) Результат свертки фильтром гаусса и усреднения Исходное изображениеФильтр Гаусса с Sigma = 4 Усреднение по 49 пикселям (7x7) Важное свойство фильтра Гаусса – он по сути является фильтром низких частот.
Сепарабельность Source: D. Lowe Сепарабельное ядро Раскладывается в произведение двух одномерных фильтром гаусса
Пример * * = = 2D свертка Source: K. Grauman Фильтр раскладывается в произведение двух 1D фильтров: Свертка по строкам: Затем свертка по столбцу:
Сепарабельность Почему сепарабельность полезна на практике? Slide by S. Lazebnik
Виды шума Соль и перец: случайные черные и белые пиксели Импульсный: случайные белые пиксели Гауссов: колебания яркости, распределенные по нормальному закону Source: S. Seitz
Гауссов шум Мат.модель: сумма множества независимых факторов Подходит при маленьких дисперсиях Предположения: независимость, нулевое матожидание Source: M. Hebert
Сглаживание фильтрами большого радиуса подавляет шум, но размывает изображение Подавление гауссова шума Slide by S. Lazebnik
Подавление шума «соль и перец» Чем результат плох? 3x35x57x7 Slide by S. Lazebnik
Медианный фильтр Выбор медианы из выборки пикселей по окрестности данного Является ли фильтр линейным? Source: K. Grauman
Медианный фильтр В чем преимущество медианного фильтра перед фильтром гаусса? Устойчивость к выбросам (outliers) Source: K. Grauman
Медианный фильтр Salt-and-pepper noise Median filtered Source: M. Hebert MATLAB: medfilt2(image, [h w])
Медианный фильтр Результат применения медианного фильтра с радиусом в 7 пикселей к изображению с шумом и артефактами в виде тонких светлых окружностей.
Сравнение фильтров 3x35x57x7 Гауссов Медианный Slide by S. Lazebnik
Повышение резкости Что теряется при сглаживании? original smoothed (5x5) – detail = sharpened = Добавим дополнительно высокие частоты: originaldetail + α Slide by S. Lazebnik
Фильтр Unsharp Гауссов Единичный фильтр Лапласиан гауссиана изображение сглаженное изображение Единичный Фильтр Slide by S. Lazebnik
Пример Ядро свертки
Компенсация разности освещения Пример
Компенсация разности освещения Идея: Формирование изображения: Плавные изменения яркости относятся к освещению, резкие - к объектам. объектосвещение Изображение освещенного объекта
Выравнивание освещения Алгоритм Single scale retinex (SSR) Получить приближенное изображение освещения путем низочастотной фильтрации Восстановить изображение по формуле
Обрезание по порогу
Выравнивание освещения Пример
Компенсация разности освещения Пример /= Gauss 14.7 пикселей
Многомасштабный вариант Чаще всего выбирают 3 масштаба Веса одинаковые (1/3)
Multi-scale retinex Source by Z.Rahman et.al.
Метрики качества Как измерить похожесть двух изображений? Для оценки качества подавления шума, например исходное изображение искаженное изображение
Метрики качества Среднеквадратичная ошибка (MSE) Пиковое отношение сигнал/шум (PSNR) N – число пикселей M – максимальное значение пикселя
Метрики качества PSNR и MSE не учитывают особенности человеческого восприятия! Оригинал Далее будут использованы рисунки из статьи Wang, Bovik, Lu WHY IS IMAGE QUALITY ASSESMENT SO DIFFICULT?
Метрики качества У этих изображений одинаковые PSNR с оригиналом (примерно 25 dB) Повышена контрастностьДобавлен белый гауссов шум
Метрики качества И у этих – тоже примерно 25 dB! Добавлен импульсный шумРазмытие
Метрики качества И у этого – тоже! Артефакт блочности после JPEG
Метрики качества Вывод: PSNR не всегда отражает реальный видимый уровень искажений. Как улучшить? –Использовать функцию чувствительности глаза к различным частотам (CSF) –Использовать свойство маскировки –Использовать равномерные к восприятию цветовые пространства (CIE Lab, CIEDE2000) HVS models (human visual system)
Спецэффекты Рассмотрим Тиснение Негатив «Светящиеся» края Геометрические эффекты –Перенос/поворот –Искажение «Эффект стекла»
Тиснение Фильтр + сдвиг яркости, нормировка…
Цифровой негатив
Светящиеся края Медианный фильтра + выделение краев + фильтр «максимума»
Перенос/поворот Перенос: x(k; l) = k + 50; y(k; l) = l; Поворот: x(k; l) = (k. x0)cos(µ) + (l. y0)sin(µ) + x0; y(k; l) =.(k. x0)sin(µ) + (l. y0)cos(µ) + y0; x0 = y0 = (центр поворота), µ = /6
«Волны» Волны 1: x(k; l) = k + 20sin(2 l / 128); y(k; l) = l; Волны 2: x(k; l) = k + 20sin(2 k / 30); y(k; l) = l;
«Эффект стекла» x(k; l) = k + (rand(1, 1) – 0.5) * 10; y(k; l) = l + (rand(1, 1) – 0.5) * 10;
На следующей лекции Старые-добрые методы распознавания объектов Сопоставление шаблонов Выделение краёв Выделение контрастных объектов Геометрические и фотометрические инварианты