ВЫДЕЛЕНИЕ ОСНОВНОЙ ИНФОРМАЦИОННОЙ ОБЛАСТИ В ИЗОБРАЖЕНИИ Р.Д. Аминов группа 958
Задача Дано изображение. Необходимо найти в базе данное изображение, а также изображения, полученные из данного с помощью операций масштабирования и кадрирования. Поиск сводится к перебору изображений из базы и сравнению каждого изображения с данным.
Сравнение двух изображений Сравнение не изображений целиком, а их главных информационных областей, то есть областей, содержащих основную информацию изображения. Предполагается, что операции сжатия и кадрирования не удаляют главную информационную область.
Выделение основной информационной области Два подхода: Основанный на энтропии изображения. Основанный на разложении изображения по некоторому базису. В этом случае вычисляется невязка, и наиболее информативной считается та область изображения, в которой невязка максимальна, то есть изображение наименее «предсказуемо». В любом случае, метод должен быть устойчивым к операциям сжатия и кадрирования.
Способы разложения изображения для выделения главной информационной области 1.Разложение по базису колоколообразных форм. 2.Приближение с помощью вейвлет-преобразования. 3.Приближение с помощью дискретного косинусного преобразования.
Разложение по базису колоколообразных форм
Геометрическая интерпретация
Колоколообразная форма В случае изображений в качестве векторов выступают матрицы, а их скалярное произведение определяется следующим образом: (A 1,A 2 )=tr(A 1 A 2 T ). Множество B состоит из колоколообразных форм - матриц вида α T β, где α и β имеют следующий вид: Вид α и βВид матриц множества B
Примеры разложения
Вейвлет и ДКТ разложения Исходное изображениеВейвлет-разложение (2000 коэффициентов) ДКТ-разложение (100 коэффициентов)
Пример найденной области Область, найденная с помощью разложения на колоколообразные формы и вейвлет-разложения Область, найденная с помощью ДКТ-разложения
Сравнение двух областей Сводится к сравнению с помощью расстояния Хаусдорфа разложений на колоколообразные формы. Расстояние Хаусдорфа:
Спасибо за внимание