Реляционные модели формы изображений и метрики их сравнения Ю. В. Визильтер, А. Ю. Рубис, viz @ gosniias. ru Москва, ФГУП «Государственный научно-исследовательский.

Презентация:



Advertisements
Похожие презентации
Морфологическое описание формы классов изображений, заданных конечными выборками Ю. В. Визильтер, В. С. Горбацевич, gosniias. ru Москва, ФГУП «Государственный.
Advertisements

ГЛАВА 3 ЭЛЕМЕНТЫ АНАЛИТИЧЕСКОЙ ГЕОМЕТРИИ. §1. Прямая на плоскости. Различные виды уравнений прямой на плоскости. Пусть имеется прямоугольная система координат.
От сложного – к простому. От непонятного – к понятному.
А.Ю. Рубис 1, О.В. Выголов 2, Ю.В. Визильтер 3 ФГУП «ГосНИИ Авиационных систем» (ФГУП «ГосНИИАС»), Москва
Функционально- графические методы решения заданий типа С 5. Подготовила ученица 11 класса ФМ МОУ лицей Хисматуллина Екатерина.
ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ Составила: М.П. Филиппова доцент кафедры высшей математики ИМИ СВФУ.
Лекция 5 Метрические задачи. Способы преобразования комплексного чертежа.
Плоскость и прямая в пространстве Лекции 10, 11. Определение. Уравнением поверхности в пространстве называется такое уравнение между переменными которому.
Плоскость и прямая в пространстве Лекция 10. Определение. Уравнением поверхности в пространстве называется такое уравнение между переменными которому.
Лекция 11. Методы и алгоритмы анализа структуры многомерных данных. Кластерный анализ. Кластерный анализ предназначен для разбиения множества объектов.
Матрицы Элементарные преобразования и действия над матрицами made by aspirin.
Теория игр Теория игр – это совокупность математических методов анализа и оценки конфликтных ситуаций. Задача теории игр состоит в выборе такой линии поведения.
Уравнение ax + b = 0, где а 0, называют линейным уравнением с одной переменной. Решением уравнение является значение Уравнение ax + by + c = 0, где а,
1 2. Матрицы. 2.1 Матрицы и их виды. Действия над матрицами. Джеймс Джозеф Сильвестр.
ОПОЗНАВАНИЕ СЛОЖНЫХ ИНФОРМАЦИОННЫХ ОБЪЕКТОВ НА ОСОВЕ ПРЕДСТАВЛЕНИЯ ИХ КОМПОЗИЦИЯМИ ЗНАКОПЕРЕМЕННЫХ ПСЕВДОСЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ В.Ф. Соломатин.
Элементы векторной алгебры.. Определение Совокупность всех направленных отрезков, для которых введены операции: - сравнения - сложения - умножения на.
ЭЛЕМЕНТЫ ВЕКТОРНОЙ АЛГЕБРЫ Лекция 3. План лекции: Понятие вектора. Действия над векторами. Линейно зависимые и линейно независимые векторы. Размерность.
Симплекс-метод Лекции 6, 7. Симплекс-метод с естественным базисом Симплекс –метод основан на переходе от одного опорного плана к другому, при котором.
Свойства линейных операций над матрицами Свойства линейных операций над векторами.
ИНФОРМАЦИОННАЯ ЧУВСТВИТЕЛЬНОСТЬ КОМПЬЮТЕРНЫХ АЛГОРИТМОВ И ЕЁ КОЛИЧЕСТВЕННЫЕ МЕРЫ д.т.н., профессор М.В. Ульянов Кафедра «Управление разработкой программного.
Транксрипт:

Реляционные модели формы изображений и метрики их сравнения Ю. В. Визильтер, А. Ю. Рубис, gosniias. ru Москва, ФГУП «Государственный научно-исследовательский институт авиационных систем»

Задача : сравнение изображений по форме f g Насколько похожи ли эти изображения ? Ответ на этот вопрос дает морфология Пытьева, позволяющая осуществлять сравнение изображений не по яркости, а по форме. Пытьев Ю. П., Чуличков А. И. Методы морфологического анализа изображений // М.: ФИЗМАТЛИТ, с.

Задача : сравнение изображения с формой Морфологические квази - расстояния Морфологические коэффициенты корреляции Пытьева: В общем случае K M (g,F) K M (f,G). Изображения – векторы, Формы – гиперплоскости. Это схема яркостно- геометрического сравнения изображений с формами

Задача : сравнение форм Необходимо перейти от яркостно-геометрического сравнения изображений с формами к чисто геометрическому сравнению форм TV IR Контурные методы работают плохо Нужно определить метрики или меры сходства форм

Компаративная морфология. В предыдущих работах авторов : Предложены меры сходства форм - разбиений на основе статистического усреднения проецируемых изображений и получено выражение для среднеквадратичного эффективного коэффициента морфологической корреляции форм - разбиений. Предложены симметричные нормированные коэффициенты геометрической корреляции форм - разбиений. Предложен способ корреляционного сравнения форм - разбиений с упорядоченной яркостью. Предложено трансформационное расстояние ( метрика редактирования ) для оценки геометрических отличий мозаичных форм ( ОГО - метрика ).

Трансформационные метрики. Расстояние Левенштейна Трансформационное расстояние – минимальная стоимость цепочки преобразований, переводящей A в B : ДЫМ ДЫМА ДАМА МАМА Расстояние Хемминга d H между строками одинаковой длины определяется как число позиций, в которых символы не совпадают ( равно числу операций замены символа ). Расстояние Левенштейна d L равно минимальному числу операций для преобразования одной строки в другую, когда множество элементарных операций состоит из операций вставки, удаления и замены.

Простейшая метрика сравнения форм - разбиений на основе слияния - разбиения областей Структурное расстояние между формами – минимальное число операций слияния - разбиения, необходимое для перехода от одной формы другой. ( Контр ) Пример сравнения форм при помощи структурного расстояния редактирования.

где n и m – соответствующе количества областей разбиения F и G ; S – площадь кадра ; S i – площадь области разбиения F i ; S j – площадь области разбиения G j ; S ij – площадь пересечения F i G j ; p i = S i / S – нормированная площадь области разбиения F i ; p j = S j / S – нормированная площадь области разбиения G j ; p ij = S ij / S – нормированная площадь пересечения F i G j ; d H ( G j, F i ) = p i + p j – 2 p ij – нормированное расстояние Хэмминга между областями разбиения F i и G j. Метрика оценки геометрических отличий ( ОГО ) pipi pjpj p ij

Метрика ОГО как трансформационная метрика Утверждение. Для любых форм F и G всегда существует такая проходящая через F G цепочка преобразований w, состоящая из k элементарных разбиений и l элементарных слияний, причем сначала следуют все разбиения, а затем все слияния : F = W 0 W 1 … W k - 1 W k = F G W k + 1 … W k+l-1 W k+l =G, для которой справедливо следующее равенство : ( Сумма расстояний между последовательными элементами цепочки равна расстоянию от первого до последнего элемента ) Вывод : Метрика d H ( F, G ) имеет структуру трансформационного расстояния с элементарными операциями слияния и разбиения областей, стоимость которых определяется на каждом шаге расстоянием d H ( W t - 1, W t ) между исходной и получившейся после данного элементарного преобразования формами.

Легко убедиться, что ОГО-метрика не является евклидовой. Пример пучка геодезических траекторий, отличающихся порядком разбиений и слияний Свойства метрического пространства с ОГО - метрикой : геодезические линии не являются единственными

Свойства метрического пространства с ОГО - метрикой : геодезические многообразия являются дискретными d H ( F, G ) = d H ( F, V ( x )) + d H ( V ( x ), G ) (x-a) 2 + (b-x) 2 – (b-a) 2 = 0 x 2 – (b+a)x +ba = 0 ( x = a ) или ( x = b ). Значит, из всех форм семейства V ( x ) геодезическому многообразию D ( F, G ) принадлежат лишь сами формы F = V ( a ) и G = V ( b ). Иллюстрация дискретности геодезических многообразий в пространстве мозаичных форм на примере семейства бинарных форм

Другой подход : метрическое сравнение форм как моделей, описывающих отношения между элементами мозаичного изображения ( реляционных моделей )

Предыдущие работы ( Источник 1) В морфологии Пытьева [1] предложена схема описания формы изображений на основе базисных функций, связанных с разбиением кадра на непересекающиеся области. Порождаемые таким образом модели формы можно назвать T- моделями ( Tessellation based shape models ). [1] Пытьев Ю. П., Чуличков А. И. Методы морфологического анализа изображений // М.: ФИЗМАТЛИТ, с. F1F1 F2F2 F3F3 Image f ( x,y ) Tessellation F F4F4

Предыдущие работы ( Источник 2) В работах [2], [3] был предложен альтернативный способ описания формы изображений, названных авторами знаковым представлением изображений и основанный на рассмотрении множества яркостных отношений между пикселами изображения, что эквивалентно частично упорядоченным по яркости T - моделям. [2] Каркищенко А. Н., Гончаров А. В. Исследование устойчивости знакового представления изображений // Автоматика и телемеханика. 9. С [3] Броневич А. Г., Гончаров А. В. Аксиоматический подход к измерению информативности знаковых представлений изображений // Известия РАН. Теория и системы управления. 6. C

Предыдущие работы ( Источник 3) В работе [4] было введено понятие т. н. EMD - метрик *, используемых для сравнения « гистограммоподобных » описаний, представленных конечным множеством пар, где F i – i - й « объект » описания, а h i – его « вес » ( значимость в описании ): Здесь d E – базовая ( Earth ) метрика, а веса удовлетворяют условиям : [4] Y. Rubner, C. Tomasi, and L. J. Guibas. The Earth Movers Distance as a Metric for Image Retrieval, International Journal of Computer Vision, 40(2):99-121, * Частный случай метрик Монжа - Канторовича

Предыдущие работы ( Источник 3) i hjhj j hihi h ij Задача решается методом линейного программирования Оптимизация «перевозок» весов из гистограммы в гистограмму = «Транспортная задача»

В данной работе ( анонс результатов ): 1.Для рассмотрения произвольных типов отношений между областями разбиения кадра ( не только по яркости, но и по размеру, по форме, по текстуре, по взаимному расположению и т. п.) будет определен более общий класс реляционных моделей формы изображений или T R - моделей ( Tessellation based Relational shape models ). 2.Будет описан формализм TR - моделей и показаны перспективы их практического применения в задаче сравнения изображений по форме. 3.Будет показано, что метрики сравнения TR - моделей представляют собой специальный класс EMD - метрик, который предлагается называть RMD - метриками.

Морфология Пытьева. Описание форм Множество изображений одной формы разбиения кадра F – выпуклое и замкнутое подпространство F L 2 ( ): Для любого изображения g ( x, y ) L 2 ( ) может быть определена проекция на форму F : P F – оператор проекции или проектор на F. Формы – замкнутые и выпуклые подпространства линейного пространства изображений.

Морфология Пытьева. Сложность форм Формы - разбиения частично упорядочены по сложности : Для любых форм F и G можно указать форму более сложную F G и менее сложную F G. Более сложные формы получаются из менее сложных разбиением, Менее сложные из более сложных – слиянием областей.

Альтернативное описание форм отношениями пикселов Введем предикат бинарного отношения пикселов « равно / неравно по яркости »: Определим L 1 - норму TR - формы F ( x,y,u,v ): Пусть изображения из F и G имеют вид тогда то есть TR - формы будут кусочно - постоянными 4D функциями.

Альтернативное описание форм отношениями областей Рассмотрим форму W = F G с областями W ij = F i G j. Для нее можно записать Любые операции над T- формами F и G могут быть описаны в терминах операций над такими бинарными матрицами размера ( m n ) 2. В частности где S ij, S kl – площади областей разбиения W ij,W kl.

Матрицы отношений " равно / неравно " для 1D- функций f F = SF1SF1 SF2SF2 SF3SF g G = SG1SG1 SG2SG

Описание форм с упорядоченной яркостью пикселов Для описания форм - разбиений с частично упорядоченной яркостью введем векторный бинарный предикат = 1, 2 для описания всех возможных отношений упорядоченности по яркости « пикселы больше / меньше / равны / неравны по яркости »: Значение 1,1 означает, что данная пара пикселов в данной форме F не упорядочена по яркости. Определим L 1 - норму TR - формы F ( x,y,u,v ): где | F (x,y,u,v) | = F (x,y,u,v) 1 + F (x,y,u,v) 2.

Описание форм с упорядоченной яркостью пикселов Пусть изображения из F и G имеют вид кусочно - постоянных функций, причем все значения { f i } являются различными, как и все значения { g j }. Тогда

Описание форм с упорядоченной яркостью областей Следовательно, такие TR- формы также можно записать в виде векторных бинарных матриц размера ( m n ) 2 : Выражение для L 1 - нормы :

Матрицы отношений "больше" для 1D-функций f 1F = SF1SF1 SF2SF2 SF3SF g SG1SG1 SG2SG G =

Матрицы отношений "меньше" для 1D-функций f 2F = SF1SF1 SF2SF2 SF3SF g SG1SG1 SG2SG G =

Описание форм - разбиений произвольными отношениями Обобщение 1. Пусть дано некоторое изображение f ( x, y ) и некоторый упорядоченный набор ( вектор ) r функций отношения TR(a,b): R 2 R, t = 1,…,p. R - моделью изображения f по набору отношений r между пикселами назовем векторную функцию TR - моделью изображения f формы F по набору отношений r между областями разбиения назовем векторную матрицу При сравнении TR - моделей изображений f и g формы F и G соответственно, TR - модели F ( F i, F k ) и G ( G j, G l ) эквивалентно преобразуются к виду F ( W ij,W kl ) и G ( W ij,W kl ), где W ij = F i G j. При этом L 1 - норма обобщенной TR - модели F ( x,y,u,v ) определяется выражением

L 1 - метрика в пространстве T- моделей Рассмотрим расстояние Хэмминга ( L 1 - метрику ) между формами - отношениями « равно / неравно по яркости » F ( x,y,u,v ) и G ( x,y,u,v ): Для кусочно - постоянных функций выражение (1) можно преобразовать к виду где S ij, S kl – площади областей W ij,W kl, причем

L 1 - метрика T- моделей и ОГО - метрика Введем обозначение Тогда где S i и S j – площади областей F i и G j. Таким образом, при S=1 мы получаем метрику оценки геометрических отличий ( ОГО - метрику ) для T - форм F и G : где d H ( F i,G j ) = S i + S j – 2 S ij – расстояние Хэмминга ( L 1 - метрика ) между парами областей F i и G j.

f F = SF1SF1 SF2SF2 SF3SF g G = SG1SG1 SG2SG L 1 -метрика отношений "равно / неравно" для 1D-функций | F - G | =

L 1 - метрики в пространстве TR- моделей Аналогичным образом можно ввести L 1 - метрику для сравнения « знаковых представлений »: Обобщение 2. В общем случае для сравнения TR - моделей можно ввести L 1 - метрику вида

L 1 -метрики отношений "больше" для 1D-функций f 1F = SF1SF1 SF2SF2 SF3SF g SG1SG1 SG2SG | 1F - 1G | = 1G =

L 1 -метрики отношений "меньше" для 1D-функций f 2F = SF1SF1 SF2SF2 SF3SF g SG1SG1 SG2SG | 2F - 2G | = 2G =

Метрики сравнения TR- моделей как EMD- метрики EMD - метрики используются для сравнения « гистограммо - подобных » описаний, представленных конечным множеством пар, где F i – i - й « объект » описания, а h i – его « вес » ( значимость в описании ): Здесь d E – базовая ( Earth ) метрика, а веса удовлетворяют условиям : При выборе в качестве « объектов » элементарных областей F i и G j, в качестве их « весов » h i = S i / S, h j = S j / S, h ij = S ij / S, а в качестве базовой метрики расстояния Хэмминга d H ( F i, G j ), EMD - метрика (5) превращается в ОГО - метрику (2).

Метрики сравнения TR- моделей как E B D- метрики Назовем E B D- метрикой сравнения форм - разбиений ( Earth Based Shape Distance, E B SD- метрика ) метрику следующего вида : где d E ( F i, G j ) – любая базовая ( Earth ) метрика d E, позволяющая попарно сравнивать какие - либо характеристики областей F i и G j. В частности, для сравнения форм - разбиений с частично или полностью упорядоченной яркостью определим EBD - метрика (8) эквивалентна ранее введенной L 1 - метрике (3).

R B D- метрики для сравнения форм - отношений Обобщение 3. EBD-метрики второго порядка вида где d ( F ( W ij,W kl ), G ( W ij,W kl )) – предбазовая метрика сравнения отношений предлагается называть R B D- метриками ( Relation Based Distance ).

RMD- метрики и задачи оптимизации RBD-метрик Обобщение 4. Если значения S ij трактовать не как набор площадей пересечения областей кадра фиксированной геометрии, а как набор переменных мер соответствия между элементами обобщенной реляционной модели формы, то для определения RMD- метрики ( Relation EMD ) необходимо решать оптимизационную задачу следующего вида : Это задача квадратичного программирования, разрешимая по Куну - Такеру.

Потенциальные области применения Сравнение моделей сегментированных изображений сцен с наборами пространственных и семантических отношений между объектами ; Сравнение описаний формы сегментированных 2 D и 3 D фигур с наборами топологических, геометрических и других отношений между частями фигур ; Сравнение результатов классификации и кластеризации в многомерных пространствах признаков в задачах машинного обучения. Сравнение теорий ( онтологий ), описывающих единую предметную область.

Сравнение моделей сегментированных изображений сцен с наборами пространственных и семантических отношений между объектами 2. Сохранены относительные расположения 3. Сохранены только площади 1. Сохранены площади, относительные ориентации и расположения 1 23

Сравнение описаний формы сегментированных 2D и 3D фигур с наборами топологических, геометрических и других отношений между частями фигур

Сравнение результатов классификации и кластеризации в многомерных пространствах признаков в задачах машинного обучения GXGX X gXgX gXgX X fXfX FXFX fXfX

Заключение 1.В работе предложен обобщенный класс моделей описания формы сегментированных изображений набором произвольных отношений между областями разбиения кадра – T R - модели ( Tessellation based Relational shape models ). 2.Показано, что получаемые на основе TR - моделей метрики сравнения форм в общем случае представляют собой специальный класс EMD - метрик второго порядка, который предложено называть RMD - метриками ( Relation Moving Distance ). 3.Возможные направления дальнейших исследований могут быть связаны с построением конкретных прикладных RMD - метрик, а также с построением RMD - метрик для сравнения предметных онтологий ( онтологических метрик ).

Литература [1] Пытьев Ю. П., Чуличков А. И. Методы морфологического анализа изображений // М.: ФИЗМАТЛИТ, с. [2] Каркищенко А. Н., Гончаров А. В. Исследование устойчивости знакового представления изображений // Автоматика и телемеханика. 9. С [3] Броневич А. Г., Гончаров А. В. Аксиоматический подход к измерению информативности знаковых представлений изображений // Известия РАН. Теория и системы управления. 6. C [4] Y. Rubner, C. Tomasi, and L. J. Guibas. The Earth Movers Distance as a Metric for Image Retrieval, International Journal of Computer Vision, 40(2):99-121, [5] Визильтер Ю. В., Рубис А. Ю. Морфологические коэффициенты корреляции форм изображений для задач комплексирования многоспектральной видеоинформации // Вестник компьютерных и информационных технологий, N3, 2012, с [6] H. Ling and K. Okada. EMD-L1: An Efficient and Robust Algorithm for Comparing Histogram-Based Descriptors, European Conference on Computer Vision (ECCV), LNCS 3953, III: , 2006.