Определение точек поворотов пальцев при создании шаблона ладони Бакина Ирина Геннадьевна Факультет Вычислительной Математики и Кибернетики Московский Государственный.

Презентация:



Advertisements
Похожие презентации
Распознавание двух- и трехмерных жестов ладони на основе анализа скелетного представления ее силуэта Куракин Алексей Владимирович Московский Физико-Технический.
Advertisements

Построение трёхмерных криволинейных скелетов при помощи пространственных циркуляров Докладчик: Д.В. Хромов, МГУ им. Ломоносова.
Презентацию выполнили ученицы 9 «В» класса школы 56 Зиновьева Елена и Ермолаева Регина.
Сравнение и подгонка поверхностей при решении прикладных задач анализа 3d портретов человеческих лиц Дышкант Наталья Федоровна
Движение – это отображение плоскости на себя сохраняющее расстояние между точками.
Осевая симметрия. Осевая симметрия представляет собой отображение плоскости на себя. Осевая симметрия обладает следующим важным свойством – это отображение.
Движение плоскости – это отображение плоскости на себя, сохраняющее расстояния.
ЛЕКЦИИ Курс: Проектирование систем: Структурный подход Каф. Коммуникационные сети и системы, Факультет радиотехники и кибернетики Московский физико-технический.
Математика 1 класс Тема урока «Сравнение чисел»
Специфика геометрических алгоритмов и структур данных Специфика геометрических алгоритмов и структур данных Основные геометрические структуры данных и.
Программный комплекс для моделирования гемодинамики на пространственном графе сердечно-сосудистой системы М.В.Абакумов 1, В.Б.Кошелев 2, С.И.Мухин 1, Н.В.Соснин.
Основной интерес к правильным многогранникам вызывает большое число симметрий, которыми они обладают. Под симметрией (или преобразованием симметрии) многогранника.
Тема урока: Движение Симметрия относительно точки О А А'А'
Анализ защищенности распределенных информационных систем Докладчик: Дорджиева А.А. Кафедра вычислительной математики механико-математического факультета.
Виды информационных моделей: деревья, организационная диаграмма Урок 22.
Анализ информации, содержащейся в изображении На примере бинарных изображений Бинарное изображение – изображение, пиксели которого принимают всего два.
Теория Рамсея Научно - исследовательская работа Приходько Елены.
Система видеоуправления Кафедра УиИТС, МГИЭМ (Московского Государственного Института Электроники и Математики) Докладчики: Николаева М.В. Сидоров С.М.
Московский государственный университет им. М. В. Ломоносова Факультет вычислительной математики и кибернетики Кафедра вычислительных методов Дипломная.
ИСПОЛНИТЕЛЬ ЧЕРТЁЖНИК 1. Один из графических исполнителей, с которым мы будем работать - Чертежник. Он предназначен для построения рисунков на поле, "размер"
Транксрипт:

Определение точек поворотов пальцев при создании шаблона ладони Бакина Ирина Геннадьевна Факультет Вычислительной Математики и Кибернетики Московский Государственный Университет имени М.В. Ломоносова Техническое зрение в системах управления, марта 2011

Содержание Предпосылки Модель ладони Определение точек поворотов Эксперименты

Содержание Предпосылки Модель ладони Определение точек поворотов Эксперименты

Задача распознавания формы ладони бинарное изображение ладони граничное представление...

Метод решения 1.Построение эталонной модели ладони человека 2.Сравнение ладоней путём подгонки эталонной модели под тестовое изображение

Содержание Предпосылки Модель ладони Определение точек поворотов Эксперименты

Гибкий объект Семейство кругов C={c t,t T} – циркулярный граф Объединение кругов (как точечных множеств) S= c t, t T – силуэт циркулярного графа Множество трансформаций циркулярного графа, сохраняющих его топологическую структуру и образующих группу – деформации V={v(α)} α A Осевой граф (скелет) T 2 – связный планарный граф с конечным числом вершин и непрерывными рёбрами Гибкий объект G={C,V} – циркулярный граф и множество допустимых деформаций

Трансформации Основные движения сдвиг ладони поворот ладони поворот пальцев Допустимые трансформации сдвиг циркулярного графа поворот циркулярного графа поворот ветвей циркулярного графа

Разметка ладони Основные шаги 1.Выделение пальцев 2.Определение точек поворотов пальцев Обозначения кончики: P 1, P 2, P 3, P 4 основания: O 1, O 2, O 3, O 4 точки поворотов: R 1, R 2, R 3, R 4 оси: P 1 R 1, P 2 R 2, P 3 R 3, P 4 R 4

Сравнение формы ладоней Эталонная ладонь G 1 Тестовая ладонь G 2

Сравнение формы ладоней 1.Совмещение кончиков средних пальцев (точка P 3 ) 2.Совмещение осей средних пальцев (прямая P 3 R 3 ) 3.Исключение большого пальца 4.Исключение области запястья (ниже прямой O 1 O 4 ) 5.Применение трансформаций с целью наилучшего совмещения силуэтов ладоней (минимизация μ) 6.Вычисление меры схожести ладоней μ * =min μ μ(G 1, G 2 ) = Area(G 1 \G 2 ) + Area(G 2 \G 1 )

Подгонка Площадь ладони в среднем – пикселей Эталонная ладонь G 1 Тестовая ладонь G 2 Начальное совмещение Наилучшее совмещение μ = 3191μ = 1714 μ = μ = 2467

Содержание Предпосылки Модель ладони Определение точек поворотов Эксперименты

Выделение пальцев

Точки поворотов пальцев Предположение Точка поворота пальца находится на оси пальца Обозначения =(len 1, len 2, len 3, len 4 ), len i =|P i R i |– расстояние между кончиком и основанием пальца i =(l 1, l 2, l 3, l 4 ), l i =|P i O i | - расстояние между кончиком и точкой поворота пальца i

Подходы 1. Эвристический l i =1.3 len i достаточно одного изображения ладони для идентификации модели 2. Оптимизационный по множеству эталонных изображений ладони в разных положениях

Оптимизационный подход Дано G 1,…,Gn – множество эталонных изображений ладони одного человека, где G i =G i ( ) μ * (G 1, G 2 ) – мера схожести ладоней G 1 и G 2 (несимметричная) Средняя схожесть ладоней Задача

Оптимизационный подход Решение перебор: l i [1.25 len i, 1.5 len i ] численные методы … Пример l 1 = 1.25 len 1 l 2 = 1.38 len 2 l 3 = 1.25 len 3 l 4 = 1.38 len 4

Пример Эвристический подход Оптимизационный подход: полный перебор Оптимизационный подход: метод Нелдера-Мида

Содержание Предпосылки Модель ладони Определение точек поворотов Эксперименты

Исходные данные База ладоней 22 человека 45 эталонных изображений (2-3 для каждого человека) 52 тестовых изображения (2-3 для каждого человека) 50 внутриклассовых и 1094 межклассовых расстояния Оборудование Web-камера Logitech QuickCam Pro 4000 Размер 640x480 пикселей 1.3 млн. пикселей

Верификация 1 – Эвристический подход 2 – Оптимизационный подход FRR (False Reject Rate) – ошибка ложного отказа FAR (False Accept Rate) – ошибка ложного узнавания