МИНИСТЕРСТВА ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ СУМСКОЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ КАФЕДРА КОМПЬЮТЕРНЫХ НАУК Комплексная магистерская работа: Разработка информационного и программного обеспечения для распознавания образов с использованием контурного анализа Выполнил: студент группы ИНм - 21 Токан Алексей Олегович Руководитель работы: Довбыш Анатолий Степанович СУМЫ 2013
Актуальность Сегодня не существует абсолютно точного метода определения текста и символа по их изображению Актуальность решения этой задачи не вызывает сомнений поскольку обучение компьютеров чтению откроет возможность автоматизации таких процессов, как получение электронных копий различных документов и книг, поиск информации в бумажных источниках и другие столь необходимые возможности.
Постановка задачи Необходимо исследовать процесс распознавания текста, выделить основные составляющие данного процесса. Следует определить свойства и принципы, на основе которых можно использовать контурный анализ в данном процессе. При этом необходимо: исследовать процесс обработки изображения на основе контурного анализа; разработать алгоритм разбиения изображения текста на контуры символов с использованием контурного анализа; определить принцип выделения признаков символов на основе контурного анализа; разработать алгоритм выделения признаков символов; определить возможность использования контурного анализа в процессе классификации признаков символов.
Основы контурного анализа Контурный анализ позволяет описывать, хранить, сравнивать и производить поиск объектов, представленных в виде своих внешних очертаний – контуров.
Вектор-контур Контур – это граница объекта, множество точек отделяющих объект от фона. В контурном анализе контур кодируется последовательностью, состоящей из комплексных чисел.
Свойства контуров Сумма элементарных векторов замкнутого контура равна нулю. Контур-вектор не зависит от параллельного переноса исходного изображения. Поворот изображения на определенный угол равносилен повороту каждого элементарного вектор контура на тот же угол. Изменение начальной точки ведет к циклическому сдвигу вектор контура. Изменение масштаба исходного изображения можно рассматривать как умножение каждого ЭВ контура на масштабный коэффициент.
Скалярное произведение Скалярное произведение контуров: Скалярное произведение комплексных чисел Нормированное скалярное произведение Норма(длина) контура
Свойства нормированного скалярного произведения Инвариантность к повороту Инвариантность к масштабу
Корреляционные функции контуров Взаимокорреляционная функция Мера схожести двух контуров Автокорреляционная функция Характеристика формы контура
Общий алгоритм распознавания Предварительная обработка изображения сглаживание, фильтрация помех, повышение контраста. Бинаризация изображения и выделение контуров объектов. Начальная фильтрация контуров по периметру, площади, коэффициенту формы, фрактальности и так другим параметрам. Приведение контуров к единой длине, сглаживании. Перебор всех найденных контуров, поиск шаблона, максимально похожего на данный контур
Основные показатели системы Процент успешных распознаваний Количество операций
Недостатки контурного анализа
Результаты тестирования Тестирование методов контурного анализа на тестах ICDAR дает результат 48% распознанных символов
Результаты тестирования Система также хорошо показала себя в распознавании текста на объёмных объектах
Выводы рассмотрены методы и алгоритмы для решения задач распознавания образов; построен и усовершенствован алгоритм поиска и обнаружения контуров по заранее заданным критериям, с возможностью его дальнейшего обучения; адаптирован и оптимизирован алгоритм для распознавания текста для максимально быстрого и качественного распознавания текста с максимальной скоростью.
Спасибо за внимание!