Распознавание изображений
1 Принципы IPA: - Принцип целостности (integrity) -Принцип целенаправленности (purposefulness) -Принцип адаптивности (adaptability)
2. Многоуровневый анализ документа (MDA): -страница -таблица, блок текста -ячейка таблицы -абзац, картинка -строка -слово, картинка внутри строки -буква (символ).
1. С уровня "страница" до уровня "слово". Преимущества разумного подхода. На первом этапе распознавания система структурирует страницу, выделяет на ней текстовые блоки.
Пример работы интеллектуальной фильтрации фоновых структур: Пример работы бинаризации:
Механизмы распознавания букв - классификаторы. В системе ABBYY FineReader применяются следующие типы классификаторов: - Растровый - Признаковый - Контурный - Структурный -Признако - дифференциальный -Структурно - дифференциальный.
Растровый классификатор:Признаковый классификатор:
Контурный классификатор:Структурный классификатор:
Признаково-дифференциальный: Структурно-дифференциальный:
Рассмотрим процесс структурирования на примере слова "turn". Предположим, при разделении слова на символы было выдвинуто две гипотезы: первая соответствует прочтению "tum", вторая - "turn".
Авдеев Николай, ЧелГУ, МФ, ru – Опять пять! Коллекция презентаций