Системы распознавания текста Технология обработки текстовой информации.

Презентация:



Advertisements
Похожие презентации
Системы распознавания текста Технология обработки текстовой информации.
Advertisements

Информатика в школе Системы распознавания текста Технология обработки текстовой информации.
помочь учащимся получить представление об OCR – программах распознавания текста, познакомиться с возможностями данных программы, воспитание информационной.
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
Система оптического распознавания документа Шинкаренко Евгений Александрович МОУ Гимназия 2 г. Чернняховск Калининградской области.
Системы распознавания текста Технология обработки текстовой информации.
L/O/G/O Системы оптического распознавания документов 10 КЛАСС.
Сканирование в программе оптического распознавания документов OCRAD Ахмедова Е.В. МОУ «СОШ 1» г.Осташков Лекция 10.
Системы оптического распознавания символов. Оптическое распознавание символов механический или электронный перевод изображений рукописного, машинописного.
На дом: §17 Системы перевода и распознавания текстов.
Создание документов в текстовых редакторах Учитель информатики: Общева Ирина Сергеевна
Системы оптического распознавания текста Программа FINEREADER.
Системы распознавания и перевода текста В этой работе использована презентация учителя информатики Сердюковой Т.А. (г. Ставрополь)
Сканирование
Системы оптического распознавания информации. Борисов В.А. Красноармейский филиал ГОУ ВПО «Академия народного хозяйства при Правительстве РФ» Красноармейск.
Как сканировать книгу Установка режима сканирования Ставить разрешение сканирования 300 dpi (300 точек на дюйм) Для страниц, содержащих только текст –
L/O/G/O Системы оптического распознавания документов.
Программы работы с текстом. Текстовые редакторы и процессоры Программы работы с текстом. Текстовые редакторы и процессоры Информатика и ИКТ 8 класс Гимназия.
Оптическое распознавание символов Боровикова Ксения ФЛ-401 г. Ростов-на-Дону 2011г.
Транксрипт:

Системы распознавания текста Технология обработки текстовой информации

Необходимость в системах распознавания символов С помощью сканера достаточно просто получить изображение страницы текста в графическом файле. Однако работать с таким текстом невозможно : как любое сканированное изображение, страница с текстом представляет собой графический файл - обычную картинку. Текст можно будет читать и распечатывать, но нельзя будет его редактировать и форматировать. Для получения документа в формате текстового файла необходимо провести распознавание текста, то есть преобразовать элементы графического изображения в последовательности текстовых символов.

Программы распознавания текста Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition - OCR). Наиболее распространенные системы оптического распознавания символов : ABBYY FineReader CuneiForm от Cognitive Примеры программ OCR -

Получение электронного документа 1. Отсканировать изображение ( с помощью ПО сканера ); 2. Распознать структуру размещения текста на странице : выделить колонки, таблицы, изображения и т. д. 3. Выделенные текстовые фрагменты графического изображения страницы необходимо преобразовать в текст ; 4. Проверка орфографии ( если необходимо ); 5. Сохранение в файл или передача текста в другое приложение, например в Word.

Методы распознавания символов Если исходный документ имеет типографское качество, то задача распознавания решается методом сравнения с растровым шаблоном. При распознавании документов с низким качеством печати используется метод распознавания символов по наличию в них определенных структурных элементов ( отрезков, колец, дуг и др.).

ABBYY FineReader FineReader - омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати. FineReader имеет массы дополнительных функций и удобный интерфес.

Оптимальное разрешение при сканировании Оптимальным разрешением для обычных текстов является dpi и dpi для текстов, набранных мелким шрифтом (9 и менее пунктов ). Сканирование в сером является оптимальным режимом для системы распознавания. В случае сканирования в сером режиме осуществляется автоматический подбор яркости. Если Вы хотите, чтобы содержащиеся в документе цветные элементы ( картинки, цвет букв и фона ) были переданы в электронный документ с сохранением цвета, необходимо выбрать цветной тип изображения. В других случаях используйте серый тип изображения.

Вопросы : Зачем нужны программы распознавания текста ? Как происходит распознавание текста ? Какие программы распознания текста вы знаете ? Какими пользовались ? Какое разрешение является оптимальным для сканирования текста, изображений ?

Домашнее задание § 1.1.5, Знать, что такое программы распознавания текста, уметь работать с этими программами. Дополнительное задание : установить дома программу OCR и подготовить реферат по какому - либо предмету. Текст распознать в OCR, редактирование и форматирование провести в Word. видеоурок