Системы оптического распознавания символов
Оптическое распознавание символов механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе.
Области применения Конвертация книг и документов в электронный вид; Автоматизации систем учета в бизнесе; Публикации текста на веб-странице.
Достоинства Редактирование текста Поиск слова или фразы Хранение в компактной форме Печать, без потери качества Применение к тексту электронного перевода Форматирование Преобразование в речь
Оптическое распознавание символов В настоящее время распространены «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Распознают изображения, колонки, таблицы и т.д.
Этапы работы с системой 1.Сканирование нужного текста. 2.Распознавание структуры размещения текста на странице. 3.Преобразование текстовых блоков. Типографическое качество Типографическое качество Низкое качество
Этапы работы с системой Типографическое качество Задача распознавания решается методом сравнения с растровым шаблоном. Сначала растровое изображение страницы разделяется на изображения отдельных символов, затем каждый символ последовательно накладывается на шаблоны символов, имеющихся в памяти системы, и выбирается шаблон с наименьшим количеством точек, отличных от входного изображения.
Этапы работы с системой Низкое качество используется метод распознавания символов по наличию в них определенных структурных элементов (отрезков, колец, дуг и др.). Любой символ можно описать через набор параметров, определяющих взаимное расположение его элементов.
Этапы работы с системой Низкое качество
Системы оптического распознавания форм При проведении ЕГЭ, при заполнении налоговых деклараций и т.д. используются различного вида бланки с полями.
Системы оптического распознавания форм Рукопечатные тексты (данные вводятся в поля печатными буквами от руки) распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.
Системы оптического распознавания форм Сложность состоит в том, что необходимо распознавать символы, написанные от руки, а они довольно сильно различаются у разных людей. Кроме того, система должна определить, к какому полю относится распознаваемый текст.
Системы распознавания рукописного текста С появлением первого карманного компьютера в 1990 году начали создаваться системы распознавания рукописного текста.