Сканеры и программное обеспечение распознавания символов Анна Виноградова.

Презентация:



Advertisements
Похожие презентации
Системы распознавания текста Технология обработки текстовой информации.
Advertisements

Системы распознавания текста Технология обработки текстовой информации.
Информатика в школе Системы распознавания текста Технология обработки текстовой информации.
Сканирование
Сканер – это устройство ввода в компьютер графической и текстовой информации. Сканер (англ. to scan – пристально всматриваться)
Системы распознавания текста Технология обработки текстовой информации.
Сканеры Сканером называется устройство для ввода в компьютер изображений, нанесенных на прозрачной или непрозрачной плоской поверхности. Они позволяют.
Устройства ввода информации Выполнил: ученик 10 В класса ученик 10 В класса Столяров Андрей Столяров Андрей.
Сканер (англ. scanner) устройство, которое анализируя какой-либо объект (обычно изображение, текст), создаёт цифровую копию изображения объекта. Процесс.
Магистрально-модульное устройство компьютера Магистраль Шина данных Шина адреса Шина управления Процессор Обработка данных Оперативная память Хранение.
Сканер (англ. scanner) устройство, которое анализируя какой-либо объект (обычно изображение, текст), создаёт цифровую копию изображения объекта. Процесс.
Виды и характеристики сканеров Автор: мастер производственного обучения Шибанова Наталья Викторовна Белгород 2011 Государственное образовательное учреждение.
Компьютерная графика Размер и разрешение Характеристики изображений.
Усольцева Э.М-А. преподаватель информатики ГОУНПО КПУ 1 Периферийные устройства Устройства ввода информации вторник, 19 ноября 2013 г.
Выполнил : Макаров Владимир Группа: ИСТ-11 Сканер устройство, которое создаёт цифровое изображение сканируемого объекта. Полученное изображение может.
помочь учащимся получить представление об OCR – программах распознавания текста, познакомиться с возможностями данных программы, воспитание информационной.
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
Сканер - устройство допускающее ввод текстового и графического материала в компьютер, а также любое изображение с фотоплёнки и бумаги. Это упрощает хранение.
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
Система оптического распознавания документа Шинкаренко Евгений Александрович МОУ Гимназия 2 г. Чернняховск Калининградской области.
Транксрипт:

Сканеры и программное обеспечение распознавания символов Анна Виноградова

Сканер - оптико- электронное устройство для ввода в компьютер графических изображений. Сканер - оптико- электронное устройство для ввода в компьютер графических изображений. Сканер создает оцифрованное изображение документа и помещает его в память компьютера. Сканер создает оцифрованное изображение документа и помещает его в память компьютера.

Виды сканеров Планшетные Планшетные Протяжные или роликовые Протяжные или роликовые Планетарные или книжные Планетарные или книжные

Планшетные Планшетный сканер - сканер, в котором оригинал кладется на стекло и сканируется при помощи подвижной линейной ПЗС матрицы. Планшетный сканер - сканер, в котором оригинал кладется на стекло и сканируется при помощи подвижной линейной ПЗС матрицы. Предназначены для ежедневного сканирования небольшого объёма фотографий, слайдов или документов. Предназначены для ежедневного сканирования небольшого объёма фотографий, слайдов или документов. простота конструкции, ручная обработка документов, низкая производительность. простота конструкции, ручная обработка документов, низкая производительность.

Протяжной или роликовый сканер. двустороннее сканирование (дуплекс) двустороннее сканирование (дуплекс) подсветка оригинала разными цветами для отсечки цветного фона подсветка оригинала разными цветами для отсечки цветного фона система компенсации неоднородного фона система компенсации неоднородного фона модули динамической обработки разнотипных оригиналов модули динамической обработки разнотипных оригиналов надпечатывание отметки о том, что документ прошел обработку надпечатывание отметки о том, что документ прошел обработку

Планетарный или книжный сканер. предназначен для сканирования скреплённых документов, периодических изданий и книг. предназначен для сканирования скреплённых документов, периодических изданий и книг. бесконтактный метод сканирования бесконтактный метод сканирования большая производительность при оцифровке книг и сшитых оригиналов. большая производительность при оцифровке книг и сшитых оригиналов.

Основные характеристики сканеров Разрешение (Resolution) - число точек или растровых ячеек, из которых формируется изображение, на единицу длины или площади. Разрешение (Resolution) - число точек или растровых ячеек, из которых формируется изображение, на единицу длины или площади. Измеряется в "точках на квадратный дюйм" (DPI, dots per inch). Измеряется в "точках на квадратный дюйм" (DPI, dots per inch). Типовое разрешение промышленных сканеров DPI. Типовое разрешение промышленных сканеров DPI.

Разрядность цвета - количество разрядов каждого пикселя в цифровом изображении. Описывает максимальное количество цветов, воспроизводимое сканером в виде степени числа 2. Разрядность цвета - количество разрядов каждого пикселя в цифровом изображении. Описывает максимальное количество цветов, воспроизводимое сканером в виде степени числа 2. Время сканирования измеряется в страницах в минуту. Время сканирования измеряется в страницах в минуту. Формат сканируемого документа - A3/A4. Формат сканируемого документа - A3/A4. Интерфейс передачи данных могут быть различны (к COM или USB порту, к SCSI карте и др.). Интерфейс передачи данных могут быть различны (к COM или USB порту, к SCSI карте и др.).

Программное обеспечение сканирования Программное обеспечение сканирования Существует три категории ПО сканирования: ПО сканирование малых объёмов документов ПО сканирование малых объёмов документов ПО сканирования больших объёмов документов ПО сканирования больших объёмов документов ПО для специальных задач сканирования ПО для специальных задач сканирования

ПО сканирование малых объёмов документов. Применяется при домашнем и офисном сканировании. Применяется при домашнем и офисном сканировании. Используется практически любое программное обеспечение, совместимое со стандартом TWAIN и поддерживающее функцию сканирования. Используется практически любое программное обеспечение, совместимое со стандартом TWAIN и поддерживающее функцию сканирования. TWAIN - является стандартом для прикладного программного интерфейса (API) таких периферийных устройств, как сканеры. TWAIN - является стандартом для прикладного программного интерфейса (API) таких периферийных устройств, как сканеры.

Примеры ПО сканирования малых объемов: ABBYY FineReader ABBYY FineReader Adobe PhotoShop Adobe PhotoShop Cognitive Cuineiform Cognitive Cuineiform Microsoft Photo Editor Microsoft Photo Editor ACDSEE ACDSEE

ПО сканирования больших объёмов документов. Применяется при промышленном сканировании. Применяется при промышленном сканировании. При поточном сканировании один сканер ежедневно может обрабатывать до и более документов. При поточном сканировании один сканер ежедневно может обрабатывать до и более документов. Для программного управления сканерами используется промышленный стандарт ISIS (ISIS - Image and Scanner Interface Specification). Для программного управления сканерами используется промышленный стандарт ISIS (ISIS - Image and Scanner Interface Specification).

Примеры применяемого ПО: Kofax Ascent Capture Kofax Ascent Capture Captiva InputAccel Captiva InputAccel

ПО для специальных задач сканирования. Применяется при планетарном, высококачественном сканировании. Применяется при планетарном, высококачественном сканировании. Разрабатывается с учётом специфики сканирующего устройства Разрабатывается с учётом специфики сканирующего устройства Применяемое ПО: План Скан BSC-2 План Скан BSC-2 RZ ProScan Book (Minolta PS7000 edition) RZ ProScan Book (Minolta PS7000 edition) Zeutschel OmniScan Zeutschel OmniScan

Что такое системы распознавания? Необходимо выполнить сканирование бумажных документов и распознать их содержимое с помощью специальных программ (Optical Character Recognition - OCR). Необходимо выполнить сканирование бумажных документов и распознать их содержимое с помощью специальных программ (Optical Character Recognition - OCR). Системы оптического распознавания символов предназначены для автоматического ввода печатных документов в компьютер. Обработка изображения OCR-системой включает в себя анализ графического изображения и распознавание каждого символа. Системы оптического распознавания символов предназначены для автоматического ввода печатных документов в компьютер. Обработка изображения OCR-системой включает в себя анализ графического изображения и распознавание каждого символа.

Процессы анализа макета страницы: определение областей распознавания определение областей распознавания определение таблиц определение таблиц определение картинок определение картинок выделение в тексте строк и отдельных символов выделение в тексте строк и отдельных символов

Точность распознавания OCR-системы могут достигать наилучшей точности распознавания свыше 99,9% для чистых изображений. OCR-системы могут достигать наилучшей точности распознавания свыше 99,9% для чистых изображений. Если имеется приблизительно 1500 символов на странице, то даже при коэффициенте успешного распознавания 99,9 % получается одна или две ошибки на страницу. В таких случаях на помощь приходит метод проверки по словарю. Если имеется приблизительно 1500 символов на странице, то даже при коэффициенте успешного распознавания 99,9 % получается одна или две ошибки на страницу. В таких случаях на помощь приходит метод проверки по словарю. Но это все равно не позволяет исправлять 100 % ошибок, что требует человеческого контроля результатов. Но это все равно не позволяет исправлять 100 % ошибок, что требует человеческого контроля результатов.

Причины ошибок при распознавании Грязные изображения Грязные изображения Неаккуратное сканирование, связанное с «человеческим фактором» Неаккуратное сканирование, связанное с «человеческим фактором» Если документ был ксерокопирован, нередко возникают разрывы и слияния символов. Если документ был ксерокопирован, нередко возникают разрывы и слияния символов. Страница, расположенная с нарушением границ или перекосом, создает немного искаженные символьные изображения, которые могут быть перепутаны OCR. Страница, расположенная с нарушением границ или перекосом, создает немного искаженные символьные изображения, которые могут быть перепутаны OCR.

Спасибо за внимание!