Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 10 лет назад пользователемСергей Строев
1 Сканеры и программное обеспечение распознавания символов Анна Виноградова
2 Сканер - оптико- электронное устройство для ввода в компьютер графических изображений. Сканер - оптико- электронное устройство для ввода в компьютер графических изображений. Сканер создает оцифрованное изображение документа и помещает его в память компьютера. Сканер создает оцифрованное изображение документа и помещает его в память компьютера.
3 Виды сканеров Планшетные Планшетные Протяжные или роликовые Протяжные или роликовые Планетарные или книжные Планетарные или книжные
4 Планшетные Планшетный сканер - сканер, в котором оригинал кладется на стекло и сканируется при помощи подвижной линейной ПЗС матрицы. Планшетный сканер - сканер, в котором оригинал кладется на стекло и сканируется при помощи подвижной линейной ПЗС матрицы. Предназначены для ежедневного сканирования небольшого объёма фотографий, слайдов или документов. Предназначены для ежедневного сканирования небольшого объёма фотографий, слайдов или документов. простота конструкции, ручная обработка документов, низкая производительность. простота конструкции, ручная обработка документов, низкая производительность.
5 Протяжной или роликовый сканер. двустороннее сканирование (дуплекс) двустороннее сканирование (дуплекс) подсветка оригинала разными цветами для отсечки цветного фона подсветка оригинала разными цветами для отсечки цветного фона система компенсации неоднородного фона система компенсации неоднородного фона модули динамической обработки разнотипных оригиналов модули динамической обработки разнотипных оригиналов надпечатывание отметки о том, что документ прошел обработку надпечатывание отметки о том, что документ прошел обработку
6 Планетарный или книжный сканер. предназначен для сканирования скреплённых документов, периодических изданий и книг. предназначен для сканирования скреплённых документов, периодических изданий и книг. бесконтактный метод сканирования бесконтактный метод сканирования большая производительность при оцифровке книг и сшитых оригиналов. большая производительность при оцифровке книг и сшитых оригиналов.
7 Основные характеристики сканеров Разрешение (Resolution) - число точек или растровых ячеек, из которых формируется изображение, на единицу длины или площади. Разрешение (Resolution) - число точек или растровых ячеек, из которых формируется изображение, на единицу длины или площади. Измеряется в "точках на квадратный дюйм" (DPI, dots per inch). Измеряется в "точках на квадратный дюйм" (DPI, dots per inch). Типовое разрешение промышленных сканеров DPI. Типовое разрешение промышленных сканеров DPI.
8 Разрядность цвета - количество разрядов каждого пикселя в цифровом изображении. Описывает максимальное количество цветов, воспроизводимое сканером в виде степени числа 2. Разрядность цвета - количество разрядов каждого пикселя в цифровом изображении. Описывает максимальное количество цветов, воспроизводимое сканером в виде степени числа 2. Время сканирования измеряется в страницах в минуту. Время сканирования измеряется в страницах в минуту. Формат сканируемого документа - A3/A4. Формат сканируемого документа - A3/A4. Интерфейс передачи данных могут быть различны (к COM или USB порту, к SCSI карте и др.). Интерфейс передачи данных могут быть различны (к COM или USB порту, к SCSI карте и др.).
9 Программное обеспечение сканирования Программное обеспечение сканирования Существует три категории ПО сканирования: ПО сканирование малых объёмов документов ПО сканирование малых объёмов документов ПО сканирования больших объёмов документов ПО сканирования больших объёмов документов ПО для специальных задач сканирования ПО для специальных задач сканирования
10 ПО сканирование малых объёмов документов. Применяется при домашнем и офисном сканировании. Применяется при домашнем и офисном сканировании. Используется практически любое программное обеспечение, совместимое со стандартом TWAIN и поддерживающее функцию сканирования. Используется практически любое программное обеспечение, совместимое со стандартом TWAIN и поддерживающее функцию сканирования. TWAIN - является стандартом для прикладного программного интерфейса (API) таких периферийных устройств, как сканеры. TWAIN - является стандартом для прикладного программного интерфейса (API) таких периферийных устройств, как сканеры.
11 Примеры ПО сканирования малых объемов: ABBYY FineReader ABBYY FineReader Adobe PhotoShop Adobe PhotoShop Cognitive Cuineiform Cognitive Cuineiform Microsoft Photo Editor Microsoft Photo Editor ACDSEE ACDSEE
12 ПО сканирования больших объёмов документов. Применяется при промышленном сканировании. Применяется при промышленном сканировании. При поточном сканировании один сканер ежедневно может обрабатывать до и более документов. При поточном сканировании один сканер ежедневно может обрабатывать до и более документов. Для программного управления сканерами используется промышленный стандарт ISIS (ISIS - Image and Scanner Interface Specification). Для программного управления сканерами используется промышленный стандарт ISIS (ISIS - Image and Scanner Interface Specification).
13 Примеры применяемого ПО: Kofax Ascent Capture Kofax Ascent Capture Captiva InputAccel Captiva InputAccel
14 ПО для специальных задач сканирования. Применяется при планетарном, высококачественном сканировании. Применяется при планетарном, высококачественном сканировании. Разрабатывается с учётом специфики сканирующего устройства Разрабатывается с учётом специфики сканирующего устройства Применяемое ПО: План Скан BSC-2 План Скан BSC-2 RZ ProScan Book (Minolta PS7000 edition) RZ ProScan Book (Minolta PS7000 edition) Zeutschel OmniScan Zeutschel OmniScan
15 Что такое системы распознавания? Необходимо выполнить сканирование бумажных документов и распознать их содержимое с помощью специальных программ (Optical Character Recognition - OCR). Необходимо выполнить сканирование бумажных документов и распознать их содержимое с помощью специальных программ (Optical Character Recognition - OCR). Системы оптического распознавания символов предназначены для автоматического ввода печатных документов в компьютер. Обработка изображения OCR-системой включает в себя анализ графического изображения и распознавание каждого символа. Системы оптического распознавания символов предназначены для автоматического ввода печатных документов в компьютер. Обработка изображения OCR-системой включает в себя анализ графического изображения и распознавание каждого символа.
16 Процессы анализа макета страницы: определение областей распознавания определение областей распознавания определение таблиц определение таблиц определение картинок определение картинок выделение в тексте строк и отдельных символов выделение в тексте строк и отдельных символов
17 Точность распознавания OCR-системы могут достигать наилучшей точности распознавания свыше 99,9% для чистых изображений. OCR-системы могут достигать наилучшей точности распознавания свыше 99,9% для чистых изображений. Если имеется приблизительно 1500 символов на странице, то даже при коэффициенте успешного распознавания 99,9 % получается одна или две ошибки на страницу. В таких случаях на помощь приходит метод проверки по словарю. Если имеется приблизительно 1500 символов на странице, то даже при коэффициенте успешного распознавания 99,9 % получается одна или две ошибки на страницу. В таких случаях на помощь приходит метод проверки по словарю. Но это все равно не позволяет исправлять 100 % ошибок, что требует человеческого контроля результатов. Но это все равно не позволяет исправлять 100 % ошибок, что требует человеческого контроля результатов.
18 Причины ошибок при распознавании Грязные изображения Грязные изображения Неаккуратное сканирование, связанное с «человеческим фактором» Неаккуратное сканирование, связанное с «человеческим фактором» Если документ был ксерокопирован, нередко возникают разрывы и слияния символов. Если документ был ксерокопирован, нередко возникают разрывы и слияния символов. Страница, расположенная с нарушением границ или перекосом, создает немного искаженные символьные изображения, которые могут быть перепутаны OCR. Страница, расположенная с нарушением границ или перекосом, создает немного искаженные символьные изображения, которые могут быть перепутаны OCR.
19 Спасибо за внимание!
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.