ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ СОЗДАНИЯ И ОБРАБОТКИ ТЕКСТОВ
ВОПРОСЫ: 1. Виды программ работы с текстом. 2. Системы оптического распознавания символов. 3. Текстовые редакторы и процессоры, настольные издательские системы. 4. Текстовый формат и формат документа.
ВИДЫ ПРОГРАММ РАБОТЫ С ТЕКСТОМ Программы: оптического распознавания символов; создания, редактирования и печати текстовых документов и электронных форм; автоматизированного перевода текстов и словари; создания электронных публикаций и книг.
ВИДЫ ПРОГРАММ РАБОТЫ С ТЕКСТОМ Программы создания, редактирования и печати текстовых документов и электронных форм: текстовые редакторы; текстовые процессоры; настольные издательские системы; программы создания и работы с динамическими бизнес-формами (MS InfoPath, Adobe Acrobat Professional, Form Pilot Office, ).
ВИДЫ ПРОГРАММ РАБОТЫ С ТЕКСТОМ Электронная форма
ВИДЫ ПРОГРАММ РАБОТЫ С ТЕКСТОМ программы автоматизированного перевода текстов и словари: PROMT, Pragma, ПАРС, ABBYY Lingvo Live. программы создания электронных публикаций и книг: NeoBook Professional Multimedia, eBook Maestro, BookDesigner, EBook Producer.
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ Назначение: автоматизация ввода больших объемов документов (20-50 документов в минуту). Повышение скорости обработки документов: увеличение скорости ввода данных в информационные системы в 3-10 раз. Повышение удобства и качества работы с данными: высокий уровень безопасности конфиденциальных данных, сокращение количества ошибок, связанных с человеческим фактором. Снижение затрат на обработку документов: сокращение суммарных расходов на обработку документов более чем на 50%.
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ OCR (Optical Character Recognition) Оптическое распознавание символов ICR (Intelligent Character Recognition) Интеллектуальное распознавание символов
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ
OCR (Optical Character Recognition) Оптическое распознавание символов ICR (Intelligent Character Recognition) Интеллектуальное распознавание символов OMR (Optical Mark Recognition) Оптическое распознавание меток IDR (Intelligent Document Recognition) Интеллектуальное распознавание документов HCR (Handprint Character Recognition) Распознавание рукопечатных символов
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ
Этапы преобразование документа в электронный вид OCR-системами: 1. Сканирование и предварительная обработка изображения. 2. Анализ структуры документа. 3.Распознавание. 4. Проверка результатов. 5. Реконструкция документа (воссоздание его исходного вида). 6.Экспорт.
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ Оптическое распознавание символов: ABBYY FineReader, CuneiForm, OmniPage Professional, Microsoft Office Document Imaging, SimpleOCR, TextBridge, Readiris.
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ Этапы преобразование информации ICR-системами : 1. Сканирование и предварительная обработка изображения. 2. Анализ и воссоздание структуры документа. 3. Определение назначения элементов и их логической взаимосвязи. 4. Извлечение необходимых данных. 5. Передача и сохранение данных в соответствующих полях информационной системы.
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ Технология Программа OMR. Оптическое распознавание меток UdaiOMR, queXF, QiuzOMR, ABBYY FineReader Engine IDR. Интеллектуальное распознавание документов Cognitive Forms Bank, Cognitive Passport, ABBYY Business Card Reader, ABBYY FlexiCapture, ABBYY FineReader Банк, ITSoft SmartCapture Bank HCR. Распознавание рукопечатных символов eDochi HCR, ArioForm, MyScript Studio
ТЕКСТОВЫЕ РЕДАКТОРЫ И ПРОЦЕССОРЫ, НАСТОЛЬНЫЕ ИЗДАТЕЛЬСКИЕ СИСТЕМЫ Текстовые редакторы – программы, выполняющие простейшие операции по редактированию текста. Процессоры – программы, обладающие расширенными по сравнению с редакторами возможностями для компьютерной обработки текста.
ТЕКСТОВЫЕ РЕДАКТОРЫ И ПРОЦЕССОРЫ, НАСТОЛЬНЫЕ ИЗДАТЕЛЬСКИЕ СИСТЕМЫ
Настольные издательские системы - программы, предназначенные для профессиональной издательской деятельности и позволяющие осуществлять электронную верстку широкого спектра основных типов документов. Отличаются расширенными средствами управления взаимодействием текста с параметрами страницы и с графическими объектами.
ТЕКСТОВЫЕ РЕДАКТОРЫ И ПРОЦЕССОРЫ, НАСТОЛЬНЫЕ ИЗДАТЕЛЬСКИЕ СИСТЕМЫ Текстовые редакторы Текстовые процессоры Настольные издательские системы Редакторы, встроенные в системы программирования или системы управления базами данных, MS Editor, Multi-Edit, NotePad. MS Word, WordPerfect, AmiPro, OpenOffice.org Writer, ChiWriter, StarWriter, Adobe InCopy. Corel Ventura, QuarkXPress, Scribus, Adobe PageMaker, Adobe FrameMaker, MS Publisher.
ТЕКСТОВЫЙ ФОРМАТ И ФОРМАТ ДОКУМЕНТА Формат способ организации информации в файле того или иного типа.
ТЕКСТОВЫЙ ФОРМАТ И ФОРМАТ ДОКУМЕНТА
Канонический текстовый формат: расширение.txt. Формат документа: расширения.docх (Microsoft Word Open eXtensible Markup Language Document),.rtf (Rich Text Format).