Обеспечение качества данных в информационных системах Дмитрий Шушкин, Руководитель направления корпоративных проектов, ABBYY Россия Дмитрий Шушкин, Руководитель.

Презентация:



Advertisements
Похожие презентации
Потоковый ввод документов – от бумажных к электронным Андрей Лубенец, ABBYY Россия.
Advertisements

Технологии ABBYY для работы с документами и данными Юрий Корюкин, Директор по корпоративным проектам Юрий Корюкин, Директор по корпоративным проектам ABBYY.
Платформа eDocLib: Удобный архив.Быстрый поиск.Надежное хранение данных из любых источников.
ФОРС-Центр Разработки Подсистема «Право». Подсистема «Право» предназначена для создания и ведения ведомственной базы данных электронных документов нормативно-правовой.
Техническая организация проведения устной части единого государственного экзамена по иностранному языку.
Технологии ввода бумажных документов в системы электронного документооборота Дмитрий Шушкин, Руководитель направления корпоративных проектов, ABBYY Россия.
Интеграционное решение Google Search Appliance и ABBYY Recognition Server для корпоративной сети Softline.
ЗАО «ЛИК» совместно с ГМЦ Росстата представляет Вашему вниманию новые, не имеющие аналогов на информационном рынке, онлайн программные продукты: ЛИК:КОНТРАГЕНТ.
Докладчик Должность Наименование мероприятия Дата и место проведения мероприятия Маркетинг и CRM ООО «ФАКТОР АЙ-ТИ» Докладчик: Лохтин Т.О.
MDM РАЗРАБОТКИ КРОК Домрачев Максим, РУКОВОДИТЕЛЬ ПРОЕКТОВ ПО РАЗРАБОТКЕ ПО КОМПАНИИ КРОК.
ABBYY TouchTo TM Fujitsu fi-6010N DocuWare 5. ABBYY TouchTo TM Сканирование документа – Fujitsu fi-6010N Распознавание документа – ABBYY OCR Индексирование.
ЗАО «ЛИК» совместно с ФГУП ГМЦ Росстата представляет Вашему вниманию новые, не имеющие аналогов на информационном рынке, онлайн программные продукты: ЛИК:КОНТРАГЕНТ.
1 Новые решения по автоматическому переводу: линейка PROMT Translation Server 10.
Порядок осуществления административной процедуры Выдача удостоверения многодетной семьи Служба, управление отдел райисполкома, которые проводят консультации.
Сервис распознавания для корпоративных сетей. DOCFLOW UKRAINE 2009 Предпосылки Каждый сотрудник профессионально работающий с документами нуждается в распознавании.
Модуль переноса решений Как средство распространения партнерских решений Варфоломеев Антон Директор по производству DocsVision.
Типовое решение «Делопроизводство» на базе DocsVision 4.3 SR1 Методический материал Copyright © DocsVision 2009.
Российские программы с мировым именем! Афиногенов Александр Региональный менеджер.
Опыт создания системы информационного взаимодействия АИС учета населения города Нижнего Новгорода с ПРИУР ГАС «Выборы» Заведующий сектором анализа и документирования.
Развитие программных комплексов Сбор РБД и Планирование ЕГЭ.
Транксрипт:

Обеспечение качества данных в информационных системах Дмитрий Шушкин, Руководитель направления корпоративных проектов, ABBYY Россия Дмитрий Шушкин, Руководитель направления корпоративных проектов, ABBYY Россия

2 ABBYY Recognition Server – надёжен и прост!

3 Как работает ABBYY Recognition Server Input foldersOutput folders

4 Архитектура ABBYY Recognition Server Входящая папка для изображений Исходящая папка для результатов Задание для обработки

5 Как работает ABBYY Recognition Server IT-специалист или системный администратор: Устанавливает и настраивает ABBYY Recognition Server Пользователи: Кладут изображения и PDF-файлы во входящую папку Забирают результат из исходящей папки ABBYY Recognition Server: Делает всё остальное!

6 Почему мы думаем, что Вам это нужно За последний год было продано: Несколько десятков тысяч МФУ стоимостью более $10K Более одного миллиона МФУ средней и нижней ценовой категории

7 Проблемы анализа данных ИНН ? = М.О. Долгопрудный ул Первомайская 5 11 АДРЕС г. Долгопрудный Мытищинского района Московской области Первомайская 5 11 ? ЧТО ДЕЛАТЬ?

8 Прикладные задачи Внедрение ERP / DMS / CMS / CRM - загрузка данных Слияние баз информационных систем (например, при объединении компаний) Отслеживание повторений в справочниках

9 Примеры типов данных Адреса Наименования организаций Номенклатуры товаров Паспортные данные ФИО Место рождения и другие…

10 Что такое нормальный вид? Нормальный вид типа данных: Основной критерий – возможность простым сравнением любых нормализованных объектов одного типа сказать - равны эти объекты или нет. Нормальный вид типа данных определяется аналитиком и разработчиком в контексте прикладной задачи

11 Нормализация 1-го адреса М.О. Долгопрудный ул Первомайская 5 11 М.О. | Долгопрудный | ул Первомайская | 5 | 11 МОСКОВСКАЯ | ОБЛ | ДОЛГОПРУДНЫЙ | Г | ПЕРВОМАЙСКАЯ | УЛ | Д | 5 | КВ | | РОССИЯ | МОСКОВСКАЯ | ОБЛ | МЫТИЩИНСКИЙ | Р-Н | ДОЛГОПРУДНЫЙ | Г | ПЕРВОМАЙСКАЯ | УЛ | Д | 5 | КВ | 11 Этап 1. Структуризация Этап 2. Приведение к каноническому виду Этап 3. Проверка на существование (с восстановлением по справочнику) Регион | Нас. Пункт | Улица | Дом | Кв.

12 Нормализация 2-го адреса г. Долгопрудный Мытищинского района Московской области Первомайская 5 11 Московская область | Мытищинский район | г. Долгопрудный | Первомайская | 5 | 11 МОСКОВСКАЯ | ОБЛ | МЫТИЩИНСКИЙ | Р-Н | ДОЛГОПРУДНЫЙ | Г | ПЕРВОМАЙСКАЯ | УЛ | Д | 5 | КВ | | РОССИЯ | МОСКОВСКАЯ | ОБЛ | МЫТИЩИНСКИЙ | Р-Н | ДОЛГОПРУДНЫЙ | Г | ПЕРВОМАЙСКАЯ | УЛ | Д | 5 | КВ | 11 Этап 1. Структуризация Этап 2. Приведение к каноническому виду Этап 3. Проверка на существование (с восстановлением по справочнику) Регион | Район | Нас. пункт | Улица | Дом | Кв.

13 Решение проблемы анализа ИНН = М.О. Долгопрудный ул Первомайская 5 11 АДРЕС г. Долгопрудный Мытищинского района Московской области Первомайская 5 11 ЧТО ДЕЛАТЬ? НОРМАЛИЗАЦИЯ | РОССИЯ | МОСКОВСКАЯ | ОБЛ | МЫТИЩИНСКИЙ | Р-Н | ДОЛГОПРУДНЫЙ | Г | ПЕРВОМАЙСКАЯ | УЛ | Д | 5 | КВ | 11 ? =

14 Уже работает ! Реализована настройка Сервера качества данных для следующих типов: ПБОЮЛ Юридические лица Банки Физические лица ФИО Даты Адреса Коды Кем и когда выдан документ, удостоверяющий личность Дата и место рождения и другие (всего более 30 типов данных)

15 Дмитрий Шушкин Руководитель направления корпоративных проектов ABBYY Россия Тел.: +7 (495) Факс: +7 (495)