Интеллектуальные возможности для обработки растущих объемов данных. Технологии завтрашнего дня. Сергей Полтев Москва, 17 октября 2014 года
Корпоративные данные сегодня Неструктурированных данных (электронная почта, сообщения, документы, заявки и т.п.) становится все больше 300 млрд / день – 24 млрд / день – SMS 10 млрд / день – телефонных звонков Источник: Исследование ABBYY/DOCFLOW 2014 г.
Эффективный архив. Вчера и сегодня. Быстрый поиск и извлечение необходимых данных Реализация процессов обработки Структурирование, каталогизация Подготовка сводных отчетов
Эффективный архив сегодня. Извлечение атрибутов Реквизит Значение Контрагент 1ООО «Энская транспортная компания» Контрагент 2ООО «Агроимпульс» ….….…. Анализ изображения, извлечение значимой информации Автоматическое заполнение учетной карточки данными из текста
Существующих технологий недостаточно. Переизбыток информации, невозможность «человеческой» обработки всего объема
Эффективный архив. Завтра Интеллектуальный поиск Извлечение фактов из неструктурированного текста Классификация текстов Автоматическая обработка произвольных материалов из внешних источников (Интернет, публикации прессе, и т.п.)
Эффективные архивы завтра. Извлечение фактов Ключевые объекты и значимые факты
Новые возможности Извлечение данных без предварительной настройки форм Автоматическое «структурирование» информации Рубрикация, установка связи между объектами Сценарии автоматической обработки вновь поступающих материалов в зависимости от содержания
Больше информации – больше требования к платформе Гибкость Производительность Отказоустойчивость Безопасность ДЕЛО EOS for SharePoint eDocLib
Примеры использования
Пример 1. Автоматическая обработка корреспонденции.
Автоматическая обработка корреспонденции Оценка содержимого – тональность, упоминаемые факты и персоны Исходя из оценки – отправка по одному из предопределенных маршрутов Результат: оперативный и своевременный ответ
Пример 2. База знаний по продукции.
Автоматическая актуализация базы знаний Производитель Наименование Аналоги Характеристики Мониторинг российских и зарубежных производителей Автоматическая обработка и рубрикация Предоставление полной информации по аналогам изделий, производимых предприятием, нормативным документам, и т.п. Результат: поддержание базы знаний в актуальном состоянии МОНИТОРИНГ Автоматическая обработка данных Производитель Наименование Аналоги Характеристики Производитель Наименование Аналоги Характеристики РУБРИКАЦИЯ
Спасибо за внимание!