Информационно- поисковая система «Архив документов»
Ключевые функции Загрузка документов из различных источников Извлечение текста из различных форматов файлов Определение основного и дополнительного языка документов Перевод документов Полнотекстовая индексация на различных языках Рубрикация документов Поиск объектов мониторинга в документах Анализ документов в различных срезах Шкала времени Экспорт документов во внешние системы
Загрузка документов Источники Интернет Сетевые папки организации Специальная папка на сервере Клиентские приложения Сторонние системы через API системы Форматы файлов Word (doc, docx) Excel (xls, xlsx) Adobe Reader (pdf) Text (txt) – Автоматическое определение кодировки HTML
Поиск документов По содержимому – полнотекстовый поиск Источнику информации Стране источника Объекту мониторинга Рубрике документа Рубрике источника информации Дате публикации Языку документа Дате загрузки документа
Автоматическая рубрикация Рубрикатор в виде дерева Для каждой ветки определяется несколько ключевых фраз Каждая фраза может быть переведена на несколько языков Преступление Уголовные преступления Финансовые преступления Коррупция Взятка Подкуп Язык Перевод Русский Коррупция АнглийскийCorruption Китайский Арабский فساد
Объекты мониторинга Типы Персоны Организации Регионы Понятия Характеристики Наименование Наименования на нескольких языках Краткая информация Досье Фотография/логотип Дата рождения (для персон)
Статистика запроса Статистика по странам источникам Статистика по языку документа Статистика по источникам Статистика по рубрикам документов Статистика по рубрикам источников Статистика по объектам мониторинга
Просмотр текса документа Перевод текста Показывать оригинал Показывать перевод, если есть. Показывает перевод текста, если он уже есть в базе. Переводить автоматически Подсветка текста Искомой фразы не разных языках Объектов мониторинга на разных языках Ключевых слов рубрик на разных языках
Локализация Локализация как интерфейса так и данных на несколько языком одновременно.
Автоматическое извлечение объектов из текстов В фоновом режиме происходит извлечение объектов из тексов (в текущей версии только на русском) Типы извлекаемых объектов Персоны Организации Страны и регионы Адреса электронной почты Имена собственные Даты и суммы Телефоны, ИНН и т.д.
Подсветка объектов и ключевых слов в оригинале и переводе
Шкала времени. По объекту мониторинга По региону источника По языку документа По : Рубрике источника Рубрике документа Источнику Количество документов за дату по различным срезам