Объектные СУБД Поисковые технологии Специализированные ИПС и Web-сервисы Лингвистический и семантический анализ текстов документов НПЦ «ИНТЕЛТЕК ПЛЮС»
Научно-технический задел хранения данных в виде объектов в БД полнотекстового поиска морфологического и синтаксического анализа текстов извлечение структурированной информации из текстов на естественном языке классификации, кластеризации, аннотирования текстов, выявления ассоциативных связей семантического анализа текстов, модели представления смысла текста формализации противоречий и несоответствий в разработанных моделях смысла текстов Разработаны методы, алгоритмы и программы:
Используемые технологии Semantic Web – OWL, RDF, SPARQL XML, KML Java MySQL, PostgreSQL, Oracle, Jena SOA, SOAP Protege
Гео-привязка документов
Предназначение системы Визуализации больших объемов информации в разрезе географического местоположения. Визуализация результатов анализа текстов. Представление динамики развития ситуации, описываемой в документальной базе на карте местности.
Основные функции системы Выявление в текстах документов географических названий. Отображение объектов на карте по заданным координатам. Отображение административных объектов и регионального деления. Представление документов на географической карте. Цветовая индикация статистических данных. Поддержка временного ряда для документов.
Структура системы
Инструментальные средства Google Earth Известный геобраузер от компании Google. Позволяет создавать визуально насыщенные презентации, а также обладает богатыми возможностями по отображению пользовательских данных. В случае необходимости возможно использование другого геобраузера. KML Язык геобраузеров на основе XML. Наиболее популярные картографические сервисы поддерживают данный язык. Обладает необходимыми возможностями для визуализации любой сложности. ODB Jupiter и «Обзор СМИ» Разработка компании НПЦ «ИНТЕЛТЕК ПЛЮС». Обладает широкой функциональностью, используется как хранилище документов и как средство совершения операций над ними. Java. Используется как средство генерации динамического KML.
Назначение системы: Сбор информации из разнородных источников. Оперативная обработка собранной информации. Предоставление конечным пользователям отобранного массива информации. Подготовка аналитических отчетов по накопленной информации. ИПС Обзор СМИ
Структура Обзор СМИ
Загрузка и преобразование новостей
Выборка сообщений СМИ для демонстрации Поисковый запрос: SELECT "Название объекта", "Текст документа" FROM "Сообщение" WHERE "Текст документа" =~ "пожар*" LIMIT 50 OFFSET 0 Характеристики выборки: -размер: документа, объем 63 Мб Временные характеристики: - построение презентации:5 мин.
Скриншот презентации
Возможные области применения Представление результатов мониторинга СМИ Создание сложных презентаций больших объемов данных, содержащих географическую информацию Визуализация результатов анализа развития чрезвычайных ситуаций Ситуационные центры