Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС1 Требования к контекстному поиску в системах документооборота , Москва, Ленинские Горы, влад. 1, стр. 75 Г тел: +7 (095) /58 Вадим Бондарев. Директор по продажам, компания Гарант-Парк-Интернет
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС2 Содержание Задачи информационного поиска Готовые решения Гарант-Парк- Интернет.
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС3 Текстовая информация в системе документооборота Архитектура системы документооборота с точки зрения хранения информации хранилище Oracle или MS SQL Oracle или MS SQL
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС4 Возможности поиска в архитектуре системы Архитектура системы документооборота с точки зрения внешней поисковой системы хранилище Поисковый индекс
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС5 Возможности поиска в архитектуре системы Архитектура системы документооборота с точки зрения поисковых возможностей СУБД хранилище Поисковый индекс СУБД Oracle или MS SQL Oracle или MS SQL
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС6 Преимущества поиска на уровне СУБД Не требует дополнительных затрат ( дополнительные лицензии ) Не требует изменения архитектуры системы документооборота Высокая скорость поиска и индексации Возможность индексации документов в файловой системе
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС7 Задачи информационно-поисковой системы Поиск информации –С учетом словоформ –Нечеткий поиск (слова с ошибками) –Синонимический поиск Анализ информации и обработка –Классификация –Построение рефератов –Выделение ключевых тем –…
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС8 Функциональные требования к ИПС Контекстный поиск Нечеткий поиск Тезаурус Тематический анализ текста Рубрицирование документов ИПС Системы документооборота Какие функции?
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС9 Функциональные требования к ИПС Контекстный поиск –Язык построения запросов –Морфология –Тезаурус ИПС Системы документооборота КОНТЕКСТНЫЙ ПОИСК
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС10 Функциональные требования к ИПС Тезаурус: словарь, отражающий смысловые связи между словами или смысловыми элементами языка, предназначенный для поиска слов по их смыслу Расширение запроса – синонимами – более общими – более частными – родственными по смыслу ИПС Системы документооборота ТЕЗАУРУС
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС11 Функциональные требования к ИПС Нечеткий поиск –Позволяет находить слова с ошибками, что расширяет полноту поиска Например: Поиск Черномыдин= =Черномырдин= =Чернормырдин= =Ченомырдин ИПС Системы документооборота НЕЧЕТКИЙ ПОИСК
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС12 Функциональные требования к ИПС Рубрицирование Документов Позволяет: - автоматически строить иерархию рубрик по коллекции документов или по результатам запроса - классифицировать документы по рубрикам ИПС Системы документооборота РУБРИЦИРОВАНИЕ ДОКУМЕНТОВ
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС13 Функциональные требования к ИПС Тематический анализ: –Выделение ключевых тем –Построение тематических рефератов Например для отображения рефератов что облегчает понимание результатов поиска ИПС Системы документооборота ТЕМАТИЧЕСКИЙ АНАЛИЗ
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС14 RCO. Готовые решения OracleMicrosoft OracleText Microsoft Full Text Search
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС15 RCO. Готовые решения OracleMicrosoft OracleText Microsoft Full Text Search RCO for Oracle RCO for Backoffice
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС16 RCO for Oracle Реализация всех возможностей OracleText для русского языка Используется c Oracle Database, Oracle Portal Платформы: –Microsoft Windows –HP UX –IBM AIX –Sun Solaris –И другие…
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС17 RCO for Backoffice Расширяет возможности поиска на русском языке в следующих приложениях: –Indexing Service 3.0 for Microsoft Windows®, –Microsoft SharePoint Portal Server 2001, –Microsoft SQL Server 2000, –Microsoft Exchange Server В MS SQL Server 2000 облегчается администрирование полнотекстовых каталогов для документов на русском языке
Технологии анализа и поиска текстовой информации. Лингвистическое ПО компании Гарант-Парк-Интернет Гарант-Парк-Интернет Партнерская конференция ЭОС18 Гарант-Парк-Интернет Официальный сайт: Демонстрация возможностей