1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Г.С.Осипов,И.В.Смирнов,И.В.Соченков,А.О.Шелманов, А.В.Швец Институт системного.

Презентация:



Advertisements
Похожие презентации
1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Смирнов Иван Валентинович с.н.с. ИСА РАН.
Advertisements

Построение правил для автоматического извлечения словосочетаний из текста Загорулько Максим Юрьевич Научный руководитель н.с. ИСИ СО РАН, к.ф.-м.н. Е.А.Сидорова.
Опыт реализации системы контентной фильтрации Интернет-ресурсов на базе технологий АРИОН.
Итоги апробации информационной системы для мониторинга оценки качества основного общего образования Ушакова Е.Г. Сургут, 16 апреля 2013 ИПОП «Эврика»
Секция 2. Онтологии и метаинформация в системах поиска Председатель: Е.Б. Кудашев Институт космических исследований РАН Механико-математический факультет.
1 Системный подход в моделировании МОДЕЛИРОВАНИЕ И ФОРМАЛИЗАЦИЯ.
12 июля 2008 года Летняя лингвистическая школа. 1 Компьютерная лингвистика как источник лингвистических знаний Леонид Лейбович Иомдин Институт проблем.
Информационно-поисковая система. Классификация информационно- поисковых систем.
Выполнила студентка группы ТУ-501 Полозова Ю.О. Виды документальных информационных систем Документальная информационная система (ДИС) единое хранилище.
Компьютерная лингвистика как наука. 1. Определения компьютерной лингвистики 2. Компьютерная лингвистика и искусственный интеллект 3. Разделы компьютерной.
Научный стиль. Определение научного стиля.. Что такое научный стиль? Научный стиль – разновидность книжных стилей литературного языка. Он применяется.
Москва Семантическая обработка данных в программно-аппаратном комплексе (ПАК), предназначенном для управления предприятиями и отраслями.
1 Использование онтологий при создании интеллектуальных систем И.Л. Артемьева Дальневосточный государственный университет.
Институт системного анализа Российской академии наук (ИСА РАН) 1 "Проблемы и методы управления безопасностью критических инфраструктур национального масштаба".
Синтаксис
Тема 11 Медицинская помощь и лечение (схема 1). Тема 11 Медицинская помощь и лечение (схема 2)
Компьютерный анализ естественно-языкового текста Кафедра информационных систем в искусстве и гуманитарных науках.
Text Mining. Анализ текстовой информации. Text Mining- методы анализа неструктурированного текста Обнаружение знаний в тексте Обнаружение знаний в тексте.
ЕГЭ по русскому языку в 2015 году в новом формате Часть 1: особенности структуры специфика подготовки.
Объектные СУБД Поисковые технологии Специализированные ИПС и Web-сервисы Лингвистический и семантический анализ текстов документов НПЦ «ИНТЕЛТЕК ПЛЮС»
Транксрипт:

1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Г.С.Осипов,И.В.Смирнов,И.В.Соченков,А.О.Шелманов, А.В.Швец Институт системного анализа РАН

2 Назначение системы Информационно-аналитическая поддержка научно-технической деятельности Помощь исследователям при выполнении НИР Анализ состояния дел в заданной научной области Выявление научных коллективов Оценка качества научных публикаций

3 Основные решаемые системой задачи(1) Автоматическое наполнение коллекций научных публикаций, в том числе из открытых источников Автоматическое извлечение метаинформации – авторов, названия, года публикации Релевантный семантический поиск научных публикаций по запросу на естественном языке Поиск близких к заданной тематике публикации Все задачи решаются на основе поиска и анализа полных текстов научных публикаций

4 Основные решаемые системой задачи(2) Выделение научных направлений Выделение научных коллективов Анализ динамики различных показателей для направлений и коллективов Резюме – составление краткого изложения публикации

5 Основные решаемые системой задачи(3) Определение качества текстов научных публикаций : –проверка соответствия структуры публикации формальным требованиям – проверка наличия разделов «постановка проблемы», «методы решения», «эксперименты» и т.д. –выявление наличия квазинаучной и лженаучной лексики и словосочетаний –выявление семантических дефектов Выделение авторских терминов Выделение результатов

6 Общий алгоритм работы системы Шаг 1. Загрузка научно-технических документов Шаг 2. Лингвистическая обработка текстов документов. Извлечение полезной информации Шаг 3. Выполнение методов поиска, кластеризации, классификации и других методов анализа текстов

7 Лингвистическая обработка Коммуникативная грамматика русского языка (применима для других языков) Морфологический, синтаксический, семантический анализ текста Лингвистические ресурсы – словари и правила Реляционно-ситуационная модель текста, формализующая семантику текста в виде неоднородной семантической сети

8

9

10

11

12

13

14

15

16

17

18 Выявление семантических дефектов(1) Правило 1: если предложение содержит причастный оборот, выделенный запятыми, и причастие не согласуется ни с одним из существительных, местоимений, прилагательных и числительных, стоящих перед оборотом, в роде, числе и падеже в ед. ч. и в числе и падеже во мн. ч. (и не согласуется с однородными членами в падеже во мн. ч.), то такое предложение содержит признак нарушения Пример.«Существует возможность превращения идиолекта в некий субстрат с аморфным содержанием и «экономной» формой, не дающих реальных шансов для диагностики говорящего»

19 Выявление семантических дефектов(2) Правило 2: если выполнено, по крайней мере, одно из условий: второй элемент пары встретился в тексте раньше, чем первый; между однотипными элементами определенной пары отсутствует элемент другого типа, т.е. был пропущен один из элементов; после первого элемента пары в оставшейся части текста отсутствует второй элемент. Пример. «Нашим восприятием знаков, напоминающих нам об истории, репрезентирующих те или иные события в актуальном настоящем, управляют несколько важных механизмов. Во-первых, это «распознавание имени»...

20 Выделение авторских терминов Первый шаг: графематический, морфологический, синтаксический и реляционно-ситуационный анализ. Второй шаг: расширение контекстов синтаксической и семантической информацией.

21 Шаблоны контекстов определений ЧР(Сущ.)&Падеж(Им.) + * + НФ(«этот») + * +ЧР(сущ.)&Падеж(И м.) ЧР(Сущ.)&Знач.Синт.(эстиматив) + НФ(«называться»). Сервис CORBA2ODBC – это менеджер ORB объектов СУБД. Биссектрисой называется прямая, делящая угол между двумя прямыми пополам выделения результатов

22 Выделение результатов 1. Выявление предикатных слов 2. Синтаксема употреблена в роли объекта, делибератива или каузатива.

23 Выделение результатов проведен анализ + делибератив дополнен + делибератив изложен + делибератив изучен + делибератив обеспечено + каузат введен + объект выделен + объект

24

25 expert.exactus.ru Институт системного анализа Российской академии наук , Москва, пр-т. 60-летия Октября, 9 Телефон/факс: +7 (499)