СИСТЕМА ИЗВЛЕЧЕНИЯ ФАКТОГРАФИЧЕСКОЙ ИНФОРМАЦИИ ИЗ ТЕКСТОВ ОБЩЕСТВЕННО- ПОЛИТИЧЕСКОЙ ТЕМАТИКИ Пивоварова Л. М. (СПбГУ) Научный руководитель: Рубашкин В.

Презентация:



Advertisements
Похожие презентации
Организация исследовательской деятельности учащихся на уроках информатики Учитель информатики Фролова Е.А. МОУ СОШ 22 г.Томска.
Advertisements

Тема 2. Исследование как составная часть менеджмента организации Метод, который используется для диагностики внутренних проблем, называют управленческим.
"Электронные библиотеки " Дубна Россия Метаданные в системе управления многоязычной лингвистической базой знаний Н.В. Лунева Институт.
Опыт реализации системы контентной фильтрации Интернет-ресурсов на базе технологий АРИОН.
центральная точка доступа к систематизированной и консолидированной информации о СМИ и их взаимодействии с гражданами ПОРТАЛ «СМИ ЧУВАШИИ»
ОНТОРЕДАКТОР КАК КОМПЛЕКСНЫЙ ИНСТРУМЕНТ ОНТОЛОГИЧЕСКОЙ ИНЖЕНЕРИИ Рубашкин В. Ш., Пивоварова Л. М. Санкт-Петербургский государственный университет Кафедра.
Технология подготовки презентации как средство организации учебной деятельности учеников и учителя на примере урока литературы «А. Грин. Путь к писателю»
Информационная система «Анализ финансово-хозяйственной деятельности ООО «Шахта Листвяжная» Исполнитель: Сарапулова Татьяна Викторовна Научный руководитель:
1 Средства автоматической интеграции разнородных онтологий Панасенко Алексей, 525 группа Научный руководитель Большакова Е.И.
1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Смирнов Иван Валентинович с.н.с. ИСА РАН.
Вопросы применения методики постановления 614 в регионе, в котором ранее введена социальная норма потребления электрической энергии Рыжов Александр Борисович.
Компьютерная лингвистика как наука. 1. Определения компьютерной лингвистики 2. Компьютерная лингвистика и искусственный интеллект 3. Разделы компьютерной.
ОСНОВНЫЕ РЕЖИМЫ РАБОТЫ ТЕКСТОВОГО РЕДАКТОРА ВВОД – РЕДАКТИРОВАНИЕ ТЕКСТОВОЙ ИНФОРМАЦИИ ДОПОЛНИТЕЛЬНЫЕ РЕЖИМЫ РАБОТЫ ТР Ввод текста с клавиатуры Редактирование.
1. Классификация исследовательских работ учащихся: 1. Классификация исследовательских работ учащихся: -исследовательская деятельность - деятельность, связанная.
Предмет, методы и задачи экономической статистики.
ЛИЧНОСТНО- КОММУНИКАТИВНАЯ РАЗВИВАЮЩАЯ МОДЕЛЬ «ПЕРСПЕКТИВНАЯ НАЧАЛЬНАЯ ШКОЛА»
Интегрированный УМК «Открываю законы родного языка, математики и природы» для 1- 4 кл. Семинар НФПК марта 2007 года.
Метрологические характеристики современных методов анализа 1.Аналитическая химия, как основа методов изучения и контроля химического состава веществ в.
«Поиск шаблонов в программном коде» Автор: студент 445 группы Евгений Куделевский Руководитель: к.ф.-м.н., ст. разработчик компании JetBrains Максим Мосиенко.
Транксрипт:

СИСТЕМА ИЗВЛЕЧЕНИЯ ФАКТОГРАФИЧЕСКОЙ ИНФОРМАЦИИ ИЗ ТЕКСТОВ ОБЩЕСТВЕННО- ПОЛИТИЧЕСКОЙ ТЕМАТИКИ Пивоварова Л. М. (СПбГУ) Научный руководитель: Рубашкин В. Ш. Factors Система Factors: - интеллектуальная среда для поддержки работы эксперта-аналитика с текстами. ТЕКСТЫ FACTORS ФакторЗначени е Задача: извлечение из текстов СМИ информации общественно-политической тематики. Факторы - различные характеристики общественно-политической ситуации ( число пенсионеров; средний уровень заработной платы; социальная напряженность; военные угрозы ). Значения факторов: количественные ( объем экспорта ) и оценочные ( уровень плюрализма в СМИ ) Функциональность: 1.Последовательное наращивание распознаваемых аспектов содержания в процессе работы эксперта-аналитика с системой. 2.Легкость и простота редактирования и пополнения; визуальное представление информации. 3.Функциональная расширяемость и переносимость на другие проблемные и предметные области. Методология Information Extraction: поиск на основе текстовых образцов. Образцы Фактор + значение В основном для оценочных факторов социальная напряженность стихийный митинг Только фактор Для количественных образцов: уровень инфляции 4% инфляция составила 4% Образцы Текстовые – выделение в тексте релевантных фрагментов (при анализе может проверяться совпадение синтаксических связей) Концептуальные – сборка образца из концептов онтологии (при анализе осуществляется поиск с учетом отношения «общее-частное») Смешанные Поиск образцов в тексте Собственный признак фактора – концепт, отвечающий на вопрос «количество (величина) чего?» Уровень зарплаты заработная плата Транспортные издержки траты Число пенсионеров пенсионеры Онтология: собственный признак единица измерения заработная плата денежная единица пенсионеры без единиц Общий алгоритм поиска 1) Поиск образца 2) Определение собственного признака и единиц измерения 3) Поиск числа с единицей измерения 4) Проверка соответствия единиц измерения 5) Если число не найдено – поиск слов большой, маленький, растет, падает и их синонимов 6) Определение достоверности Параметры поиска предполагают отладку и настройку