ЛЕ КСИКО-СИНТАКСИЧЕСКИЕ ШАБЛОНЫ ДЛЯ АВТОМАТИЧЕСКОГО АНАЛИЗА НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ Е. И. Большаков а, Н. Э. Васильева, С.С. Морозов МГУ им. М.В. Ломоносова.

Презентация:



Advertisements
Похожие презентации
ЛЕКСИКО-СИНТАКСИЧЕСКИЕ ШАБЛОНЫ В ЗАДАЧАХ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТА Большакова Е.И., Баева Н.В., Бордаченкова Е.А., Васильева Н.Э., Морозов С.С. МГУ.
Advertisements

ТАЦОГРНПСТАЦОГРНПС Корпус текстов китайского языка для автоматической обработки Соискатель – Довнар П.Ю. Научный руководитель – кандидат филологических.
ТЕРМИНОЛОГИЧЕСКИЙ АНАЛИЗ ТЕКСТА НА ОСНОВЕ ЛЕКСИКО-СИНТАКСИЧЕСКИХ ШАБЛОНОВ Ефремова Н.Э., Большакова Е.И., Носков А.А., Антонов В.Ю. МГУ имени М.В. Ломоносова,
1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Смирнов Иван Валентинович с.н.с. ИСА РАН.
Программная поддержка языка лексико-синтаксических шаблонов Носков А. А. Научный руководитель: Большакова Е.И. Московский Государственный Университет им.
Реферат. Научно - исследовательская работа. Проект.
Язык и стиль научной речи. Лексический уровень важно передать один, и только один смысл; эмоциональная нагруженность слова - недостаток, мешающий пониманию.
Презентация на тему: Студентки 23 группы Бельковой Светланы.
Научный руководитель: кандидат филологических наук, доцент Варпахович Л. В.
Обобщение знаний по теме «Глагол» Исследование слова «сверкать»
МАОУ Средняя общеобразовательная школа 1 р.п. Красные Баки Употребление фразеологизмов в речи современного школьника. Выполнила обучающаяся 9 «а» класса.
Говоря о двух последних «умениях» компьютера, необходимо помнить, что почти во всех существующих системах автоматического реферирования в качестве основных.
ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ ТЕРМИНОЛОГИЧЕСКИХ ВАРИАНТОВ В ТЕКСТАХ Антонов Вадим Юрьевич Научный руководитель: Ефремова Наталья Эрнестовна Дипломная.
Текстообразующие функции производных имен прилагательных в романе Б.Окуджавы «Путешествие дилетантов» Магистерская диссертация магистрантки филологического.
Коллокации и конструкции в исследовании структуры текста Лидия Пивоварова Елена Ягунова
Формирование грамматических понятий. Понятие - форма абстрактного мышления, отражающая существенные признаки предметов и явлений.
По степени проникновения в содержание и в зависимости от коммуникативных потребностей выделяют типы чтения: поисково-просмотровоепоисково-просмотровое.
Правила оформления Правила оформления исследовательской работы Подготовила : Таранова О.С.
ЛИНГВИСТИЧЕСКИЕ КОРПУСЫ: НОВОЕ НАПРАВЛЕНИЕ ПРОЕКТНОЙ ДЕЯТЕЛЬНОСТИ Львова Ольга Владимировна доцент кафедры информатизации образования МГПУ.
Организация научно- исследовательской деятельности учащихся во внеурочное время Организация научно- исследовательской деятельности учащихся во внеурочное.
Транксрипт:

ЛЕ КСИКО-СИНТАКСИЧЕСКИЕ ШАБЛОНЫ ДЛЯ АВТОМАТИЧЕСКОГО АНАЛИЗА НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ Е. И. Большаков а, Н. Э. Васильева, С.С. Морозов МГУ им. М.В. Ломоносова Факультет ВМиК

Научно-техническая проза: функции и стилевые особенности Функции оформления, отбор сохранения и передачилингвистических научной информации: средств Средства разных уровней: лексика и фразеология; дискурс и композиция; морфология и синтаксис.

Лексико-фразеологические особенности Специальная терминология научной области Общенаучные слова и словосочетания (по этой причине, суммируя вышесказанное, далее мы докажем и т.п. ) Стандартизованные конструкции - клише общенаучной речи (обозначить направления дальнейших исследований, всесторонний анализ проблемы показывает и т.п.) Системный характер; Взаимосвязь с дискурсивными особенностями

Дискурсивные и композиционные особенности Научный дискурс (речь) – рассуждение, отражающее последовательность операций научного мышления (выдвижение гипотезы, введение термина, обобщение и т.п.) Дискурсивные маркеры (общенаучные слова и выражения) - помечают эти операции (предположим, что; далее кратко изложен … и др.), - упорядочивают и связывают их (во-первых, наконец; благодаря тому, что и др.),

Дискурсивные операции и маркеры Исследование текстов (научные статьи, аннотации) из нескольких областей дало список операций: Конкретизация и уточнение ( в дополнение к ); Актуализация темы (перейдем к); Выделение информации (особо подчеркнем,); Предположения и допущения (предположим, что); Иллюстрация и приведение примеров (к примеру); Обобщение и резюмирование (в общем); Сравнение и противопоставление (в отличие от); И др.

Словарные средства анализа научного текста Словарь общенаучных слов и словосочетаний: функционально-семантическая классификация разнородных единиц (классы квазисинонимов). Лексико-синтаксические шаблоны - отображают характерные конструкции научных текстов Гипотеза: распознавание дискурсивной структуры текста и примененных в нем дискурсивных операций (т.е. поверхностное понимание) – на основе частичного синтаксического анализа и лексикона общенаучных слов и выражений

Лексико-синтаксические шаблоны содержат конкретные словоформы общенаучных слов свободные места (слоты), заполняемые согласованными именными группами Пример шаблона определения нового термина NG ACC [«мы»] «будем называть» T INS NG ACC – определяющее выражение T INS – определяемый термин

Методика создания шаблонов Основная проблема – определение контекстов, сигнализирующих дискурсивный характер слов. Проведено исследование контекстов конструкций, определяющих новые термины. «По результатам генерации форм, слова были разбиты на группы, названные профилями», Но - «...устойчивого выражения, названного в заголовке…». Фразы – Лексемы – Контексты – Синтаксические конструкции – Шаблон

Составные элементы шаблонов Литералы, т.е. конкретные лексемы из словаря («определим», «будем называть» и др.) Символьные обозначения слов определенной части речи (например, V – глагол) Обозначения определенных грамматических конструкций (например, Ng – именная группа) Условия, уточняющие грамматические характеристики рассмотренных элементов (например: )

Основные шаги процедуры анализа текста 1)Выделение слов и словосочетаний общенаучной лексики. 2)Наложение лексико-синтаксических шаблонов, извлечение именных групп (например, определений терминов) Без полного синтаксического разбора; проверка согласования и управления слов

Заключение Разрабатываемые средства нужны для: извлечения знаний из научных текстов реферирования и аннотирования текстов литературно-научного редактирования структуризации текстов для быстрого прочтения и внутритекстового поиска. Спасибо за внимание!