Разработка средств автоматического синтаксического анализа как модуля системы понимания текста Лахути Д.Г., Баталина А.М., Епифанов М.Е., Кобзарева Т.Ю.

Презентация:



Advertisements
Похожие презентации
Автоматизация отладки алгоритмов поверхностно синтаксического анализа Баталина А.М., Айриян Г.Ю., Епифанов М.Е., Кобзарева Т.Ю., Лахути Д.Г. моделирование.
Advertisements

9 класс Урок 4 Матвеева В.П.. Постановка задачи Построение алгоритма Составление программы на языке программирования О т л а д к а и тестирование программы.
Языки и методы программирования Преподаватель – доцент каф. ИТиМПИ Кузнецова Е.М. Лекция 7.
Этапы моделирования. Постановка задачи: Описание задачи; Цель моделирования; Анализ объекта Разработка информационной модели Разработка компьютерной модели.
Системы программирования Средства создания программ Интегрированные системы программированияИнтегрированные системы программирования Среды быстрого проектирования.
ГОРОДСКОЙ МЕТОДИЧЕСКИЙ ЦЕНТР mosmetod.ru Примерная программа учебного предмета «Информатика»
Для учащихся школы 19.
Этапы решения задач на компьютерах Постановка задачи Формальное построение модели задачи Формальное построение модели задачи Построение математической.
Алгоритмизация и программирование. Языки программирования высокого уровня. Технологии программирования Алгоритмизация и программирование. Языки программирования.
ПРОГРАММНАЯ СИСТЕМА ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ТЕКСТОВ (ПС INEX) Исследовательский центр искусственного интеллекта Института программных систем РАН г. Переславль-Залесский.
Этапы решения задач на компьютере 1. Постановка задачи. 2. Построение математической модели. 3. Составление алгоритма. 4. Запись алгоритма на языке программирования(кодирование)
Глава 1. Язык реализации: TSG. Супер- компиляция scp Специализация программ Приложения суперкомпиляции, в том числе Базовые понятия и методы метавычислений.
М.Ю. Харламов, ВНУ им. В.Даля, Семантический анализатор Семантический анализатор выполняет следующие основные действия: проверку соблюдения во входной.
ЕГЭ по русскому языку в 2015 году в новом формате Часть 1: особенности структуры специфика подготовки.
ВЫПОЛНЕНИЕ АЛГОРИТМОВ КОМПЬЮТЕРОМ. Алгоритм, записанный на «понятном» компьютеру языке программирования, называется программой. Программа данные, предназначенные.
Лекция 5 Способы конструирования программ. Основы доказательства правильности.
Что такое программирование? Совокупность процессов, связанных с разработкой программ и их реализацией. В широком смысле к указанным процессам относят все.
Технология подготовки и решения задач с помощью компьютера Этапы решения задач с помощью компьютера.
Интеллектуный редактор Инфологических схем баз данных.
Выполнила студентка 5 курса группы МДМ-111 Казанчева А.
Транксрипт:

Разработка средств автоматического синтаксического анализа как модуля системы понимания текста Лахути Д.Г., Баталина А.М., Епифанов М.Е., Кобзарева Т.Ю. (РГГУ) 26 марта 2009 г.

Что значит для нас понять следующее предложение: Императрикс Елисавета, о ! приехала в Царское Село.

морфологический анализ графематический анализ синтаксиче- ский анализ семантиче- ский анализ синтаксический анализ семантический анализ

Пример синтаксической неоднозначности: В этом музее были выставлены чучела динозавров, которые все погибли от бомбёжки.

Объектная модель алгоритма в инструментальной среде

Объектная модель анализируемого предложения лексические единицы и их свойства в формате (имя_свойства значение_свойства) граф синтаксических связей в формате (имя_синтаксического_хозяина имя_синтаксического_слуги тип_связи).

Выбор средств реализации среды для экспериментов с алгоритмами ПСА реализация выполнена на языке Common Lisp с использованием встроенной в него библиотеки CLOS (Common Lisp Object System) в инструментальной среде разработки Corman Common Lisp ® версии 2.5 в Лиспе имеется возможность в процессе выполнения функций вычислять выражения, записанные в его же синтаксисе - можно строить код новых Лисп- функций во время работы программы и, при желании, вычислять их при каких- либо значениях аргументов Лисп – интерпретируемый язык, в рассматриваемой среде алгоритмы рассматриваются как данные по отношению к интерпретатору для записи алгоритмов используется своеобразный предметно ориентированный языковой «конструктор» (при составлении описания алгоритма мы или манипулируем – добавляем, переставляем, удаляем – готовыми «кирпичиками» - объектами, представляющими правила, или только меняем содержание правил), что обеспечивает легкость модификации

Инструментальная среда и окружающие ее приложения

Входные языки для инструментальной среды входной предметно ориентированный лиспообразный язык для описания алгоритма (для трансляции в объектную модель инструментальной среды) языки в синтаксисе xml (служат посредниками между инструментальной средой и внешними программами для просмотра результатов) графический (используется в графическом редакторе структуры объектов, ориентированном на объектную модель инструментальной среды)

Схема работы в инструментальной среде

Функциональность инструментальной среды для экспериментов с алгоритмами поверхностно-синтаксического анализа установка прерывания пошаговое выполнение алгоритмов просмотр на каждом шаге значений переменных, содержания узла и связанного с узлом правила, текущего состояния представления анализируемого предложения вычисление пробных вариантов правил и используемых в них форм протоколирование выполнения алгоритма механизм пакетного тестирования – возможность автоматически применять составленные ранее тесты к объекту-результату вычисления алгоритма на некотором примере поддержка т.н. проектов тестирования – файлов, в которых в соответствующем формате записана информация о соответствии тестовых примеров алгоритмам, о различных версиях алгоритма и т.п.

Промоделированы и в основном отлажены/находятся в стадии отладки Блоки предсинтаксиса и предсегментации модули предсинтаксиса: стандартные универсальные подпрограммы проверки согласования, алгоритмы постморфологии, корректирующие и дополняющие результаты морфологического анализа, наиболее актуальные алгоритмы снятия омонимии частей речи, часть алгоритмов модуля предсегментации: построение атрибутивных именных групп и предложных групп, построение конструкций с именами собственными, с числами, построение сложных сказуемых, построение синтагм со слугами – обособленными приложениями.

Промоделированы и в основном отлажены/находятся в стадии отладки Блок сегментации экспресс-версия сегментационного анализа (не предполагается возможности любых разрывающих вложений так называемых a- сегментов – придаточных предложений, обособленных согласованных определений, деепричастных, предложных, вводных и сравнительных оборотов – в a-сегменты). полная версия сегментационного анализа (рассчитан на сегментацию любых грамматически правильных неэллиптичных предложений литературного письменного языка, не являющихся записью или имитацией устной речи). Блок внутрисегментного анализа поиск сказуемого и подлежащего, заполнение словарно заданных валентностей, поиск хозяина предложной группы, поиск хозяев слабоуправляемых именных групп в родительном падеже и наречий.