Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 10 лет назад пользователемВячеслав Шулепов
1 Cергей Ливерко Даниил Скатов Владимир Окатьев Гибридный синтаксический анализ Прикладная лингвистика и искусственный интеллект 2013
2 ООО «Диктум», / 20 Синтаксический анализ Синтаксический анализ – процесс сопоставления линейной последовательности лексем языка с его формальной грамматикой Результат анализа – дерево синтаксического разбора 2 основных типа грамматик: Грамматика зависимостей Грамматика составляющих
3 ООО «Диктум», / 20 Грамматика зависимостей Вершинами дерева разбора являются слова, рёбрами – подчинительные связи Связи между словами устанавливаются по правилам грамматики Корневой вершиной считается сказуемое (при его наличии) Предлог управляет существительным Анализ производится по алгоритму Эйснера: 1. Строятся все возможные связи с назначенными им весами 2. Из полученного графа извлекается дерево минимального веса, включающее как можно больше вершин
4 ООО «Диктум», / 20 Грамматика зависимостей Пример: Я поеду домой на машине
5 ООО «Диктум», / 20 Грамматика зависимостей Пример: Я поеду домой на машине
6 ООО «Диктум», / 20 Грамматика зависимостей Преимущества: Приспособлена для языков со свободным порядком слов Дерево зависимостей удобно для семантической интерпретации Недостатки: Необходимо заранее расставить все потенциальные связи между словами – появляется много шума Трудности с учётом пунктуации и ролей запятых – необходимо заранее знать синтаксическую структуру предложения! Трудности с представлением рядов из однородных членов
7 ООО «Диктум», / 20 Грамматика составляющих Вершинами дерева разбора являются составляющие – группы из нескольких подряд идущих слов, связанных между собою синтаксически Составляющая суть есть словосочетание Каждая составляющая состоит из нескольких (в большинстве работ – из 2) составляющих меньшего размера, определяемых правилами грамматики Корневой вершиной считается составляющая, соответствующая всему предложению Листьями дерева являются слова (элементарные составляющие) Анализ производится по алгоритму свёртки, Кока- Янгера-Касами и подобным
8 ООО «Диктум», / 20 Грамматика составляющих Пример: Я поеду домой на машине
9 ООО «Диктум», / 20 Грамматика составляющих Пример: Я поеду домой на машине
10 ООО «Диктум», / 20 Грамматика составляющих Преимущества: Порождаются только грамматически верные разборы Корректный учёт пунктуации и определение ролей запятых Корректная сборка рядов из однородных членов Недостатки: Многозначность порядка сборки составляющих порождает множество разборов, разных по структуре дерева, но одинаковых по существу В грамматике зависимостей всем им соответствует одно и то же дерево!
11 ООО «Диктум», / 20 Неоднозначность разбора Пример: Красивая спинка стула
12 ООО «Диктум», / 20 Гибридный подход Суммируются преимущества двух подходов и устраняются многие недостатки
13 ООО «Диктум», / 20 Гибридный подход Суммируются преимущества двух подходов и устраняются многие недостатки Алгоритм { }
14 ООО «Диктум», / 20 Гибридный подход Суммируются преимущества двух подходов и устраняются многие недостатки Алгоритм { }
15 ООО «Диктум», / 20 Гибридный подход Более точное ранжирование вариантов составляющих за счёт взвешивания деревьев зависимостей Сокращение перебора за счёт отождествления одинаковых вариантов разбора Устраняются недостатки представления результатов каждого из подходов
16 ООО «Диктум», / 20 Пример простого правила // Хороший телефон AgreeNounFullAdjCF { T: [ComFullAdj] [ComNoun] C: NumberGenderAgree (LI1, LI2) && (LI1. Case == LI2.Case) && CaseAnimAgree (LI1, LI2); Main: 2 L: 2=>Agreement=>1; }
17 ООО «Диктум», / 20 Пример правила для ряда // Яблоко и груша CoordNounConj { T: [ComNoun] [CoordConj] [ComNoun] C: LI1. Case == LI3.Case; Main: 1 L: 1=>Coord=>3; A: LI.Number = NUMBER_PL; PH.IsCoord = true; }
18 ООО «Диктум», / 20 Пример правила для обособления // Он шёл по улице, думая о работе IsolAdvPartPost { T: [ComVerb] [AdvPart] ( {,} | {.} | {?} | {!} | ) C: LI1. VerbForm != VERB_FORM_ADV_PART; Main: 1 L: 1=>Contiguity=>2; J: 1
19 ООО «Диктум», / 20 Пример правила для непроективности // Дорогу должен уступить ControlNonProjectLeft { T: [ComNoun] [Pred] [Inf] C: PredicModel (LI2, LI3) && IsFreeValence (PH2, LI3) && PredicModel (LI3, LI1) && IsFreeValence (PH3, LI1); Main: 2 L: 2=>Control=>3; 3=>Control=>1; A: FillValence (PH, LI3); }
20 ООО «Диктум», / 20 Сложность алгоритма
21 ООО «Диктум», / 20 Спасибо за внимание! ООО «Диктум» г. Нижний Новгород
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.