1 Метод синтаксического разбора с использованием определяемыъ обучающим набором ядер, построенных на основе вероятностных моделей Иван Титов Джеймс Хендерсон
2 Например SVM: Осуществляется отображение в многомерное пространство признаков, где производится линейная классификация, максимизирующая зазор. Методы, использующие ядра
3 Синтаксический анализ: построение отображения из пространства предложений в пространство деревьев разбора (структурных меток). Линейная дискриминантная функция : Синтаксический анализ – структурная классификация
4 Как строить ядро (задавать отображение)? На основе экспертных знаний: LTAG Tree Kernel (Shen et al, 2003) Tree Kernel (Collins and Duffy, 2001) Эксперт определяет пространство для отображения На основе вероятностных моделей 1.Формулируется вероятностная модель; 2. Обучается на аннотированном наборе (определяются параметры модели); 3. Ядро определяется на основе обученной вероятностной модели (Jaakkola and Haussler, 1998), (Tsuda et al 2001)
5 Проблема: Известные ядра, конструируимые на основе вероятностных моделей не применимы для задачи структурной классификации (синтаксического анализа) Решение: Предложения нового ядра, построенного для минимизации ошибки оптимального линейного классификатора:
6 Экспериментальные результаты Подход применен к вероятностной модели синтаксического анализа на основе нейронной сети (Henderson, 2003) для стандартной задачи парсинга корпуса PennTreeBank Wall Street Journal Статистически значимое улучшение по отношению к исходной вероятностной модели; Результаты на уровне лучших парсеров для данной задачи (F1 89.6%)