Компьютерный анализ естественно-языкового текста Кафедра информационных систем в искусстве и гуманитарных науках
Компьютерный анализ естественно-языкового текста СТРУКТУРА КУРСА 1.Введение в дисциплину 2.Автоматический анализ текста на морфологическом уровне 3.Автоматический анализ текста на синтаксическом уровне 4.Семантический компонент в системах автоматического анализа текста
Компьютерный анализ естественно-языкового текста СТРУКТУРА КУРСА 2. Автоматический анализ текста на морфологическом уровне 1.Морфологически й уровень в ЛИТ 2.Основные понятия морфологии в компьютерной морфологии 3.Основные процедуры компьютерной морфологии 4.Компьютерная морфология русского языка 5.Технологии морфологического анализа 6.«Предсказание» (типизация) 7.Вопросы, смежные с синтаксисом
СВОДКА ОСНОВНЫХ ОПЕРАЦИЙ НАД РЕГУЛЯРНЫМИ ВЫРАЖЕНИЯМИ 1)операции только над языками 2)операция над языками, превращающая их в отношения 3)операции над языками и отношениями 4)операция над отношениями (с оговоркой – над языками) 5)операции только над отношениями
ОПЕРАЦИИ ТОЛЬКО НАД ЯЗЫКАМИ отрицание (~) термовое отрицание (\)
ОПЕРАЦИЯ НАД ЯЗЫКАМИ, ПРЕВРАЩАЮЩАЯ ИХ В ОТНОШЕНИЯ произведение (: или.x.)
ОПЕРАЦИИ НАД ЯЗЫКАМИ И ОТНОШЕНИЯМИ конкатенация (запись через пробел или заключение в фигурные скобки без пробела) итерация (* и +) факультативность (заключение в круглые скобки) объединение (|) пересечение (&) инверсия (англ. reverse; знак.r)
ОПЕРАЦИЯ НАД ОТНОШЕНИЯМИ композиция (.o.) Композиция A.o.B двух отношений A, B включает такие и только такие пары цепочек k:m, для которых верно, что отношение A включает пару цепочек k:l и отношение B включает пару цепочек l:m Принципиально возможно применять композицию к двум языкам, но результат будет такой же, как и при пересечении языков.
ОПЕРАЦИЯ ТОЛЬКО НАД ОТНОШЕНИЯМИ обращение (англ. inverse; знак.i)
ПРАВИЛА ПРИОРИТЕТНОСТИ ОПЕРАТОРОВ : ~ \ + *.i.r {конкатенация} | &.x..o.
ПРАКТИЧЕСКОЕ ЗАДАНИЕ Записать на языке LEXC лексикон с данными для морфологического анализа и синтеза форм 15 русских существительных. Откомпилировать его с помощью xfst и продемонстрировать работоспособность То же – для 15 английских существительных с теми же (условно) значениями Записать на языке LEXC данные (лексикон) для межъязыковых преобразований лексических и грамматических значений из двух этих лексиконов Откомпилировать три лексикона в нужном порядке и применить композицию так, чтобы можно было переводить эти существительные с одного языка на другой.
ОСНОВНЫЕ КОМАНДЫ XFST read lexccompose net (или compose) apply up (или up)concatenate net (или concatenate) apply down (или down)intersect net (или intersect) print words (или words)invert net (или invert) print upper-words (или upper-words) negate net (или negate) print lower-words (или lower-words) reverse net (или reverse) print netunion net (или union) clear stack (или clear)quit