26 мая 2008 г. Механизмы обеспечения связности в системах динамической генерации текстов 1 Дипломная работа Механизмы обеспечения связности в системах динамической генерации текстов Автор: Лукьяненко Анастасия Юрьевна Научный руководитель: к.ф.-м.н. Бордаченкова Елена Анатольевна
26 мая 2008 г. Механизмы обеспечения связности в системах динамической генерации текстов 2 Общение человека с компьютером на естественном языке Задача распознавания текстов на естественном языке Морфологический анализ Синтаксический анализ Семантический анализ ЕЯ Человек Компьютер Задача синтеза текстов на естественном языке Статическая генерация текстов Динамическая генерация текстов Связность – важный критерий качества синтезируемых текстов
26 мая 2008 г. Механизмы обеспечения связности в системах динамической генерации текстов 3 Постановка задачи 1. Изучить лингвистические средства достижения связности в текстах, производимых человеком в условиях динамичной среды 2. Проанализировать существующие системы динамической генерации текстов С точки зрения применяемых в них алгоритмов генерации С точки зрения связности производимых ими текстов 3. Выбрать лингвистические механизмы обеспечения связности, применимые при динамической генерации, но пока не реализованные 4. Создать экспериментальное программного обеспечения для динамического синтеза текстов Предметная область - Биатлон Реализовать некоторые выбранные недостающие механизмы обеспечения связности
26 мая 2008 г. Механизмы обеспечения связности в системах динамической генерации текстов 4 Связность текста с точки зрения лингвистики 1.Смысловая связность Регулярное повторение ключевых слов 2.Коммуникативная связность Организация тема-рематических потоков 3.Структурная связность Грамматические средства связи Композиционно-структурные средства связи Ритмикообразующие средства связи Стилистические средства связи
26 мая 2008 г. Механизмы обеспечения связности в системах динамической генерации текстов 5 Генерация текстов Статическая генерация Динамическая генерация СДГТ поток событий текст запрос пользователя знания ПО СГТ Дискурсивные стратегии Риторические предикаты + предикатные схемы Фокус внимания Шаблоны текст анализ и выбор событий наложение дискурсивной схемы на знания
26 мая 2008 г. Механизмы обеспечения связности в системах динамической генерации текстов 6 Сравнение естественных и машинных текстов Человек 1.Референция Непосредственный повтор Местоимённая замена Синонимическая замена Эллиптический повтор 2.Связность Анафора, близкие связи и дальние Катафора, близкие связи и дальние Соединительные слова Сложные предложения и обороты Указание временных параметров Разнообразие форм глаголов 3.Эмоциональность Повторы Восклицания и вопросы Обращения СДГТ 1.Референция Непосредственный повтор Эллиптический повтор 2.Связность Анафора, близкие связи Катафора, близкие связи Соединительные слова Сложные предложения Указание временных параметров Разнообразие форм глаголов 3.Эмоциональность Повторы Восклицания Обращения
26 мая 2008 г. Механизмы обеспечения связности в системах динамической генерации текстов 7 Экспериментальное программное обеспечение, синтезирующее текст генератор событий в рамках предметной области биатлон генератор связного текста реализация новых лингвистических механизмов ТЕКСТТЕКСТ данные об участниках и погоде поток событий
26 мая 2008 г. Механизмы обеспечения связности в системах динамической генерации текстов 8 Генератор индивидуальной гонки по биатлону данные о силе ветра данные о скоростях и меткости биатлонистов T = XX ч XX мин XX с Анализ и классификация событий реальных соревнований по биатлону «срез» событий, происходящих с каждым участником в момент времени T Время = 0 ч 4 м 38 с Идут вровень ( 3 и 5 ). Время = 0 ч 4 м 39 с Обгон ( 5 обогнал 3 ). … Время = 0 ч 7 м 8 с Участник 1 занимает огневую позицию. Участник 5 приближается к стрельбищу 1. Время = 0 ч 7 м 9 с Участник 1 кидает палки. биатлонисты
26 мая 2008 г. Механизмы обеспечения связности в системах динамической генерации текстов 9 Генератор динамического связного комментария блок обработки событий блок синтеза комментария лингвистическая функция 2 лингвистическая функция 1 упорядоченный во времени поток событий Реализация двух лингвистических механизмов Использование слов-связок в начале предложения Использование глаголов прошедшего времени комментарийкомментарий
26 мая 2008 г. Механизмы обеспечения связности в системах динамической генерации текстов 10 Пример работы автоматического комментатора Вульф быстрым движением разбирается с предохранителем. Важный момент, прицеливается перед выстрелом Вульф. Стреляет. Меткий выстрел! Вульф прицеливается. Выстреливает по мишени. А теперь промахивается. Прицеливается. Бьёт по мишени Вульф. Прямо в яблочко! … Вульф выстреливает по мишени. Но на этот раз мимо! … Стреляет. Да, снова выстрел не попал в цель. Закончил стрельбу Вульф. Одевает ружьё. Надевает перчатки. Хватает палки. Вульф получает 3 штрафные минуты, стабильный результат, на прошлом рубеже был такой же.
26 мая 2008 г. Механизмы обеспечения связности в системах динамической генерации текстов 11 Основные результаты В рамках данной работы были получены следующие результаты: 1.Изучены тексты на естественном языке, человеческие и машинные, с точки зрения используемых в них механизмов достижения связности 2.Выявлены те лингвистические механизмы, реализация которых возможна в рамках систем динамической генерации текстов 3.Создано экспериментальное программное обеспечение, динамически генерирующее тексты, включающее реализацию следующих лингвистических механизмов Использование соединительных слов в начале предложений Использование разнообразных форм глаголов-сказуемых
26 мая 2008 г. Механизмы обеспечения связности в системах динамической генерации текстов 12 Спасибо за внимание!