Эксперимент по автоматической оценке качества обзорного реферирования по метрике ROUGE-RUS © С.Д. Тарасов.

Презентация:



Advertisements
Похожие презентации
Какое число пропущено? Тест по математике в 5 классе по теме: «Нумерация в пределах 1000» МКС(К)ОУ «Краснинская школа интернат VIII вида», Ленинск – Кузнецкий.
Advertisements

СТРАН А К А Т А А М Е М И Т. Закрепление по теме «Приёмы устных вычислений в пределах 1000»
Жил – был веселый карандаш. Стало ему скучно жить и решил он освоить компьютер, чтобы создавать рисунки с помощью программы Qbasic.
Информатика ЕГЭ Уровень А1.
Изучение характеристик сообществ русскоязычной блогосферы А.В. Сычев, И.А.Гадебский
O 5 дм = … см 54 см = … дм … см O 8 м = … дм 39 дм = … м … дм O 4 см = … мм 48 мм = … см … мм.
Применение генетических алгоритмов для генерации числовых последовательностей, описывающих движение, на примере шага вперед человекоподобного робота Ю.К.
Маршрутный лист «Числа до 100» ? ? ?
Приёмы устных вычислений. Вычитать и складывать Мы будем числа круглые И Знайка – математик Нам будет помогать. Научит он нас правилу, Чтоб легче было.
Результаты уч. года. ПО СТУПЕНЯМ ОБУЧЕНИЯ ст. Уровень обученно сти, % 97,396,597,599,098,197,196,697,6100 Качество.
Автор : Е. Н. Карлина – учитель информатики, I категории Урок на тему « Диаграммы в Excel» МБОУ Меляевская СОШ Кулебакского района, Нижегородской области.
График линейной функции с модулями и его практическое применение.

Урок повторения по теме: «Сила». Задание 1 Задание 2.
1 06/06 r Всего38,6 миллиона [33,4 – 46,0 миллиона] Взрослое население36,3 миллиона [31,4 – 43,4 миллиона] Женщины17,3 миллиона [14,8 – 20,6 миллиона]
Всего заданий Время тестированиями. Введите фамилию и имя Тест Алгоритмы и программирование на языке Pascal.
1 Знаток математики Тренажер Таблица умножения 2 класс Школа 21 века ®м®м.
Перед вами тест, который поможет вам подготовиться к контрольной работе по теме «Отношения. Пропорции. Проценты»
1. Определить последовательность проезда перекрестка
ТУЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МЕДИЦИНСКИЙ ИНСТИТУТ Хромушин В.А., д.б.н., к.т.н., академик МАИ и АМТН 2010 г. ГРАФИЧЕСКОЕ ОТОБРАЖЕНИЕ РЕЗУЛЬТИРУЮЩИХ.
Транксрипт:

Эксперимент по автоматической оценке качества обзорного реферирования по метрике ROUGE-RUS © С.Д. Тарасов

Оценка качества обзорного реферирования Ручная –связность –краткость (лаконичность) –грамматическая правильность –сложность восприятия –содержание Автоматическая Автоматизированная

ROUGE Recall-Oriented Understudy for Gisting Evaluaion

ROUGE Простота использования Высокая скорость Дешевизна Возможность производить оценки в автоматическом режиме Высокая корреляция с ручными оценками

ROUGE Автоматическая оценка качества обзорного реферирования Сравнительная оценка различных методов обзорного реферирования Исследование и оптимизация отдельно взятого метода

ROUGE-RUS Русская морфология, список стоп-слов для русского языка Возможность учитывать синонимы (с использованием концептов тезауруса) Усреднение (а не максимум) значения при наличии нескольких ручных аннотаций

ROUGE-RUS Общий вид системы по оценке метрики ROUGE-RUS

ROUGE-RUS Результаты вычисления величины ROUGE-RUS

Эксперимент Исходные данные Google.News ноябрь-декабрь кластеров («Россия», «Культура», «Происшествия», «Спорт» и др.) 21 источник («РБК», «РИА Новости», «Российская Газета» и т.д.) 613 документов

Эксперимент Построение аннотаций 67 человек (студенты 5 курса БГТУ «Военмех» по специальности АСУ) 2385 ручных аннотаций Каждая аннотация: 4 предложения Отобрано: N=50, M > 40

Распределение ROUGE-RUS Распределение величины ROUGE-1 при сравнении одной ручной аннотации со всеми остальными для произвольного кластера. Значения отсортированы по убыванию

ROUGE-RUS Ручные рефераты, порожденные разными пользователями, слабо согласуются друг с другом Использование одного ручного реферата для оценки недостаточно В ручных рефератах, порожденных разными пользователями, практически отсутствует кластеризация Использование морфологии, списка стоп- слов и словаря синонимов положительно сказывается на пологости кривой

ROUGE-RUS Зависимость дисперсии величины ROUGE-RUS по всем кластерам от K (количества ручных аннотаций)

ROUGE-RUS К δ Метод Максимума, %δ Метод усреднения, % ROUGE-1ROUGE-2ROUGE-3ROUGE-4ROUGE-LROUGE-1ROUGE-2ROUGE-3ROUGE-4ROUGE-L

Исследование и оптимизация параметров алгоритма обзорного реферирования на основе метрики ROUGE-RUS Алгоритм Manifold Ranking Базовое значение величины ROUGE- RUS на кластере (среднее и максимум)

Результат работы базового алгоритма Manifold Ranking Красным выделено среднее значение ROUGE-1 Зеленым выделено максимальное значение метрики ROUGE-1 на кластере Желтым выделено среднее значение метрики ROUGE-1 на кластере Голубым цветом показаны величины ROUGE-1 сравнения автоматической аннотации, порожденной алгоритмом, с каждой из 10 ручных

Сравнение с Basic Lines BL1 – 4 первых предложения 1-го документа BL2 – первые предложения 4-х первых документов BL3 – последние предложения 4-х первых документов BL4 – заголовки 4-х первых документов BL5 – 4 первых предложения последнего документа BL6 – последние предложения 4-х первых документов BL7 – последние предложения 4-х последних документов BL8 – заголовки 4-х последних документов

Подбор базовых параметров ПараметрDUCРеализация α0,60,9 λ10,3 λ210,8 ω810 «Игнорировать темы»-Да Мин. кол-во слов в предложении-3 Мин. дистанция до анафоры-4

Подбор базовых параметров

Ограничение длины документов

Влияние выбора темы

Выбор темы Не удалось выявить зависимость от Дата публикации Кол-во слов в предложении Кол-во существительных в предложении Модифицированный алгоритм Использование нескольких тем

Модифицированный алгоритм Заголовки всех документов Заголовки из первых двух документов Заголовки из первых четырех документов Заголовки из последних двух документов Заголовки из последних четырех документов

Результаты Выбор темы ROUGE-1ROUGE-2ROUGE-L Заголовок одного документа Заголовки всех документов Заголовки из первых двух документов Заголовки из первых четырех документов Заголовки из последних двух документов Заголовки из последних четырех документов

Результаты ROUGE-1ROUGE-2ROUGE-L Базовое значение метрики (среднее) Базовое значение метрики (максимум) Базовый алгоритм MR BL BL BL BL BL BL BL BL Модифицированный алгоритм

Заключение Метрика ROUGE-RUS Эксперимент Исследование метрики ROUGE-RUS Оптимизация параметров алгоритма Manifold Ranking Модифицированный алгоритм