11 Вечур А. В.Суяргулова Е. Б. Введение Предметная область Суть Выводы Титульный слайдЦель работы Модернизация расчета центроидов в алгоритме CMU
22 Цель работы Разработать и проверить целесообразность разработанной методики учета фазы освещенности события новостью при расчете центроидов кластеров новостей. Введение Предметная область Суть Выводы Титульный слайдЦель работы
3 Выделение новостей посвященных одному событию (алгоритм CMU) - создание образа первой web-новости с использованием метрики TFIDF; - задание первой web-новости в качестве центроида кластера web- новостей посвященных событию (центроид кластера, вычисляется при каждом включении в него новой новости); - На основании косинусов углов между образом новости и центроидами имеющихся кластеров web-новость отмечается как посвященная одному или нескольким событиям; - если, после предыдущего шага не было найдено событие, освещаемое web-новостью, то ее отмечают как посвященную новому событию. Введение Предметная область Суть Выводы Базовый алгоритм Модель события Модель связанных событий
44 Поток новостей посвященных одному событию Введение Предметная область Суть Выводы Новости свидетельствую- щие о том что событие ожидается Новости оповещающие о том что событие произошло Новости обсуждающие произошедшее событие Базовый алгоритм Модель события Модель связанных событий
5 Потоки новостей посвященных взаимосвязанным событиям Введение Предметная область Суть Выводы Новости посвященные событию-причине Новости посвященные событию-следствию Базовый алгоритм Модель события Модель связанных событий
6 Проблема определения центроида кластера новостей посвященных одному событию 6 Введение Предметная область Суть Выводы Кластер 1 Новости из кластера 1 Кластер 2 Проблема Желаемый результат Методы решения
7 Желаемый результат определения центроидов 7 Введение Предметная область Суть Выводы Проблема Желаемый результат Методы решения Кластер 3 Кластер 1 Кластер 2 Новости из кластера 1
88 Выявление не характерных новостей Не характерная новость – это новость содержащая информацию относящуюся к нескольким событиям. Учитывая модель потоков новостей посвященных взаимосвязанным событиям, можно заключить что новость содержащая глаголы в разных временных формах относится к нескольким событиям и не характерна для любого из них. Введение Предметная область Суть Выводы Проблема Желаемый результат Методы решения
9 Создание новостных сюжетов если два события освещались одной новостью, то они взаимосвязаны, и должны быть включены в один сюжет; события освещаемые похожими новостями подобны, и так же должны быть отнесены к одному сюжету. 9 Введение Предметная область Суть Выводы Постановка задачи Методы решения
10 Результаты тестирования системы Введение Предметная область Суть Выводы Эксперимент Выводы Последний слайд Тип кластеров создаваемых системой ТочностьПолнота Событие Сюжет Надсюжет
11 Выводы Выделение новостей описывающих не одно событие возможно и может привести к улучшению работы таких алгоритмов кластеризации новостного потока как CMU Для улучшения работы системы нужно доработать предобработку текста. Алгоритм выделения сюжетов требует пересмотра. Введение Предметная область Суть Выводы Эксперимент Выводы Последний слайд
12 Конец доклада Если у вас есть вопросы – значит в докладе есть смысл… Ваши вопросы? Введение Предметная область Суть Выводы Эксперимент Выводы Последний слайд