Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемСтепан Якушкин
1 МЕТОД СКОЛЬЗЯЩЕГО КОНТРОЛЯ ДЛЯ ОЦЕНКИ КАЧЕСТВА РЕКОМЕНДАТЕЛЬНЫХ ИНТЕРНЕТ- СЕРВИСОВ А.Ю. Каминская, Р.А. Магизов Научный руководитель – Д.И. Игнатов Государственный университет – Высшая школа экономики, Москва, Россия 2010
2 Содержание Постановка задачи Мотивация Примеры моделей рекомендательных систем – User-based RS – Item-based RS Выбор меры (метрики) сходства Методика сравнения Данные MovieLens и Yahoo Результаты Выводы и дальнейшая работа
3 Постановка задачи Зная предпочтения конкретного пользователя и остальных, выдать ему релевантную рекомендацию Оценка (проверка) качества рекомендаций
4 Мотивация Существует огромное количество РС Требуются эффективные алгоритмы – Время выполнения – Качество рекомендаций Количество ошибок и полнота рекомендаций
5 User-based RS целевой пользователь - предметы, которые он оценивал - сходство с пользователем - top-n ближайших к нему соседей, n определяет - пользователи из, которые оценили предмет i - оценка предмета i пользователем u предсказанная системой оценка для целевого пользователя:
6 Item-based RS целевой пользователь - предметы, которые он оценивал - сходство товара i с товаром j - top-n ближайших к нему товаров, top-n определяет - для - оценка предмета i пользователем u предсказанная системой оценка для целевого пользователя:
7 Пример User-based RS Пользователь Сходство «Мастер и Маргарита» ВО «Мастер и Маргарита» «Преступление и наказание» ВО Преступление и наказание» Рей Бредбери. Рассказы. ВО Рей Бредбери. Рассказы. Е. Гришковец. «Планета» ВО «Планета» V.M SKY ×0.5= OLA ×0.5= GRY ×0.94= IDI ×0.87=2.61.5
8 Выбор меры (метрики) сходства Сходство, основанное на расстоянии: – Евклида – Хемминга Корреляция как сходство: – коэффициент Пирсона Косинусная мера Коэффициент Жаккара
9 Корреляция Пирсона Недостатки – не определена на векторах с постоянными значениями: (4,4,4,...,4) – теряются рекомендации a=(0,5,5,4) b=(0,4,5,0)
10 Методика сравнения Метрики качества: точность и полнота рекомендаций Скользящий контроль (кросс-валидация)
11 Точность и полнота Полнота – число релевантных рекомендаций к числу всех выбранных пользователем товаров Точность – число релевантных к числу всех рекомендаций
12 Скользящий контроль Разбиение на тестовую и обучающую выборки: Сокрытие признаков для тестирования рекомендаций: Вычисление точности и полноты для на признаках :
13 Точность и полнота: раскрытие неопределенностей else
14 Алгоритм Параметры: – test% - размер тестового множества – hidden% - размер скрытого множества признаков – p – число повторений разбиения на тестовое и обучающее множество – q – число повторений разбиения на оцененное и неоцененное множества признаков Выход:средние значения точности и полноты по множеству U test и I hidden
15 Данные MovieLens и Yahoo MovieLens 100K dataset: – 943 пользователя – 1,682 фильма – Каждый оценил как минимум 20 фильмов, всего 100,000 оценок Yahoo binary dataset: – 2,000 фирм – 3,000 рекламных словосочетаний – 92,345 ненулевых ячеек
16 Результаты
23 Выводы и дальнейшая работа Предложенная методика позволяет оценить качество работы рекомендательной системы вне зависимости от выбора метода По-видимому, впервые в экспериментах исследуется точность и полнота в зависимости от количества скрытых признаков Для сравнения методов необходимо проведение аналогичных экспериментов для более совершенных моделей РС, например, основанных на бикластеризации
24 Спасибо за внимание!
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.