МЕТОД СКОЛЬЗЯЩЕГО КОНТРОЛЯ ДЛЯ ОЦЕНКИ КАЧЕСТВА РЕКОМЕНДАТЕЛЬНЫХ ИНТЕРНЕТ- СЕРВИСОВ А.Ю. Каминская, Р.А. Магизов Научный руководитель – Д.И. Игнатов Государственный.

Презентация:



Advertisements
Похожие презентации
Прогнозирование финансовых рынков с использованием нейронных сетей Выполнила: Кокшарова А.А. ПНИПУ, ФПММ гр. ММЭм-12 Руководитель: к. ф.-м.н. Шумкова Д.Б.
Advertisements

ФАКУЛЬТЕТ ПРИКЛАДНОЙ МАТЕМАТИКИ и ИНФОРМАТИКИ Тарасюк Александр Евгеньевич СИСТЕМА РАСПОЗНАВАНИЯ ЛИЦ НА ОСНОВЕ НЕЙРОННОЙ СЕТИ.
Постановка задачи двуклассового распознавания 1.Описание объекта. Пространство признаков. 2.Обучающее множество. Truth информация. 3.Решающее правило.
«Задача верификации лица на основе 3D модели» Студент 445 группы Петров Николай Научный руководитель: к.ф.-м.н. Вахитов А.Т.
Национальный исследовательский университет « МЭИ » Кафедра прикладной математики Выпускная работа студента гр. А Бочарова Ивана на тему : « Исследование.
Гречанинова Наталья 11 гр. Научный руководитель: Энгель Е.А.
ОЦЕНКА ЭФФЕКТИВНОСТИ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ С.А.Амелькин Институт программных систем имени А.К.Айламазяна РАН.
Свойства Коэффициентов Множественной Регрессии Оценки b j – случайные величины. При выполнении определенных условий (4-х условий Гаусса-Маркова): E(b j.
Применение генетических алгоритмов для генерации числовых последовательностей, описывающих движение, на примере шага вперед человекоподобного робота Ю.К.
ОБУЧЕНИЕ КЛАССИФИКАТОРОВ НА ОСНОВЕ ВЫДЕЛЕНИЯ ФРАГМЕНТОВ Васильев В.Г.
Лекция 1 Введение.. Опр. эконометрика это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов.
Икрам Магжан Что такое коллективный разум? Машинное обучение Рекомендация товара на основе коллаборативной фильтраций Литература.
КЛАСТЕРИЗАЦИЯ РОССИЙСКИХ РЕГИОНОВ ПО ДИНАМИКЕ ИНДЕКСА ДЖИНИ Демидов Дмитрий Факультет Экономики, 1 курс Национальный исследовательский университет – Высшая.
Сравнительный анализ некоторых методов композиции вычислительных подобластей студент: Данилин Александр научный руководитель: Илюшин Александр Иванович.
Алгоритм построения оценок весов интентов для многозначных запросов Артём Григорьев 445-ая группа Кафедра Системного программирования Математико-механический.
Метод моделирования статических систем по экспериментальным данным.
КЛАССИЧЕСКИЙ РЕГРЕССИОННЫЙ АНАЛИЗ. ОБЩАЯ ЛИНЕЙНАЯ МОДЕЛЬ.
Создание экспериментального стенда для оценки методов поиска изображений по содержанию Выполнила: Теплых М. А. Научный руководитель: Васильева Н. С. Рецензент:
Тестирование как система оценки и контроля знаний, умений обучающихся.
Конференция "Управление аудиторией и реклама в Интернете" Основные выдержки _________________________.
Транксрипт:

МЕТОД СКОЛЬЗЯЩЕГО КОНТРОЛЯ ДЛЯ ОЦЕНКИ КАЧЕСТВА РЕКОМЕНДАТЕЛЬНЫХ ИНТЕРНЕТ- СЕРВИСОВ А.Ю. Каминская, Р.А. Магизов Научный руководитель – Д.И. Игнатов Государственный университет – Высшая школа экономики, Москва, Россия 2010

Содержание Постановка задачи Мотивация Примеры моделей рекомендательных систем – User-based RS – Item-based RS Выбор меры (метрики) сходства Методика сравнения Данные MovieLens и Yahoo Результаты Выводы и дальнейшая работа

Постановка задачи Зная предпочтения конкретного пользователя и остальных, выдать ему релевантную рекомендацию Оценка (проверка) качества рекомендаций

Мотивация Существует огромное количество РС Требуются эффективные алгоритмы – Время выполнения – Качество рекомендаций Количество ошибок и полнота рекомендаций

User-based RS целевой пользователь - предметы, которые он оценивал - сходство с пользователем - top-n ближайших к нему соседей, n определяет - пользователи из, которые оценили предмет i - оценка предмета i пользователем u предсказанная системой оценка для целевого пользователя:

Item-based RS целевой пользователь - предметы, которые он оценивал - сходство товара i с товаром j - top-n ближайших к нему товаров, top-n определяет - для - оценка предмета i пользователем u предсказанная системой оценка для целевого пользователя:

Пример User-based RS Пользователь Сходство «Мастер и Маргарита» ВО «Мастер и Маргарита» «Преступление и наказание» ВО Преступление и наказание» Рей Бредбери. Рассказы. ВО Рей Бредбери. Рассказы. Е. Гришковец. «Планета» ВО «Планета» V.M SKY ×0.5= OLA ×0.5= GRY ×0.94= IDI ×0.87=2.61.5

Выбор меры (метрики) сходства Сходство, основанное на расстоянии: – Евклида – Хемминга Корреляция как сходство: – коэффициент Пирсона Косинусная мера Коэффициент Жаккара

Корреляция Пирсона Недостатки – не определена на векторах с постоянными значениями: (4,4,4,...,4) – теряются рекомендации a=(0,5,5,4) b=(0,4,5,0)

Методика сравнения Метрики качества: точность и полнота рекомендаций Скользящий контроль (кросс-валидация)

Точность и полнота Полнота – число релевантных рекомендаций к числу всех выбранных пользователем товаров Точность – число релевантных к числу всех рекомендаций

Скользящий контроль Разбиение на тестовую и обучающую выборки: Сокрытие признаков для тестирования рекомендаций: Вычисление точности и полноты для на признаках :

Точность и полнота: раскрытие неопределенностей else

Алгоритм Параметры: – test% - размер тестового множества – hidden% - размер скрытого множества признаков – p – число повторений разбиения на тестовое и обучающее множество – q – число повторений разбиения на оцененное и неоцененное множества признаков Выход:средние значения точности и полноты по множеству U test и I hidden

Данные MovieLens и Yahoo MovieLens 100K dataset: – 943 пользователя – 1,682 фильма – Каждый оценил как минимум 20 фильмов, всего 100,000 оценок Yahoo binary dataset: – 2,000 фирм – 3,000 рекламных словосочетаний – 92,345 ненулевых ячеек

Результаты

Выводы и дальнейшая работа Предложенная методика позволяет оценить качество работы рекомендательной системы вне зависимости от выбора метода По-видимому, впервые в экспериментах исследуется точность и полнота в зависимости от количества скрытых признаков Для сравнения методов необходимо проведение аналогичных экспериментов для более совершенных моделей РС, например, основанных на бикластеризации

Спасибо за внимание!