Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемЯн Никульшин
1 Анализ и предсказание пользовательской активности САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Математико-механический факультет Кафедра системного программирования Научный руководитель: Д.Ю. Бугайченко Рецендент: Н.Г. Графеева Лапин Сергей Константинович
2 Цели исследования Нахождение оптимального времени публикации контента Предсказание активности пользователя
3 Постановка задачи Собрать данные активности пользователей Подготовить данные для анализа Реализовать прогноз активности Предложить оптимальное время публикации
4 Архитектура
5 Формирование сессий Сессия считается оборванной, если пользователь не был активен заданный промежуток времени Важно расположение сессии, а не её интенсивность
6 Данные пользователей Skype Тренд Периодичность На рис. Сформированные сессии в масштабе года
7 Методы для анализа и прогнозирования временных рядов Выделение тренда – Простое скользящее среднее – Взвешенное-экспоненциальное скользящее среднее Выделение периодичности – Спектральный анализ – Сингулярный спектральный анализ (SSA) или «гусеница»
8 Подготовка данных Взвешенный ряд по длине сессий - несессий Ряд активности за год со сформированными сессиями(коэффициент угасания = 10 сек)
9 Разделение ряда Взвешенный ряд по длине сессий-несессий за год Первый ряд для предсказания Второй ряд для проверки
10 Предсказание Сравнение реального продолжения ряда с прогнозом Сравнение предсказанных(сплошная линия) и реальных сессий(пунктирная линия)
11 Прогноз оптимального времени публикации Сравнение предсказанных(сплошная линия) и реальных суммированных сессий(пунктирная линия)
12 Статистика эффективности метода Статистика по 30 пользователям StackOverflow. Взято 10 случайных интервалов, количество пользователей усреднено. Часы Количество пользователей в предсказанный максимум Количество пользователей в реальном пике КПД нахождения пользователей в предполагаемом максимуме
13 Полученные результаты Собраны данные из Skype и Stack Overflow Предложены и применены методы подготовки данных Произведена оценка предсказания Предложены оптимальные для публикации временные интервалы
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.