Инструмент анализа пользовательских логов поисковых систем Руководитель: к. ф.-м. н. Лидия Грауэр Курсовая работа студента 4 курса Андрея Солозобова
Описание предметной области Репрезентативная фокус-группа Задания – Поисковые запросы и ответы – Посещённые страницы – Манипуляции в браузере (движения мыши, прокручивание страницы, нажатия клавиш) – Временные подписи действий Анализ работы (серверные логи) Выдвижение гипотез Инструмент Андрей Солозобов
Постановка задачи Помощь аналитикам Выделение сессий из логов Наглядная визуализация сессий Управление множествами сессиями Подсчёт статистик Определение закономерностей и кластеризация Андрей Солозобов
Результаты работы Работа с данными Выделение сессий из логов Нормализация записей (различные форматы, ошибки …) Визуальное представление Параметры событий Диаграмма последовательности событий Диаграмма хронологии событий Фильтрация событий по типу Аналитика Кластеризация (метод К-средних) Выделение частых подпоследовательностей Андрей Солозобов
Дальнейшие планы Фильтрация сессий по критериям Новые способы кластеризации и статистики Переход на веб UI Анализ больших поисковых логов Андрей Солозобов