Выпускная квалификационная работа студента 545 группы Алеева Алексея Валерьевича Научный руководитель: аспирант, Е. А. Елизаров Рецензент: ведущий инженер, ООО «Квестора», М.В. Хлуднев 2012
Поиск шаблонов последовательных событий (Sequential Pattern Mining или SPM)
Сложность выбора алгоритма поиска шаблонов последовательных событий. Отсутствие инструментального средства, позволяющего решать задачу SPM для различных форматов входных данных.
Исследовать существующие алгоритмы решения задачи SPM Выбрать/разработать эффективный алгоритм решения задачи SPM Разработать механизм определения типов журналов Реализовать данный механизм и выбранный алгоритм в рамках проекта GDLogTool
Расширение областей применения алгоритмов Поддержка временных ограничений Ограничение максимальной длины шаблонов Поиск всех/максимальных шаблонов Выбор между LPI SPAM и PrefixSpan PrefixSpan эффективнее чем LPI SPAM
Сделан обзор существующих решений задачи SPM. Выбраны два эффективных алгоритма для решения описанной задачи, расширены их области применения. Разработан механизм определения типов логов. Выбранные алгоритмы и механизм реализованы в рамках проекта GDLogTool.