Повышение качества результатов анонимного интернет-голосования на основе анализа сетевых объектов Студеникин Роман Науч.рук. Гамаюнов Денис
Введение Отношение количества голосов от уникальных пользователей к общему количеству голосов. Чем этот показатель выше, тем лучше. Повышение качества результата интернет- голосования – исключение повторных голосов от одного и того же пользователя.
Существующие методы Исключить голоса программных роботов – Скорость передвижения по страницам – Отсутствие движений мыши – Тесты «на человечность» Статистический анализ голосов по IP- адресам. Использование Cookies.
Анализ по IP-адресам Достоинства – Не зависит от используемых пользователем веб-браузеров и их настроек. Недостатки – Неустойчив против пользователей с динамическим IP. – Не отличает пользователей различных устройств, видимых под одним IP.
Использование Cookies Достоинства – Устойчив против пользователей с динамическим IP. Недостатки – Зависит от используемых пользователем веб- браузеров и их настроек. – Cookies легко уничтожить, подделать, или украсть.
Предлагаемый метод Определения – Сетевой объект – набор(пользователь, аппаратные средства, операционная система, прикладные программы пользователя). – Профиль объекта – область в пространстве значений параметров, характеризующих объект.
Предлагаемый метод Гипотеза: Сетевой объект – идеальная единица для анализа. Использовать для анализа только те параметры, которые характеризуют сетевой объект.
Постановка задачи Необходимо: – Исследовать, какие параметры можно получить удаленно. – Реализовать систему сбора профилей. – Получить тестовую выборку. – Провести эксперимент и выявить достоинства и недостатки метода.
HTTP-сессия и модель TCP/IP: Физический – Time skew Канальный уровень Сетевой уровень – IP-адресация. Транспортный уровень – Установление TCP-соединения. Прикладной уровень – GET(POST)-запрос – HTTP ответ. – Отображение страницы
Доступные параметры Сетевой уровень – IP-адрес Транспортный уровень – Различия в реализации протокола TCP* Прикладной уровень – UserAgent*, Cookies, JavaScript* * параметры, помеченные звездочкой характеризуют сетевой объект.
Система сбора профилей Система реализована на языке Ruby On Rails и установлена на сервере aquarius лаборатории ЛВК. Профили хранятся в БД mysql. Система легко расширяется новыми параметрами.
Архитектура системы Web-Server Web-Application p0f LOG mysql connect Time, TCP-fingerprint TCP-fingerprint Query, UserAgent, JS params Profile vector
Тестовая выборка Собраны профили 164 пользователей. Планируется каждому из параметров сопоставить некоторый вес. – Вес меньше, если параметр часто изменяется. – Вес меньше, если такое значение параметра встречается у многих пользователей. Учитывая найденные веса определить функцию близости двух профилей.
Проведение эксперимента При помощи значений параметров из профилей, все пользователи будут разделены на группы. Планируется получить следующие значения: – Точность определения группы пользователя, – Количество групп, – Распределение пользователей по группам.
Перспективы использования Метод разделения всех пользователей на группы может быть использован для: – статистического анализа результатов голосования. Возможно, этот же метод применим к системам контекстной рекламы для определения склика на стороне рекламодателя.