Повышение качества результатов анонимного интернет-голосования на основе анализа сетевых объектов Студеникин Роман Науч.рук. Гамаюнов Денис
Введение Отношение количества голосов от уникальных пользователей к общему количеству голосов. Чем этот показатель выше, тем лучше. Повышение качества результата интернет- голосования – исключение повторных голосов от одного и того же пользователя.
Существующие методы Исключить голоса программных роботов – Скорость передвижения по страницам – Отсутствие движений мыши – Тесты «на человечность» Статистический анализ голосов по IP- адресам. Использование Cookies.
Анализ по IP-адресам Достоинства – Не зависит от используемых пользователем веб-браузеров и их настроек. Недостатки – Неустойчив против пользователей с динамическим IP. – Не отличает пользователей различных устройств, видимых под одним IP.
Использование Cookies Достоинства – Устойчив против пользователей с динамическим IP. Недостатки – Зависит от используемых пользователем веб- браузеров и их настроек. – Cookies легко уничтожить, подделать, или украсть.
Предлагаемый метод Определения – Сетевой объект – абстрактная сущность, порождающая сетевой трафик в результате взаимодействия пользователя и сетевого устройства. – Профиль объекта – область в пространстве значений параметров, характеризующих объект.
Предлагаемый метод Сетевой объект – идеальная единица анализа. Использовать для анализа только те параметры, которые характеризуют сетевой объект.
Постановка задачи Необходимо: – Исследовать, какие параметры можно получить удаленно. – Реализовать систему сбора профилей. – Получить тестовую выборку. – Провести эксперимент и выявить достоинства и недостатки метода.
HTTP-сессия и модель TCP/IP: Физический Канальный уровень Сетевой уровень 1. IP-адресация. Транспортный уровень 1. Установление TCP-соединения. Прикладной уровень 1. GET(POST)-запрос 2. HTTP ответ. 3. Отображение страницы
Доступные параметры Сетевой уровень – IP-адрес Транспортный уровень – Различия в реализации протокола TCP* Прикладной уровень – UserAgent*, Cookies, JavaScript* * параметры, помеченные звездочкой характеризуют сетевой объект.
Система сбора профилей Система реализована на языке Ruby On Rails и установлена на сервере aquarius лаборатории ЛВК. Профили хранятся в БД mysql. Система легко расширяется новыми параметрами.
Тестовая выборка Собраны профили 164 пользователей. Планируется каждому из параметров сопоставить некоторый вес. – Вес меньше, если параметр часто изменяется – Вес меньше, если такое значение параметра встречается у многих пользователей. Учитывая найденные веса определить функцию близости двух профилей.
Проведение эксперимента При помощи значений параметров из профилей, все пользователи будут разделены на группы. Планируется получить следующее значение: – Точность определения группы пользователя.
Перспективы использования Метод разделения всех пользователей на группы может быть использован для: – статистического анализа результатов голосования. Возможно, этот же метод применим к системам контекстной рекламы для определения склика.