Выпускная работа по «Основам информационных технологий» Гуд Игорь Анатольевич Руководитель: доцент Стрикелев Дмитрий Александрович Руководитель: доцент Кожич Павел Павлович
Структура Цель работы Актуальность Схема решения Системы обучающихся классификаторов Системы обучающихся классификаторов Результаты Заключение
Цель работы Разработка само обучаемого модуля управления доступом к информационным ресурсам на основе динамического анализа содержимого и систем обучающихся классификаторов
Актуальность управления доступом к информационным ресурсам WWW? защита детей от просмотра сайтов, содержание которых может нанести им вред; аспекты, связанные с информационной безопасностью; ограничение нерационального использования Интернета.
Управление доступом на основе списков (недостатки) Интернет изменяется слишком быстро; существуют процедуры обхода таких списков; проблема ограничения доступа к сайтам, только часть содержимого которых является нежелательным (поисковые системы).
Динамический анализ содержимого решение о предоставлении доступа принимается в результате анализа содержимого веб-страницы в момент обращения пользователя к ней
Схема решения задачи выбор признаков; подготовка набора веб-страниц для обучения; обучение классификатора; проверка результатов.
Модуль управления доступом (часть 1)
Модуль управления доступом (часть 2)
Компоненты вектора признаков отношение числа ссылок на свой домен к общему числу ссылок на странице; отношение числа ссылок, содержащих в якорном тексте хотя бы одно слово из словаря, к общему числу ссылок на странице; число русскоязычных слов на странице;
Компоненты вектора признаков (продолжение) отношение числа слов из словаря в якорном тексте к общему числу слов в якорном тексте; отношение числа слов из словаря на странице к общему числу слов на странице; число слов в якорном тексте ссылок.
Система обучающихся классификаторов
LCS
XCS
Прокси-сервер Scone с разработанным модулем
Результаты работы модуля
Сервисы предоставления анонимности
Поверхность предсказания популяции
Поверхность предсказания популяции (продолжение)
Заключение проанализированы различные подходы к классификации гипертекстовых документов; исследованы основные свойства и характерные признаки русскоязычных социальных сетей развлекательного характера;
Заключение (продолжение) составлен словарь наиболее характерных лексем для данной категории информационных ресурсов; разработан программный обучаемый модуль управления доступом к информационным ресурсам для прокси-сервера.
Спасибо за внимание! Выпускная работа по «Основам информационных технологий» Гуд Игорь Анатольевич Руководитель: доцент Стрикелев Дмитрий Александрович Руководитель: доцент Кожич Павел Павлович