Статистические методы классификации писем. Антиспамовые фильтры Выполнил Коренков Максим
СПАМ! Легальные рассылки. Нелегальные рассылки(спам). Вредоносность спама.
Технические методы борьбы Для сервера Для клиента
Классификация спама Вероятностный подход. «Наивный» Байес. Обучаемые системы. Нейросеть Кохонена.
«Наивный» Байес не все входные переменные статистически независимы; допущение этой независимости и обуславливает приставку наивно- в названии алгоритма.
Сеть Кохонена Зависит от количества атрибутов Априорно должны знать количество кластеров
User Interface А. Лебедев:«Пользователь ленив» Модули расширения к The Bat!
User Interface
Результат неверной классификации Пользователь может повлиять на подстройку весов нейросети Кохонена: Пометить письмо как спам Пометить письмо как не спам
Выводы Оба реализованных метода хорошо себя зарекомендовали при классификации текста. Каждый из них имеет недостатки, которые легко компенсируются их совместной работой. К общим недостаткам стоит отнести зависимость точности классификации от обучающей выборки.