Разработка алгоритмов на базе FRiS-функции Лекция 6.

Презентация:



Advertisements
Похожие презентации
Задачи комбинированного типа. Функция конкурентного сходства. Лекция 5.
Advertisements

Задача таксономии и частичного обучения Лекция 6.
Выбор признаков Лекция 4. Проклятие размерности Выбор признаков Выбор признаков Генерация признаков Генерация признаков Формирование новой системы признаков,
Лекция 11. Методы и алгоритмы анализа структуры многомерных данных. Кластерный анализ. Кластерный анализ предназначен для разбиения множества объектов.
Задача построения решающего правила Лекция 4,5. Статистический подход к задаче распознавания. Генеральная совокупность изучаемых объектов Г. Генеральная.
Регрессионный анализ и заполнение пробелов Лекция 4.
Использование графических ускорителей при решении задач обработки текстов Афонин С.А. Сыроватский Д.А МГУ им.М.В.Ломоносова.
МЕТОД ЭКСПЕРТНЫХ ОЦЕНОК. ЭКСПЕРТИЗА В УПРАВЛЕНИИ Роль экспертов в управлении: Основные трудности, связанные с информацией, возникающие при выработке сложных.
Лекция 3 1.Понятие образа 2.Проблема обучения распознаванию образов 3.Геометрический и структурный подходы 4.Гипотеза компактности 5.Обучение и самообучение.
Проект : Ассоциативный поиск информации с помощью нейронных сетей. Задача: методы кластеризации данных.
EM-алгоритм Альперин Борис Содержание Вероятностная постановка задачи классификации Параметрический подход к оценке плотности расределения Принцип.
Лекция 9: Метод предельных упрощений (МПУ) По тому, как организован процесс обучения распознающих систем, четко выделяются два подхода к проблеме ОРО.
Кластерный анализ. Цель работы ознакомление с проблемой кластерного анализа при интеллектуальной обработке данных в информационных системах; изучение.
С ТАТИСТИЧЕСКИЕ МЕТОДЫ ОБУЧЕНИЯ РАСПОЗНАВАНИЮ ОБРАЗОВ Студент гр Хиндикайнен А.С.
Кластеризация. Немного истории Первые публикации по кластерному анализу появились в конце 30-х гг. прошлого столетия. Активное развитие и широкое использование.
Экономическая статистика Преподаватель – Грабовский А.Е.
Классификация и регрессия Доклад по курсу Интеллектуальный анализ данных Закирова А.Р. 1.
Анализ предметных взаимосвязей по результатам оценки знаний студентов Научный руководитель: Штейнберг А.М Выполнила: Сухорукова Ольга.
Обратные задачи: теория и практика Лекция 7. Решение обратной задачи с предварительным обучением. Новосибирский Государственный Университет Физический.
Лекция 12 РАЗЛИЧЕНИЕ СИГНАЛОВ МНОГОАЛЬТЕРНАТИВНЫЕ ЗАДАЧИ ВЫБОРА РЕШЕНИЯ.
Транксрипт:

Разработка алгоритмов на базе FRiS-функции Лекция 6

Функция конкурентного сходства r1 r2 F=0 F=(r2-r1)/(r2+r1) F [-1, 1]

Компактность Существует множество нечетких, интуитивных определений. Существует множество нечетких, интуитивных определений. Невычурность границ Невычурность границ Простота форм Простота форм Пример удачной формализации: профиль компактности Пример удачной формализации: профиль компактности

Формулировка компактности через FRiS-функцию Среднее значение конкурентного сходства для всех объектов выборки ~ компактность выборки Среднее значение конкурентного сходства для всех объектов выборки ~ компактность выборки F=0.87F=0.38F=0.03 В зависимости от принципов по которым определяются ближайший «свой» и «чужой» представители можно моделировать различные виды компактности Похожесть на ближайшего соседа – локальная компактность Похожесть на типичного представителя – унимодальная и полимодальная компактность

Плотность распределения FRiS-функции в статистической постановке задачи распознавания

Зависимость ожидаемой величины FRiS-функции от вероятности ошибочного распознавания

Функция конкурентного сходства – единый базис для решения различных задач Data Mining Таксономия FRiS-Tax Построение решающего правила FRiS-Stolp Выбор информативной системы признаков FRiS-GRAD Обобщенная классификация FRiS-TDR Прогнозирование FRiS-Pro Комбинированные задачи FRiS-SDX

Алгоритм FRiS-Stolp Ищется базовое множество столпов, состоящее из наилучшего кандидата на роль столпа образа А и наилучшего кандидата на роль столпа образа В. Ищется базовое множество столпов, состоящее из наилучшего кандидата на роль столпа образа А и наилучшего кандидата на роль столпа образа В. Считается, что рассматриваемый образ описывается единственным столпом, а в качестве столпа конкурирующего образа берется ближайший объект из этого образа. Считается, что рассматриваемый образ описывается единственным столпом, а в качестве столпа конкурирующего образа берется ближайший объект из этого образа. Происходит наращивание базовой системы столпов до достижения одного из условий остановки Происходит наращивание базовой системы столпов до достижения одного из условий остановки заданный уровень точности распознавания обучающей выборки заданный уровень точности распознавания обучающей выборки максимально допустимое количество столпов в системе максимально допустимое количество столпов в системе

Алгоритм FRiS-Stolp r1 r2 r1 r2

Алгоритм FRiS-Tax Редуцированная FRiS-функция Редуцированная FRiS-функция Виртуальный конкурент Виртуальный конкурент Работа алгоритма состоит из двух этапов: Работа алгоритма состоит из двух этапов: FRiS-Cluster FRiS-Cluster Отыскиваются центры локальных сгустков объектов (столпы). Отыскиваются центры локальных сгустков объектов (столпы). Выборка распределяется между столпами. Строится кластеризация. Выборка распределяется между столпами. Строится кластеризация. FRiS-Class FRiS-Class Линейно разделимые кластеры объединяются в таксоны сложной формы. Линейно разделимые кластеры объединяются в таксоны сложной формы.

Выбор числа таксонов в алгоритме FRiS-Tax Строятся кластеризации для всех k K, вычисляется их качество F(2),F(3),…,F(k) Строятся кластеризации для всех k K, вычисляется их качество F(2),F(3),…,F(k) Ищутся локальные максимумы качества Ищутся локальные максимумы качества такие k, что F(k-1)

Требования к обобщенной классификации Решает задачи распознавания, таксономии и частичного обучения Решает задачи распознавания, таксономии и частичного обучения Смесь классифицированной и неклассифицированной выборок разбивается на таксоны Смесь классифицированной и неклассифицированной выборок разбивается на таксоны алгоритм ТРФ алгоритм ТРФ Геометрическая компактность Геометрическая компактность объекты одного таксона должны быть похожими друг на друга и отличаться от объектов других таксонов объекты одного таксона должны быть похожими друг на друга и отличаться от объектов других таксонов Однородность Однородность в одном таксоне должны преобладать объекты одного и того же образа в одном таксоне должны преобладать объекты одного и того же образа

Вычисление FRiS-функции по смешанной выборке r* - расстояние до виртуального конкурента r1 r2r2

Вычисление FRiS-функции по смешанной выборке с опорой на столпы

Схема алгоритма FRiS-TDR Ищется базовое множество столпов, состоящее из наилучшего кандидата на роль столпа образа А и наилучшего кандидата на роль столпа образа В. Ищется базовое множество столпов, состоящее из наилучшего кандидата на роль столпа образа А и наилучшего кандидата на роль столпа образа В. Считается, что рассматриваемый образ описывается единственным столпом, а в качестве столпа конкурирующего образа берется ближайший объект из этого образа. Считается, что рассматриваемый образ описывается единственным столпом, а в качестве столпа конкурирующего образа берется ближайший объект из этого образа. Объекты неклассифицированной выборки могут быть столпами как образа А, так и образа В. Объекты неклассифицированной выборки могут быть столпами как образа А, так и образа В. Происходит наращивание базовой системы столпов до достижения одного из условий остановки Происходит наращивание базовой системы столпов до достижения одного из условий остановки заданный уровень точности распознавания обучающей выборки заданный уровень точности распознавания обучающей выборки максимально допустимое количество столпов в системе максимально допустимое количество столпов в системе F(i-1)

Эффект от использования информации из распознаваемой выборки

Примеры работы алгоритма на классифицированной и неклассифицированной выборках

Автоматический выбор числа таксонов

Задача SDX Необходимо привести неструктурированный массив данных к виду, удобному для восприятия человеком Необходимо привести неструктурированный массив данных к виду, удобному для восприятия человеком Сокращение числа объектов (переход к эталонам) Сокращение числа объектов (переход к эталонам) Сокращение числа признаков (переход к существенным) Сокращение числа признаков (переход к существенным)

Обучающая выборка Выбор системы признаков (алгоритм GRAD) Таксономия+ Решающее правило (алгоритм FRiS-Tax) Алгоритм FRiS-SDX Оценка предсказательной способности