Применение метода «Бритва Оккама» в задачах машинного обучения Выполнила Дьякова Ярослава.

Презентация:



Advertisements
Похожие презентации
НазваниеОписание ОбъектПример, шаблон, наблюдение АтрибутПризнак, независимая переменная, свойство Метка класса Зависимая переменная, целевая переменная,
Advertisements

ДРЕВОВИДНЫЕ МОДЕЛИ Деревья решений, случайный лес.
Классификация и регрессия Доклад по курсу Интеллектуальный анализ данных Закирова А.Р. 1.
Понятие о методах Монте-Карло. Расчет интегралов 2.5. Расчет интегралов методом Монте-Карло.
Презентация. Система управления базами данных (СУБД) совокупность программных и лингвистических средств общего или специального назначения, обеспечивающих.
1 Если значениями переменной являются элементы конечного множества, то говорят, что она имеет категориальный тип. Например, переменная наблюдение принимает.
Лабораторная работа Классификация ирисов. План Классификация ирисов Постановка задачи. Описать, какие задачи являются задачами классификации Описать алгоритм.
Лекция 9: Метод предельных упрощений (МПУ) По тому, как организован процесс обучения распознающих систем, четко выделяются два подхода к проблеме ОРО.
ПростыеСложные
ИНТЕРФЕЙС И СИСТЕМА КОМАНД ГИПОТЕТИЧЕСКОЙ СУБД Существует много СУБД. В разных СУБД различный интерфейс, язык команд. Как правило, в них используются английские.
С ТАТИСТИЧЕСКИЕ МЕТОДЫ ОБУЧЕНИЯ РАСПОЗНАВАНИЮ ОБРАЗОВ Студент гр Хиндикайнен А.С.
Александров А.Г ИТО Методы теории планирования экспериментов 2. Стратегическое планирование машинных экспериментов с моделями систем 3. Тактическое.
СПЕЦИАЛИЗИРОВАННАЯ ИНСТРУМЕНТАЛЬНАЯ ОБОЛОЧКА ДЛЯ АВТОМАТИЗАЦИИ СОЗДАНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ САПР С ДИФФЕРЕНЦИРОВАННЫМ ПОДХОДОМ К КВАЛИФИКАЦИИ ПОЛЬЗОВАТЕЛЯ.
P4P4 X X1X1 X2X2 X3X3 X4X4 Разница между действительным и оцененным значением Y называется остатком. P3P3 P2P2 P1P1 R1R1 R2R2 R3R3 R4R4 ( остаток ) e1e1.
Создание простого запроса и запроса на выборку Практическая работа.
Математическое моделирование (ММ) 1. Сущность ММ. 2. Важная триада. 3. Требования, предъявляемые математическим моделям. 4. Цель курса. 5. Имитационное.
Белорусский государственный университет Механико-математический факультет Кафедра математических методов теории управления Федорович Марина Николаевна.
Применение генетического программирования для реализации систем со сложным поведением Санкт-Петербургский Государственный Университет Информационных Технологий,
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Четыре шага создания запроса; Четыре шага создания запроса Пять шагов настройки работы с запросами. Пять шагов настройки работы с запросами Четыре шага.
Транксрипт:

Применение метода «Бритва Оккама» в задачах машинного обучения Выполнила Дьякова Ярослава

Вильям Оккам Родился примерно в 1290-м году. Закончил Оксфордский университет. Умер в 1338 году.

Принцип «Бритва Оккама» Pluralitas non est ponenda sine necessitas Сложность не должна использоваться без необходимости

Интерпретации метода Между двумя моделями, которые дают эквивалентные предсказания, следует выбрать более простую. Если два правила принятия решений классифицируют существующие данные одинаково хорошо, то более простое, скорее всего, будет классифицировать новые данные корректнее.

Интерпретации метода Если дано простое правило принятия решений А и намного более сложное правило В, которое только немного лучше классифицирует существующие данные, то А, скорее всего, будет лучше классифицировать новые данные. Простые классификаторы, скорее всего, точнее.

Два основополагающих принципа Предпочтение отдается простейшей модели, объясняющей наблюдения. Простые классификаторы, скорее всего, точнее.

Использование методов в построении деревьев решений Самое маленькое дерево – лучшее Построить самое маленькое дерево – неразрешимая задача на больших выборках Строится несколько приближенных к самому маленькому и выбирается лучшее

Способы выбора лучшего атрибута Least-Values: выбор атрибута с наименьшим количеством значений Most-Values: выбор атрибута с наибольшим количеством значений Max-Gain: выбор атрибута с наибольшим значением выигрыша информации Случайно

Устранение шумов Бритва Оккама также используется в построении деревьев, чтобы избежать излишней подгонки данных под выборку.

Пример использования метода

Описание работы программы Для того, чтобы получить дерево следует загрузить выборку, выбрать ключевой атрибут и нажать на кнопку выбранного способа Программа выведет на экран соответствующее дерево

Результаты Least-Values Количество узлов 21

Результаты Most-Values Количество узлов 17

Результаты Max-Gain Количество узлов 8

Выводы Наиболее широкое применение метод «Бритва Оккама» получил в построении деревьев решений. При помощи него можно найти оптимальное по своей сложности и величине дерево. Метод позволяет избежать излишней подгонки данных к обучающей выборке, а значит, позволяет построенным деревьям лучше классифицировать новые примеры. Следуя принципу «Бритвы Оккама», самое лучшее дерево построено при помощи алгоритма ID3 (Max- Gain)