Информативность и выбор признаков Лекция 2.4 Введение в когнитивный анализ данных д.т.н. Загоруйко Николай Григорьевич.

Презентация:



Advertisements
Похожие презентации
Тренажёр Сложение и вычитание чисел в пределах 100.
Advertisements

Тренажёр Сложение и вычитание чисел в пределах 100 Автор : Самматова Эльмира Замиловна, учитель начальных классов Муниципальное общеобразовательное учреждение.
Масштаб 1 : Приложение 1 к решению Совета депутатов города Новосибирска от _____________ ______.
Матемтааки ЕТ СТ 2 класс Шипилова Наталия Викторовна учитель начальных классов, ВКК Шипилова Наталия Викторовна учитель начальных классов, ВКК.
Общие результаты ЕГЭ города Канаш в разрезе общеобразовательных учреждений.
Масштаб 1 : Приложение 1 к решению Совета депутатов города Новосибирска от
1. Определить последовательность проезда перекрестка
Качество знаний, успеваемость и СОУ за I полугодие учебный год.
Тема урока: Двузначные числа. Обобщение. (исследование) 1.
ЦИФРЫ ОДИН 11 ДВА 2 ТРИ 3 ЧЕТЫРЕ 4 ПЯТЬ 5 ШЕСТЬ 6.
Результаты работы 5а класса Кл. руководитель: Белобородова Н. С. Показатель 0123 Обучаемость 1-6%4-25%8-50%3-18 Навыки смыслового чтения 1-6%12-75%3-18%
Тема 11 Медицинская помощь и лечение (схема 1). Тема 11 Медицинская помощь и лечение (схема 2)
Условия осуществления образовательного процесса В школе обучалось 728 учащихся в 26 классах- комплектах. Средняя наполняемость классов составила 28 учеников.
Выбор признаков Лекция 4. Проклятие размерности Выбор признаков Выбор признаков Генерация признаков Генерация признаков Формирование новой системы признаков,
Анализ диагностической работы по русскому языку в формате ЕГЭ г. Анализ диагностической работы по русскому языку в формате ЕГЭ г.
Д. Дуброво д. Бортниково с. Никульское д. Подлужье д. Бакунино пос. Радужный - Песчаный карьер ООО ССП «Черкизово» - Граница сельского поселения - Граница.
Ул.Школьная Схема с. Вознесенка Ярославского городского поселения п.Ярославский 10 2 Ул.Флюоритовая
Сложение натуральных чисел (до 100)
Управление по работе с муниципальными учреждениями образования администрации города Владивостока.
Применение генетических алгоритмов для генерации числовых последовательностей, описывающих движение, на примере шага вперед человекоподобного робота Ю.К.
Транксрипт:

Информативность и выбор признаков Лекция 2.4 Введение в когнитивный анализ данных д.т.н. Загоруйко Николай Григорьевич

Выбор признаков Качество решения зависит задач анализа зависит от информативности выбранных признаков. Информативность признаков понятие относительное. Оценка информативности признаков зависит от списка распознаваемых образов S = (S1,S2,…,Si,..., SК). Первоначальный состав признаков (система Х0) задается неформализованным путем, на основе опыта и интуиции специалиста. Формальные методы применяются для проверки этой исходной системы на достаточность и необходимость. Достаточной считаем систему, которая при заданных S и D обеспечивает затраты R, не превышающие определенного порога R0. Необходимой является достаточная система минимальной сложности (стоимости). При обучающей выборке А решается следующая задача: β = argmin R(Xβ)/S,D,A,R0 βВ 2

Схема алгоритмов выбора признаков 3

4

Селекция МГУА- метод группового учета аргументов (Ивахненко А.Г.) Первичные признаки X= Вторичные признаки: X= f(x1,x2)= ; f(x1,x2)=x1*x2; f(x1.x2)=x1/x2 5

Жадные алгоритмы Логические решающие правила – итеративное добавление признаков с распознаванием по пороговым функциям (Лбов Г.С., Михальский Р.С., 1962). Если (x2 10)^(x3=0), то (х0=1) Addition – итеративное добавление лучшего к имеющимся (Ю.Л. Барабаш, 1963) n

Итеративный алгоритм AdDel (Kittler J.,1985) Чередование n1 Add – n2 Del. n2

Алгоритм FRiS-GRAD Вторичные признаки - Гранулы из m признаков: m=1, 2, 3,.. Полный перебор? 8

Критерии информативности Внутренние критерии: Тестовое распознавание всей обучающей выборки или ее части (U) Внешние критерии: Критерий Фишера FRiS-компактность 9

Сравнение критериев 10 U-CV, Q-Fisher, Fs-FRiS

Устойчивость к помехам 11 Обучение Контроль ********* ********* F=0.87 * * * * * * * * * * * * * * * * * * F=0.56

12

13

14

Jeffery I., Higgins D., Culhane A.: Comparison and evaluation of methods for generating differentially expressed gene lists from microarray data, BMC Bioinformatics, 2006, 7:359. ( 10 методов выбора * 4 типа реш. правил ……. 40 решений 9 задач Сравнение c «мировыми рекордами» Задача N0 m1/m2 max of 40 GRAD ALL / ALL / ALL / ALL / Prostate / Myeloma / ALL/AML / DLBCL / Colon / average

16

17

Заключение Сравнение с лучшими опубликованными методами показало, что FRiS- подход при выборе признаков и решающих правил не уступает им по качеству получаемых решений. 18