С ТАТИСТИЧЕСКИЕ МЕТОДЫ ОБУЧЕНИЯ РАСПОЗНАВАНИЮ ОБРАЗОВ Студент гр Хиндикайнен А.С.
Чем более подходящими шаблонами вы пользуетесь, тем более успешными будут ваши решения. Герберт Саймон, лауреат нобелевской премии по экономике «за новаторские исследования процесса принятия решений в экономических организациях, в фирмах»
Распознавание образов – раздел кибернетики, развивающий теоретические основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. п. объектов, которые характеризуются конечным набором некоторых свойств и признаков.
Методы распознавания образов могут быть разделены на следующие группы: Сравнение с образцом С использованием искусственных нейронных сетей Структурные и синтаксические методы Статистические методы
Статистические методы распознавания образов
Основные понятия математической статистики: 1. Распределение (плотность распределения) – функция, которая каждому значению сопоставляет его вероятность. А. Равномерное распределение. Б. Нормальное распределение. Плотность распределения: Функция распределения: 2. Выборка – Набор значений случайной величины X 1, X 2 … X n
Задачи математической статистики: 1.Оценка параметров Пусть выборка принадлежит известному распределению с неизвестными параметрами. Нам необходимо дать оценку параметрам распределения. Например, дана выборка (5, 7, 1), необходимо выяснить, на каком отрезке производился выбор случайных величин, если известно, что распределение равномерно. 2. Проверка гипотез Необходимо проверить предположения о распределении вероятностей экспериментальных данных. Например, является ли распределение нормальным. В случае двухальтернативной задачи проверки гипотез одну из гипотез называют основной гипотезой, а вторую – альтернативной. При этом верна только одна из них.
Правило Байеса Пусть даны два распределения A и B и значение X, порожденное одним из этих распределений. Наша задача определить, каким из распределений было порождено значение X.
Статистические методы распознавания образов Дана обучающая коллекция. Каждый объект представляется в виде набора n характеристик (n-мерный вектор). Необходимо построить классифицирующее правило. Считаем, что элементы каждой категории имеют свое распределение в n- мерном пространстве. Решение, к какой категории будет причислен распознаваемый элемент, будем принимать согласно формуле 1. Возможны 3 случая: 1. Функции распределения известны В таком случае просто воспользуемся формулой Известен тип функции распределения, но неизвестны параметры Используются точечные оценки для параметров распределения. Например, для нормального распределения: 3. Неизвестное распределение: Для построения функции распределения воспользуемся тренировочной коллекцией.
Рассмотрим 2 метода построения функции распределения: 1.Метод гистограмм Разобьем n-мерное пространство на части. Каждой части определим плотность распределения, как долю всех точек, попавших в эту часть. Минусом этого метода является то, что при большой размерности пространства признаков необходима огромная обучающая коллекция для построения функции распределения.
2. Метод Парзена Для каждой точки из класса построим функцию, достигающую максимума в этой точке, и быстро убывающую при удалении от нее. В качестве функции распределения возьмем среднее арифметическое построенных функций. Функция K(x) называется ядром.
В зависимости от выбора ядра могут быть получены разные результаты обучения, выбор слишком большого или слишком маленького ядра может ухудшить качество распознавания. Наиболее часто размер ядро выбирается индивидуально для каждого обучающего элемента из коллекции. Критерием выбора обычно используется количество соседей обучающего элемента, попавших в это ядро.
Список использованной литературы 1. Википедия – статья «Теория распознавания образов» 2. Лифшиц Ю.И., курс лекций «Современные задачи теоретической информатики» 3. К. В. Воронцов – Лекции по статистическим (Байесовским) алгоритмам классификации. классификатор 4. Википедия – статья «Распределение вероятностей»
Вопросы?