Использование глубоких машин Больцмана в системах распознавания образов Выполнил: студент группы ИТД-М1-41 Дьяконов А.В. Научный руководитель: д. б. н., проф. Стефаненко Г.А. Выпускная работа магистра Факультет: Фундаментальных наук Кафедра: Программного обеспечения ЭВМ, информационных технологий и прикладной математики Калуга Калужский филиал федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Московский государственный технический университет имени Н.Э. Баумана»
Цели работы Изучить классы задач распознавания образов Рассмотреть существующие алгоритмы распознавания Исследователь применимость машин Больцмана в распознавании образов Найти оптимальные структуры сети для распознавания изображений различных типов Произвести сравнение с другими методами распознавания
Распознавание образов Найти функцию вида: - вектор, соответствующий классифицируемому образу - класс, к которому принадлежит образ
Машины Больцмана Особый вид стохастической рекуррентной нейронной сети Энергия сети определяется как Вероятность того, что i -ый элемент находится в активном состоянии Ограниченная машина Больцмана – машина Больцмана без связей в пределах слоя
Сопоставительное отклонение ДАННЫЕДАННЫЕ
Глубокие машины Больцмана Машины Больцмана с несколькими скрытыми слоями Обучение производится послойно Каждый слой рассматривается как отдельная ограниченная машина Больцмана
Алгоритм обучения Создать две копии входного вектора для видимых элементов Зафиксировать веса текущего слоя и обучить следующую RBM используя метод сопоставительного отклонения Предпоследний слой Удвоить количество скрытых элементов при обучении для связывания весов Из получившихся весовых коэффициентов составить сеть Да Нет
Эксперименты с MNIST
Эксперименты с NORB и Color FERET Color FERETNORB
Достоинства и недостатки Низкий процент ошибки (в среднем) Эффективная процедура обучения, отличная от сетей обратного распространения ошибки Возможность восстановления поврежденных данных Сложность внутреннего представления Сложность обучения многоуровневых сетей Дискретность значений элементов (отсутствует в непрерывных машинах Больцмана) ДостоинстваНедостатки
Выводы Были рассмотрены различные типы задач распознавания образов и методы их решения Была рассмотрена возможность применения машин Больцмана в системах распознавания образов По результатам сравнения эффективности алгоритмов было установлено, что глубокие машины Больцмана показывают высокую эффективность при решении такого типа задач