Генерация вероятностных автоматов методами Reinforcement Learning Выполнил: Иринёв А. В. Руководитель: Шалыто А. А.

Презентация:



Advertisements
Похожие презентации
Разработка методов совместного применения генетического и автоматного программирования Федор Николаевич Царев, гр Магистерская диссертация Научный.
Advertisements

Разработка методов совместного применения генетического и автоматного программирования Федор Николаевич Царев, гр Магистерская диссертация Научный.
Нейро-автоматное управление в машинном обучении Выполнил: Губин Ю.А. ст. гр Руководитель: Шалыто А.А. д.т.н, проф., зав. каф. ТП, СПбГУ ИТМО.
Построение автоматов управления системами со сложным поведением на основе тестов с помощью генетического программирования Федор Николаевич Царев, СПбГУ.
Применение метода представления функции переходов с помощью абстрактных конечных автоматов в генетическом программировании Царев Ф. Н. Научный руководитель.
Разработка методов совместного применения генетического и автоматного программирования Федор Николаевич Царев, гр Магистерская диссертация Научный.
Разработка методов совместного применения генетического и автоматного программирования Федор Николаевич Царев, гр Магистерская диссертация Научный.
Клеточно-автоматное моделирование волновых процессов в неоднородной среде Летняя школа по параллельному программированию 2010 Студенты: Риндевич К., Медянкин.
Автор: Вельдер С. Э., аспирант Руководитель: Шалыто А. А., доктор технических наук, профессор, заведующий кафедрой «Технологии программирования» Верификация.
1 Метод сокращенных таблиц для генерации автоматов с большим числом входных воздействий Автор Научный руководитель В. Н. Точилин А. А. Шалыто Санкт-Петербургский.
Использование автоматного программирования для построения систем управления мобильными роботами В. О. Клебан, А. А. Шалыто Кафедра компьютерных технологий.
Применение генетического программирования для реализации систем со сложным поведением Санкт-Петербургский Государственный Университет Информационных Технологий,
Моделирование поведения взаимодействующих агентов в среде с ограничениями Юданов А.А., студент 525 гр. Научный руководитель: к.ф.-м.н. Бордаченкова Е.А.
Разработка программного средства 3Genetic для генерации автоматов управления системами со сложным поведением Государственный контракт «Технология.
Разработка методов совместного применения генетического и автоматного программирования Федор Николаевич Царев, гр Магистерская диссертация Научный.
Разработка метода совместного применения генетического программирования и конечных автоматов Царев Федор Николаевич, гр Научный руководитель – докт.
Применение статической оптимизации. Теория личного потребления.
Автоматное программирование А. А. Шалыто Санкт-Петербургский государственный университет информационных технологий, механики и оптики 2009 г.
Моделирование и исследование мехатронных систем Курс лекций.
Применение автоматного программирования во встраиваемых системах В. О. Клебан, А. А. Шалыто Санкт-Петербургский государственный университет информационных.
Транксрипт:

Генерация вероятностных автоматов методами Reinforcement Learning Выполнил: Иринёв А. В. Руководитель: Шалыто А. А.

2 Стимулирующее обучение Среда Поощрение Агент

3 Вероятностные автоматы Моделирование сложных систем, имеющих стохастическую природу Построение мобильных агентов

4 Обучение автомата Действие Проверка «слабого условия» Перераспределение вероятностей

5 Применение стимулирующего обучения Работать непосредственно с вероятностной моделью непрактично Генерация автоматной модели

6 Q-learning: статические задачи Обучение Q-функции Порождение оптимальной стратегии

7 Q-learning: стохастические системы Обучение Q-функции Подсчёт вероятностей переходов Сжатие вероятностной модели

8 Пример задачи на двумерном поле Клетка поля определяет текущее состояние мобильного робота Четыре доступных действия Выделенные клетки Задача – максимизировать общую прибыль для нескольких мобильных роботов

9 Тестовый пример

10 Сжатие автоматной модели

11 Выводы Непосредственное обучение вероятностной модели непрактично Предложенный подход позволяет решать задачи оптимизации для стохастических систем В зависимости от специфики задачи возможно эффективное сжатие автоматной модели