Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 12 лет назад пользователемtz2010.cosmos.ru
1 1 Биологически инспирированное техническое зрение в системах автономного искусственного интеллекта А.А. ЖДАНОВ профессор, д.ф.-м.н. Институт точной механики и вычислительной техники им. С.А. Лебедева (ИТМиВТ), Москва Autonomous Adaptive Control Lab (AAC Lab)
2 2 План 1.Неизбежность появления адаптивных машин 2.Метод Автономного Адаптивного Управления (ААУ) 3.Зрение в биологических и бионических системах управления 4.Демонстрация объектов с ААУ
3 3 1. Неизбежность появления адаптивных машин Создавая техногенную среду, мы повторяем – переоткрываем и воспроизводим многие «изобретения» природы. Следовательно, «бионическое» направление в технологиях очень важно.
4 4 Основные вклады науки в технологию 1.Количество (до XIX века) 2.Качество (XIX век) 3.Оптимальность (ХХ век) 4.Что дальше? - Адаптивность (XXI век) Адаптивность (динамическая оптимизация) с неизбежностью должна стать следующим шагом современной науки и технологии. Должен появиться новый вид объектов - адаптивные машины. Адаптивные машины постоянно осуществляют оптимизацию в режиме реального времени в изменяющихся условиях.
5 5 Адаптивность в природе В природе мы видим, что все объекты адаптивны, благодаря чему умеют решать самые сложные задачи управления: пилотирование, ходьба, балансировка, общение, погоня, навигация и т.д., и т.д.
6 6 Адаптивность в техносфере В техносфере мы видим полное отсутствие адаптивных (самоприспосабливающихся) объектов Наши машины рождаются сразу «взрослыми» и «умными», и в течение жизни ничему не учатся, постепенно разрушаясь
7 7 Сегодня адаптивных машин практически нет Видел ли кто-нибудь, как обучаются роботы? Никто не видел, так как роботы не обучаются, в отличие от живых организмов. Роботы работают по детерминированным программам.
8 8 Что такое «адаптивность» Определение Адаптивностью будем называть способность системы управления автономного объекта добывать знания о свойствах системы «среда- объект управления-система управления», накапливать эти знания в своей памяти и использовать эти знания для управления с целью дальнейшего их пополнения и сохранения накопленных знаний путем обеспечения физического выживания объекта, как носителя памяти и средств работы с нею.
9 9 Причины отсутствия адаптивных машин сегодня 1.Научные причины 2.Технологические причины 3.Психологические причины
10 10 Научные причины отсутствия адаптивных машин В технике сегодня господствуют детерминированные системы управления, основанные на априорной информации и математических моделях объектов ΔΩ M M max M min ΔΩ(t) M(t+1) Пример «закона управления» Типовая схема системы управления среда возмущающие воздействия X заказчик объект управления датчики система управления исполнители система распозна- вания M ΔΩ Ω целева я функци я
11 11 Детерминированные системы управления –реактивные, не способные к самообучению. К биологии отношения почти не имеют среда возмущающие воздействия X заказчик объект управления датчики система управления исполнители целевая функция система распозна- вания M ΔΩ Ω M M max M min ΔΩ(t) M(t+1) Типовая схема системы управленияПример «закона управления» Заказчик и целевая функция любые Результат априорных расчетов Все элементы есть результат априорных знаний и расчетов
12 12 Основные отличия от мозга: 1. Биологический «заказчик» и объект управления (тело) в Природе – это не разные сущности – это одно и то же. «Заказчик» сидит внутри ОУ и есть сам мозг. Отсюда следует, что важная целевая функция мозга – это выживание объекта управления. 2. Мозг не знает изначально и полностью оптимального закона управления, позволяющего выжить, он должен сам найти или уточнить «закон управления». Следовательно, другая целевая функция - поиск закона управления – поиск знаний. Отсюда следует, что мозг - во многих отношениях есть поисковая система. Свойства и среды и самого тела постоянно изменяются, поэтому поиск знаний должен происходить постоянно, т.е., мозг - система поисковой оптимизации. 3. Среда не есть только источник случайных возмущений, среда закономерна и мозг должен ее понять, чтобы в ней выжить. 4. Мозг и тело не могут быть неизменными. В результате накопления знаний содержимое памяти, морфология тела и морфология самого мозга должны изменяться. В силу ограниченности памяти и поисковых алгоритмов.
13 13 Задача поиска закона управления и принятия решений в общем виде Все элементы «закона управления» должны быть найдены в процессе филогенеза видом и в процессе онтогенеза – мозгом каждого индивида Ω M Ωi(t)Ωi(t) M(t+1) искать и формировать новые образы искать новые действия Ω r – формировать образы результатов и их эмоциональные оценки формировать образы исходных состояний формировать и оптимизировать действия формировать и оптимизировать признаковое пространство Как мозг все это нашел, ищет и изменяет?!
14 14 Задача поиска закона управления и принятия решений в общем виде Ω M Ωi(t)Ωi(t) M(t+1) искать и формировать новые образы искать новые действи я Ω r – формировать образы результатов и их эмоциональные оценки формировать образы исходных состояний формировать и оптимизировать действия формировать и оптимизировать признаковое пространство Технических систем управления в таком виде нет ни в теории, ни на практике (кроме системы ААУ) Ω M Ωi(t)Ωi(t) M(t+1) искать и формировать новые образы искать новые действи я Ω r – формировать образы результатов и их эмоциональные оценки формировать образы исходных состояний формировать и оптимизировать действия формировать и оптимизировать признаковое пространство
15 15 Мозг, как объект изучения, морфологически очень сложен (10 11 нейронов, межнейронных связей). Без понимания принципов работы с информацией, принципов распознавания, управления, понять работу мозга только с помощью исследования его материальных реализаций, наверное, невозможно. Биологам понять принципы работы мозга очень трудно, потому что:
16 16 В биологии господствует понимание процесса управления в виде рефлекторной дуги с модуляцией афферентный нейрон моторный нейрон вставочные нейроны модулирующий нейрон рецептор мышца или железа - понятие, маскирующее целый комплекс сложных проблем целеполагания, самообучения, принятия решений и т.д. - реактивная схема управления «стимул- реакция»
17 17 Некоторые понятия ФС сегодня могут быть уточнены и конкретизированы Функциональная система П.К. Анохина (1930-х гг.) Понятие «афферентного синтеза» раскрывается понятиями из теории систем распознавания образов: множество измерителей, признаковое пространство, рабочий словарь признаков, правила формирования образов, алфавит классов, описание классов на языке признаков, решающие правила, а также программа управления процессом распознавания. «Доминирующая мотивация» - это текущая возможность (согласно Базе Знаний) вытеснить распознанные образы с наихудшими оценками, либо вызвать распознавание образов с положительными оценками. «Принятие решений» - в теории ФС не раскрывается. «Акцептор результата действия» - представляется излишним, так как не отличается по функциям от входной системы распознавания. В схеме ФС отсутствует такая важнейшая подсистема как База Знаний – память, в которой накапливается добытая системой управления статистически достоверная информация о причинно-следственных связях в системе «объект-среда». Сопоставление системы ААУ с ФС П.К. Анохина, ориентированной на биологические системы, может оказаться весьма полезным, так как может обогатить обе теории.
18 18 Функция мозга в системе «среда – организм» Отсюда следуют: целевые функции мозга перечень решаемых задач состав и структура его основных подсистем моз г тело с р е д а 2. Система Автономного Адаптивного Управления (ААУ) - концептуальная модель мозга
19 19 Жданов А.А. Автономный искусственный интеллект. Монография. М.: БИНОМ. Лаборатория знаний, Изд-е 2-е: 2009.
20 20 Состав подсистем мозга и их структура Выделены и смоделированы: необходимые функциональные подсистемы мозга необходимые виды памяти Система управления (мозг) Память распознанных образов Память выбранных действий Память текущих эмоциональных оценок общего состояния ОУ Оперативная память оценок действий Память образов База Знаний Память совершенных действий Подсистема формирования и распознавания образов Подсистема формирования БЗ Подсистема принятия решений Подсистема эмоций Подсистема определения времени принятия решений Память эмо – циональных оценок образов сенсоры исполнители Образы Ω M Ωi(t)Ωi(t) M(t+1) Действия Качественные оценки Закон управления
21 21 Объекты: T – набор датчиков, X – вектор входной информации, R a – набор априорных правил формирования образов, Ω – алфавит классов (память образов), {Ω i (t)} – множество распознанных в текущий момент образов, {S i (t)} – множество эмоциональных оценок распознанных образов, S – память эмоциональных оценок образов, S(t) – интегральная эмоциональная оценка текущего состояния, { } - База Знаний, ΔT (t) – интервал времени на принятие решения, M k (t+1) – принятое решение – управляющее воздействие, K a – набор априорных правил формирования знаний, Rnd – генератор случайных воздействий, необходимый для обеспечения поиска, L – исполнительные устройства. T X RaRa {Ω i (t)} Ω {S i (t)} { } Rnd , 9 6 SLSL KaLKaL 11 M k (t+1)L ΔT (t) S(t) Создано формализованное описание работы предложенной модели мозга Операции: 1 – измерения и перевод физических воздействий в цифровой вид, 2 – распознавание образов, 3 – формирование новых образов – алфавита классов, 4 – формирование Базы Знаний, 5 – извлечение из памяти эмоциональных оценок распознанных образов, 6 – вычисление интегральной эмоциональной оценки текущего состояния объекта управления, 7 – обмен информацией с памятью эмоциональных оценок образов, 8 – вычисление времени, отведенного на принятие решения, 9 – принятие решения, 10 – использование генератора случайных воздействий при необходимости выбора из равнозначных вариантов, 11 – формальный вывод новых знаний по БЗ и на основе набора априорных правил формирования знаний, 12 – передача принятого решения исполнительным устройствам, 13 – обратная связь от исполнительных устройств к датчикам через тело объекта управления и окружающую среду.
22 22 Идея адаптивного управления Среда с закономер- ными свойствами Множество Образов явлений, состояний и т.д. Отображение при наблюдении образ оценки явление действие Множество действий Множество качественных оценок образов Знания Принятие решений Образы состояния Образ действия m Образ действия k Действие j Образ результатов n Образ результатов m Образ результатов k Образы результатов j момент tмомент t+1момент t+2 S j S k S m S n Качественные оценки Не аналитические модели ОУ, а эмпирически найденные отображения между дискретными множествами информационнных объектов
23 23 3. Машинное зрение – отображение явлений, необходимых для принятия решений – самообучаемая система распознавания образов Память образов – алфавит классов Реальность Аппаратная функция = Множество образов ( 1, 2, … N ) Правило формирования образов – выявление неслучайных, повторяющихся явлений, либо явлений, связанных с сильной эмоцией Разные живые организмы видят одну и ту же сцену по-разному. «Правильное» восприятие – то, которое позволяет эффективно управлять. так удобно видеть человеку так удобно видеть математику так удобно видеть роботу Множества образов, сформированных в разных головах, но представленных одинаковыми нервными импульсами. y=dx/dt
24 24 Машинное зрение – отображение явлений, необходимых для принятия решений Множество дискретных образов Отображение при наблюдении образпрообраз Среда с закономер- ными свойствами «Правильность» образов, действий и оценок проверяется возможностью их использования для управления Образ & Действие Образы закономерного результата Эмоциональная оценка Среда с закономер- ными свойствами Множество Образов явлений, состояний и т.д. Отображение при наблюдении об ра з оценк и явлен ие дейст вие Множество действий Множество качественных оценок образов Знания Принятие решений
25 25 Принципы реализации основных подсистем системы ААУ на основе нейронных элементов и структур Предложены и смоделированы: модель нейрона свойства сетей из таких нейронов способы построения всех подсистем из таких нейронов проверка структурного правила и средства помехозащи щенности проверка статистического правила долговременная память принятие решения о генерации выходного сигнала генерация выходного сигнала обратной связи входной сигнал обратной связи Модель нейрона в методе ААУ в общем виде Нейрон понимается нами не как пороговый сумматор, а как элементарная самообучаемая система распознавания
26 26 Свойства самообучаемой системы распознавания образов на основе моделей нейронов в методе ААУ Пример работы фрагмента сети подсистемы формирования и распознавания образов Нейрон, отвечающий за образ конкретного явления прообраз образа обучениераспознавание образ Пример работы фрагмента сети подсистемы формирования и распознавания образов Датчики, вместе с прилегающей к ним сетью нейронов, составляют систему распознавания
27 27 Пример упреждающего распознавания образа – эффект предсказания образ явления распознался раньше его окончания – с предсказанием прообраз протяженного явления
28 28 Модель работы мозга – система «Автономного Адаптивного Управления» Пример обучения, запуска и останова программы, управляющей периодическим процессом – например, ходьбой.
29 29 Самообучаемая распознающая нейроноподобная система мобильного робота Гном 9 состоит из 3-х слоев нейронов ААУ и моделирует 3-слойную сеть сетчатки глаза Самообучаемая система распознавания мобильного робота «Гном 9» самостоятельно формировала образы разных типов препятствий: «стенка», «край стенки слева», «край стенки справа», «ворота» и т.п. И затем распознавала их. Самообучаемый мобильный робот Гном 9 (внизу слева)
30 30 Учет синаптических задержек в модели нейрона Прообраз пространственного явления Прообраз причинно- следственного явления Образы пространственно- временных явлений Прообраз периодического явления время
31 31 Биологические сенсоры Датчики, вместе с прилегающей к ним сетью нейронов, составляют систему распознавания Производные более высоких порядков рецепторные клетки регистрировать не могут, так как у них нет достаточной памяти. Поэтому более высокие производные «вычисляются» последующими нейронами. Такая сеть нейронов может распознать образы очень сложных явлений. b)a) t Внешнее раздражение «Тонический» рецептор Импульсация клетки «Фазический» рецептор регистрируют x(t) регистрируют dx(t)/dt
32 32 Все подсистемы системы ААУ (т.е., весь мозг) могут быть построены на «логическом базисе» разработанной модели нейрона и синапсов База Знаний Это самообучаемые подсистемы: распознавания, база знаний, аппарат эмоций, подсистема принятия решений и некоторые другие. Образы состояния Образ Действие m Образ Действие k Действие j Patterns of results n Patterns of results m Patterns of results k Образы результата j moment t-2moment t-1moment t Эмоциональные оценки Элементарное знание
33 33 Оптимизация нейроноподобных подсистем с помощью генетических алгоритмов Разработанная методика оптимизации основных подсистем на основе генетических и других алгоритмов частично воспроизводит оптимизацию в филогенезе и онтогенезе «Мутации» полей зрения визуальных датчиков мобильного робота в процессе оптимизации Оптимизированные генетическим алгоритмами распознающие нейроноподобные сети мобильного робота
34 34 4. Примеры прототипов прикладных адаптивных систем на основе метода ААУ - машины с искусственными нервными системами
35 35 Модель работы мозга – система «Автономного Адаптивного Управления» Разработаны программные и физические модели машин с адаптивными системами управления (искусственными нервными системами) на основе метода ААУ Адаптивный мобильный робот, способный самообучаться безаварийному движению в среде и выполнению полезной работы – сборке определенного мусора Адаптивный наноспутник, способный самообучаться управлению своим телом (учится стабилизироваться в пространстве) Примеры моделей адаптивных машин Все такие машины демонстрируют различные свойства, подобные живым организмам
36 36 The control quality increases as the Knowledge Base accumulates the empirical knowledge RussianSpaceAgency PILOT System - the adaptive system of angular motion stabilization of space satellite Empirical Knowledge Base Controlled Process
37 37 Компьютерная модель мобильного робота с 3-уровневой системой автономного адаптивного управления
38 38 AdCAS System – Adaptive Control of Active Car Suspension The car suspension has to have an active actuator. Then the AAC accumulates empirical knowledge about properties of given car and controls the system by means clever pushes. Active high pressure shock absorber force pressure or shock absorber with magneto- reological fluid (MRF) AdCAS system increases the comfort, stability and controllability of the car Empirical Knowledge Base Obstacle on the road Smooth motion of the car body under control Control pulses to actuator ISP RAS Without control
39 39 Несколько критических замечаний в отношении общепринятого понимания процесса управления Память распознанных образов Память выбранных действий Память текущих эмоциональных оценок общего состояния ОУ Оперативная память оценок действий Память образов База Знаний Память совершенных действий Подсистема формирования и распознавания образов Подсистема формирования БЗ Подсистема принятия решений Подсистема эмоций Подсистема определения времени принятия решений Память эмо – циональных оценок образов сенсоры исполнители Экспертная Система База Знаний Подсистема принятия решений Известные нам системы управления обычно являются частными случаями рассмотренной системы ААУ Например, «экспертная система» - это заранее заполненная база знаний и подсистема принятия решений
40 40 Несколько критических замечаний в отношении общепринятого понимания процесса управления Например, нейросетевая система управления - это когда удалено все, кроме заранее обученной системы распознавания. И т.п. Память распознанных образов Память выбранных действий Память текущих эмоциональных оценок общего состояния ОУ Оперативная память оценок действий Память образов База Знаний Память совершенных действий Подсистема формирования и распознавания образов Подсистема формирования БЗ Подсистема принятия решений Подсистема эмоций Подсистема определения времени принятия решений Память эмо – циональных оценок образов сенсоры исполнители Управление на основе ИНС Распознающая ИНС
41 41 Технологические причины отсутствия адаптивных машин сегодня Все технологические процессы сегодня основаны на оптимизационных идеях. Проблемы адаптивности обходятся на этапе проектирования систем, которые приспосабливаются к усредненным условиям эксплуатации. Инженеры сегодня не знают о возможности создания адаптивных систем и машин и не умеют их делать.
42 42 Психологические причины отсутствия адаптивных машин 1.Рынок не сформирован, так как пока нет спроса. Никто не знает о возможности адаптивных машин и не спрашивает их в магазинах. 2.Психологически будет трудно приспособиться к появлению адаптивных машин 3.В некоторых отношениях человеку приятнее приспосабливаться самому, чем видеть, как вещи приспосабливаются к нему. 4.Однако появление адаптивных машин – систем автономного искусственного интеллекта неизбежно и специалисты уже понимают это.
43 43 Спасибо за внимание! Жданов Александр Аркадьевич профессор, д.ф.-м.н., главный научный сотрудник, «Институт точной механики и вычислительной техники имени С.А. Лебедева»
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.