ОЦЕНКА СКОРОСТИ И ЭФФЕКТИВНОСТИ ЭВОЛЮЦИИ ДЛЯ ПРОСТЫХ ВАРИАНТОВ ГЕНЕТИЧЕСКОГО АЛГОРИТМА Редько В.Г. НИИ системных исследований РАН, vgredko@gmail.com Цой.

Презентация:



Advertisements
Похожие презентации
Моделирование взаимодействия между обучением и эволюцией НИИ системных исследований РАН Редько Владимир Георгиевич
Advertisements

ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ Область применения 1.Нахождение экстремумов функций 2. Решение задач размещения ресурсов 3. Решение задач экономического планирования.
ОДИН СПОСОБ ВЫЧИСЛЕНИЯ ВРЕМЕНИ СМЕШИВАНИЯ ДЛЯ ГЕНЕТИЧЕСКИХ ОПЕРАТОРОВ СКРЕЩИВАНИЯ * Цой Ю.Р Кафедра вычислительной техники, Томский политехнический университет.
ГЕНЕТИЧЕСКИЙ АЛГОРИТМ НАСТРОЙКИ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ Конференция «Технологии Microsoft в информатике и программировании», февраля 2004г.
Цой Ю.Р., Спицын В.Г. К выбору размера популяции Интеллектуальные системы (AIS04), Россия, Дивноморское, 3-10 сентября, 2004г. К ВЫБОРУ РАЗМЕРА ПОПУЛЯЦИИ.
Принцип детального равновесия. Алгоритм Метрополиса. Эргодические схемы. Марковские цепи 2.4. Марковские цепи. Принцип детального равновесия.
Разработка методов машинного обучения на основе генетических алгоритмов и эволюционной стратегии для построения управляющих конечных автоматов Второй этап.
Заглавие Статистическое моделирование в задачах регионального переноса атмосферных примесей.
Применение генетического программирования в задаче поиска усердных бобров Д. О. Соколов, П.В. Федотов, Ф. Н. Царев Научный руководитель – А. А. Шалыто.
МЕТОДЫ ЭКСПЕРИМЕНТАЛЬНОЙ ОПТИМИЗАЦИИ. Метод деления отрезка пополам Метод позволяет исключать на каждой итерации в точности половину интервала. Иногда.
Л АБОРАТОРНАЯ РАБОТА 6 Тема: Численные методы решения задачи Коши для обыкновенных дифференциальных уравнений.
ТРЕХЭТАПНАЯ ОБРАБОТКА ЦИФРОВЫХ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ ЭВОЛЮЦИОНИРУЮЩИХ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ* Цой Ю.Р., Спицын В.Г. Кафедра вычислительной.
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
Понятие о методах Монте-Карло. Расчет интегралов 2.5. Расчет интегралов методом Монте-Карло.
Математические модели Динамические системы. Модели Математическое моделирование процессов отбора2.
Моделирование и исследование мехатронных систем Курс лекций.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Визуализация данных Визуализация данных Точечные оценки Точечные оценки Групповые характеристики Групповые характеристики Метод.
Функция Ляпунова для моделей химической кинетики.
Решение задачи диффузии, зависящей от времени. Рассмотрим простейшее уравнение в частных производных параболического типа, описывающее процесс диффузии.
1 Применение методов искусственного интеллекта в разработке управляющих программных систем. Первый этап Разработка, программная реализация и экспериментальное.
Транксрипт:

ОЦЕНКА СКОРОСТИ И ЭФФЕКТИВНОСТИ ЭВОЛЮЦИИ ДЛЯ ПРОСТЫХ ВАРИАНТОВ ГЕНЕТИЧЕСКОГО АЛГОРИТМА Редько В.Г. НИИ системных исследований РАН, Цой Ю.Р. Томский политехнический университет,

План Необходимость оценок эффективности генетического алгоритма (ГА) Модель квазивидов – ГА с рулеточным отбором Роль нейтрального отбора Оценка скорости эволюции в модели квазивидов Проверка оценок численным расчетом Модель узкого канала Спин-стекольная модель эволюции n общ ~ N 2Итог: при эволюционном поиске требуется расчет функции приспособленности для n общ ~ N 2 особей

Необходимость оценок эффективности генетического алгоритма (ГА) Количественные скорости и эффективности ГА важны с инженерной точки зрения. Оценки целесообразно сделать для канонической модели, непосредственно связанной с биологическим прототипом. В качестве такой модели рассматривается модель квазивидов.

Модель квазивидов – эволюция простейших модельных геномов М. Эйген, Г. Кун, Дж. Эдельман Рассматривается дарвиновская эволюция популяции модельных геномов. Длина генома равна N, учитываются точечные мутации, скрещивания нет. Имеется один оптимум. Рассматривается процесс, который сходится к квазивиду – распределению особей в окрестности оптимума. Согласно нашим аналитическим оценкам, в эволюционном процессе «оптимальный» геном длины N можно найти при испытании порядка N 2 особей. Оценки проверены путем компьютерного моделирования.

Модель квазивидов Рассматривается дарвиновская эволюция популяции последовательностей S 1, S 2,..., S n. S ki = 1, -1; k = 1,2,…, n; i = 1,2,…, N. Длина последовательностей N и численность популяции n велики: N, n >> 1. N = const, n = const. Имеется оптимальная последовательность S m, имеющая максимальную приспособленность. Оптимальная особь неизвестна особям популяции. Приспособленность про- извольной особи S определяется расстоянием по Хеммингу (S, S m ) между S и S m (числом несовпадающих символов в соответствующих позициях последовательностей): f(S) = exp[- (S, S m )], (1) – интенсивность отбора.

Схема эволюции в модели квазивидов Шаг 0. Формирование начальной популяции {S k (0)}. Для каждого k = 1,..., n, и для каждого i = 1,..., N, выбираем случайно символ S ki, полагая его равным +1 либо -1. Шаг 1. Отбор Подшаг 1.1. Расчет приспособленностей. Для каждого S k из {S k (t)} вычисляем величину f(S k ), t – номер поколения, k =1,..., n. Подшаг 1.2. Формирование новой популяции {S k (t+1)}. Отбираем n особей в новую популяцию {S k (t+1)} с вероятностями, пропорциональными f(S k ). Шаг 2. Мутации особей в новой популяции. Для каждого k = 1,..., n, для каждого i = 1,..., N, меняем знак S ki (t+1) на противоположный с вероятностью P. P - интенсивность мутаций.

Отбор пропорционально-вероятностный Доля k-го сектора рулетки q k = f k [ l f l ] -1, f k = f(S k ). Ровно n раз крутим рулетку, номер сектора определяет номер особи, выбираемой в популяцию следующего поколения. Для каждого вращения вероятность k-й особи попасть в следующее поколение пропорциональна ее приспособленности f k. Показан пример, для которого n = 4, f 1 = 1/2, f 2 = 1, f 3 = 1/4, f 4 = 1/4.

Параметры модели N - длина последовательности, длина генома n - численность популяции - интенсивность отбора P - интенсивность мутаций N, n >> 1, >~ PN, 1 >~ PN

Качественная схема эволюции N = 500, n = N, =1, P = 0,002

Качественная схема эволюции Начальное распределение по в популяции близко к нормальному, = N/2, D = N/4. На первой стадии происходит отбор особей, расположенных "на левом крыле" исходного распределения, и распределение сжимается. На второй стадии появление новых особей в популяции ограничено мутациями. Окончательное распределение есть квазивид - распределение в окрестности = 0. При малых интенсивностях отбора и мутаций (1 >> > PN) распределение в квазивиде близко к распределению Пуассона, = D = PN/.

Роль нейтрального отбора Если численность популяции n достаточно мала, то эволюционный процесс существенно стохастический и особи могут фиксироваться в популяции случайно, независимо от их приспособленностей. Роль нейтрального отбора исследовалась в работах М. Кимуры [1], было показано, что характерное время T n (число поколений) нейтрального отбора составляет порядка численности популяции n, T n ~ n. 1. Кимура М. Молекулярная эволюция: теория нейтральности. М.: Мир, 1985, 400 с.

Чисто нейтральная игра 1. Имеется популяция черных и белых шаров, общее количество шаров в популяции равно n. 2. Эволюция состоит из последовательности поколений. Каждое поколение состоит из двух шагов На первом шаге дублируем все шары, сохраняя их цвета: черный шар имеет два черных потомка, белый шар имеет два белых потомка На втором шаге мы случайным образом (независимо от цвета) удаляем из популяции ровно половину шаров. Игра определяет марковский процесс, для которого показано, что: 1) рассматриваемый процесс всегда сходится к одному из поглощающих состояний: все шары белые, либо все шары черные. 2) при больших n характерное число поколений T n, требуемое для сходимости к какому-либо из поглощающих состояний, равно 2n.

Чисто нейтральная игра

Популяция находится в l -состоянии, если число черных и белых шаров равны l и n - l. Вероятности переходов P lm есть: Матрица P lm задает Марковский процесс, для которого известно, что при больших n характерное время сходимости T n к какому-либо из поглощающих состояний равно 2n : T n = 2n.

Качественная схема эволюции Для оценки скорости эволюции важна вторая, медленная стадия t 1 < t 2 < t 3

Аналитическая оценка скорости эволюции Предполагаем, что роль нейтрального отбора невелика: T n >~ T, (2) T - характерное время эволюции, T n ~ n. Характерное время t -1, за которое среднее по популяции расстояние до оптимума уменьшается на 1, составляет: t -1 ~ t м + t от, t м ~ (NP) -1, t от ~ -1 t м – характерное время мутаций, t от - характерное время отбора. Отсюда для T ~ t -1 N имеем: T ~ P -1 + N -1. (3) Считаем отбор достаточно интенсивным: T ~ P -1 и мутации «оптимальными» (одна мутация на геном) P ~ N -1. Тогда T ~ N. Пусть (2) выполняется на пределе T n ~ T, тогда n ~ T n ~ T ~ N. n общ = n T ~ N 2 Общее число особей, участвующих в эволюции, равно n общ = n T ~ N 2

Итог оценок для модели квазивидов n общ = n T ~ N 2. Для эволюционного поиска общее число особей, участвующих в процессе поиска оптимального генома, составляет n общ = n T ~ N 2. Оценки были сделаны при достаточно разумном выборе параметров: 1) >~ 1 - интенсивность отбора достаточно велика. 2) P ~ N -1 - мутации «оптимальны» (одна мутация на геном). 3) n ~ N - условие пренебрежения нейтральным отбором выполняется «на пределе».

Зависимость среднего расстояния до оптимума от номера поколения (n = N, P = N -1, = 1)

Зависимости времени релаксации T R, времени выхода на стационар T S и времени первого нахождения оптимума T O от N

При достаточно больших N имеем: T R (N) = k R N + T R0 T S (N) = k S N + T S0 T O (N) = k O N + T O0, k R = , k S = , k O = T R0 = , T S0 = , T O0 = Аналитическая оценка T ~ N

Сравнение с другими алгоритмами n общ = n T ~ N 2. Для модели квазивидов общее число особей, участвующих в процессе поиска оптимального генома, составляет n общ = n T ~ N 2. Для последовательного поиска (последовательный перебор символов одной последовательности) n общ = N. Для случайного перебора n общ = 2 N.

Модель «узкого канала» (мажорирующая модель) Имеется N типов особей: s k, k = 1,..., N. Особь k-го типа может в результате мутации перейти только в особь k-1-го типа и в особь k+1-го типа (узкий канал). Вероятность любой из этих мутаций равна P 1. P 1 можно рассматривать как аналог однократной мутации в модели квазивидов P 1 ~ NP. Приспособленность особей k-го типа равна f k = exp (- k). Численность популяции равна n. Организуем эволюционный процесс точно так же, как в модели квазивидов. В результате задача упрощается: нет необходимости учитывать информационную структуру последовательностей.

Расчет по модели узкого канала n общ ~ N 2. Зависимость среднего по популяции расстояния до оптимума, для модели квазивидов и мажорирующей модели, N = n = 1000, P = P 1 = 0,001, = 1, T ~ N, n общ ~ N 2.

Модель спинового стекла Рассматривается система N спинов: S = S 1,S 2,...,S N ; S i = 1, -1; N >> 1. Энергия системы S есть: E (S) = - i

Эволюционная модель поиска минимума энергии спинового стекла Приспособленность особи S k определяем как: f(S k ) = exp[- E(S k )].(7) Эволюционный процесс строим так же, как и в модели квазивидов. Удаление средней энергии от глобального минимума порядка N, а вариация энергии при мутации S i - S i порядка 1, следовательно, оценки скорости и эффективности для спин-стекольной модели по порядку величины такие же, как для модели квазивидов. Единственное отличие: эволюция сходится к одному из достаточно глубоких локальных минимумов энергии E L, который может быть разным для различных реализаций эволюционного процесса.

Качественная схема эволюции Динамика распределения последовательностей n(E) и n(ρ); E 0 и E L – глобальный и локальный минимумы энергии

Оценка скорости и эффективности для модели спинового стекла n общ ~ N 2. Так как удаление средней энергии от глобального минимума порядка и вариация энергии при мутации S i - S i порядка 1, того же порядка, что и для модели квазивидов, то для спиновых стекол также T ~ N, n общ ~ N 2. Ранние расчеты (1980-е годы) показали, что эволюция сходится к одному из локальных минимумов энергии E L, для которого |E L - E 0 |

Выводы Для модели квазивидов и близких к ней моделей узкого канала и спинового стекла можно подобрать параметры моделей так, что справедливы оценки: T~ N Число поколений составляет T ~ N. n общ = n T ~ N 2. Общее число особей, участвующих в процессе поиска оптимального генома, составляет n общ = n T ~ N 2. Выбор параметров: 1) >~ 1 - интенсивность отбора достаточно велика. 2) P ~ N -1 - мутации «оптимальны» (одна мутация на геном). 3) n ~ N - условие пренебрежения нейтральным отбором выполняется «на пределе».

Основная литература: Редько В.Г. Эволюция, нейронные сети, интеллект: Модели и концепции эволюционной кибернетики. Серия «Синергетика: от прошлого к будущему». М.: УРСС, Редько В.Г., Цой Ю.Р. Оценка эффективности эволюционных алгоритмов // Доклады АН, Т N. 3. С