Исследование CBR (Case Based Reasoning) метода при автоматизированном проектировании информационных систем
Модифицированная спиральная модель ЖЦ программного продукта
Структура процессов управления проектом
9 групп процессов управления проектом БД интеграции БД управления БД управления БД управления управления проектом содержанием проекта сроками проекта рисками проекта Концептуальная структура интегрированной CBR машины СУ Знаниями Текстовые документыЭлектронные таблицы Методы представления знаний Продукционные правила Фреймы Семантические сети Исчисление предикатов Формирование тезауруса CBR машины ЛПР Формирование базы прецедентов Прецедент 1Прецедент 2Прецедент N Извлечение прецедентов из БП с помощью метода ближайшего соседа БП Система принятия решений Подсистема извлечения знаний ЛПР Подсистема представления знаний
Основные определения для формализации задачи СУ Знаниями(СУЗ) Определение тезауруса: тезаурусом называется конечное непустое множество Т слов t, отвечающих условиям: 1.имеется непустое подмножество, называемое множеством дескрипторов; 2.имеется симметричное, транзитивное рефлексивное отношение, такое, что: а) б) при этом отношение R называется синонимическим отношением, а слова, отвечающие этому отношению, называются синонимическими дескрипторами; 3. имеется транзитивное и несимметричное отношение, называемое обобщающим отношением. В случае если два дескриптора удовлетворяют отношению, то полагается, что дескриптор более общий, чем дескриптор. Определение подсистемы СУЗ: подсистемой СУЗ с тезаурусом называется четверка, где Т - тезаурус с дескрипторным множеством ; D - коллекция документов, соответствующая методу представления знаний; М - множество вопросов; - отображение, сопоставляющее каждому вопросу множество документов. Описание любого документа может быть представлено в виде и удовлетворяет условию: никакие два дескриптора не встречаются в одном t(d), если они удовлетворяют отношению К. Каждый вопрос представляется в форме, аналогичной описанию документов. Множество описаний вопросов и документов, частично упорядочено отношением включения следующим образом: т.е. каждый дескриптор из представляет собой обобщение дескриптора из или идентичен дескриптору из Отношение позволяет сформулировать ответ на вопрос в виде: Пусть - локальные системы извлечения знаний, где. Соединяя системы в одну систему S, которая будет называться CBR машиной, базирующейся на глобальном тезаурусе.
Структура БП
Метод "ближайшего соседа". Особенности: Простота использования полученных результатов. Решения не уникальны для конкретной ситуации, возможно их использование для других случаев. Целью поиска является не гарантированно верное решение, а лучшее из возможных. Позволяет провести более глубокий анализ данных, чем дерево решений. Данный метод не создает каких-либо моделей или правил, обобщающих предыдущий опыт.
Используется простое покоординатное сопоставление текущей ситуации с прецедентом (каждый параметр для описания прецедентов рассматривается как одна из координат). Таким образом, определяется расстояние D между текущей ситуацией и прецедентом, а также вычисляется максимальное расстояние D MAX с использованием границ диапазонов параметров для описания прецедентов. Затем вычисляется значение степени сходства: SIM = 1 – D/D MAX или в процентах SIM = (1 – D/D MAX ) 100%. Пусть прецеденты и текущая ситуация описываются только двумя параметрами: 1.пар 1 (диапазон изменения от 10 до 50); 2.пар 2 (диапазон изменения от 1000 до 5000). В БП имеются два прецедента: 1.П 1 : пар 1 = 30, пар 2 = 3500; 2.П 2 : пар 1 = 40, пар 2 = Для текущей ситуации (Цель) пар 1 = 20, а пар 2 = Рассмотрим координатную плоскость, выбрав в качестве одной оси координат пар 1, а в качестве другой оси координат пар 2. Цель имеет координаты (20, 3000), а прецеденты: 1.П 1 (30, 3500); 2.П 2 (40, 1500). Теперь рассчитаем расстояние от Цели до П 1 (D 1 ) и до П 2 (D 2 ): D 1 = ((20 – 30) 2 + (3000 – 3500) 2 ) 1/2 = 500,10; D 2 = ((20 – 40) 2 + (3000 – 1500) 2 ) 1/2 = 1500,13. Аналогичным образом вычисляется максимальное расстояние D MAX между точками с координатами (10, 1000) и (50, 5000) = 4000,20. Затем вычисляются значения степени сходства SIM текущей ситуации с двумя прецедентами из БП: 1.для П 1 : SIM 1 =(1 – D 1 /D MAX )=(1 – 500,10/4000,20)=0,8750 (87,50%); 2.для П 2 : SIM 2 =(1 – D 2 /D MAX )=(1 – 1500,13/4000,20)=0,6250 (62,50%).
Выводы Исследованы методы представления знаний. Разработана модифицированная спиральная модель ЖЦ программного продукта. Выполнена формализация постановки задачи синтеза интегрированной CBR машины. Разработана концептуальная структура интегрированной CBR машины. Разработаны требования к структурной организации БП. Полученные результаты могут быть положены в основу реализации CBR машины с целью обеспечения процесса создания конкурентоспособного программного продукта.