Тема 3 Знания. Организация базы знаний. Часть 2 Преподаватель –Юлия Александровна Грачёва
Знания ФактыЭвристика
Знания ФактыПравила
Фактуальное знание это осмысленные и понятые данные. Данные сами по себе это специально организованные знаки на каком-либо носителе. Операционное знание это те общие зависимости между фактами, которые позволяют интерпретировать данные или извлекать из них информацию. Информация это новое и полезное знание для решения каких-либо задач.
В памяти ЭВМ знания представляются в виде некоторой знаковой системы. Экстенсионал знака - это его конкретное значение или класс допустимых значений. Интенсионал знака это его смысл, характеристика содержания, определяющий содержание связанного с ним понятия. Соответственно различают два типа знаний: экстерн- сигнальные и интенсигнальные.
Экстенсигнальные знания - это набор количественных и качественных характеристик различных конкретных объектов. Они представляются перечислениями объектов предметной области, экземпляров объектов, свойств объектов. Интенсигнальные знания - это совокупность основных терминов, применяемых в проблемной области, и правил над ними, позволяющих получать новые знания. Часто фактуальное знание называют экстернсиональным (предметным, детализированным), а операционное знание интенсиональным (проблемным, обобщенным).
Процесс извлечения информации из данных сводится к адекватному соединению операционного и фактуального знаний и в различных типах ИС выполняется по-разному. Самый простой путь их соединения заключается в рамках одной прикладной программы: Программа = Алгоритм (Правила преобразования данных + Управляющая структура) + Структура данных Таким образом, операционное знание (алгоритм) и фактуальное знание (структура данных) неотделимы друг от друга.
Интенсигнальные знания Декларатив- ные Процедураль- ные Метазнания
Декларативные знания отражают понятия проблемной области и связи между ними. Они не содержат в явном виде описания каких-либо процедур. Декларативные знания также называют понятийными, или концептуальными. Декларативные знания – это совокупность сведений о качественных и количественных характеристиках конкретных объектов, явлений и их элементов, представленных в виде фактов и эвристик.
Процедуральные знания описывают процедуры, т.е. указывают операции над понятиями, позволяющие получать новые понятия. Содержат описания процедур в явном виде. Процедуральные знания иногда также называют алгоритмическими. Процедуральные знания хранятся в памяти ИИС в виде описаний процедур, с помощью которых их можно получить. Процедуральные знания – это методы, алгоритмы, последовательности действий (в выбранной проблемной области), программы решения различных задач – они составляют ядро баз знаний.
Для описания знаний на абстрактном уровне разработаны специальные языки описания знаний. Они также делятся на языки процедурного и декларативного типов. Все языки описания знаний, ориентированные на использование традиционных компьютеров являются языками процедурного типа. Разработка удобных для представления знаний языков декларативного типа до сих пор является очень актуальной проблемой.
Метазнания - это знания об организации всех остальных типов знаний. Иначе они называются специальными. Они необходимы для управления БЗ и для эффективной организации процедур логического вывода. Метазнания содержат признаки декларативных и процедуральных знаний.
Обобщенная структура базы знаний, соответствующая приведенному выше разбиению знаний по типам
По своей природе знания делятся на декларативные и процедурные. Как информационно-смысловое понятие, знания классифицируют по таким признакам, как этимология (источник происхождения), степень определенности и степень отображения сущностных аспектов. По степени отображения сущностных аспектов того или иного объекта знания делятся на две категории: поверхностные и глубинные. Поверхностные знания основаны на частных результатах или опытах и свидетельствуют о лежащих на поверхности взаимосвязях между сущностями ПО.
Поверхностные знания не обязательно подтверждаются строгой теорией и, как правило, носят субъективный характер. Глубинные знания основаны на общепризнанной теории и строгой аксиоматике, отображающих структуру и природу сущностей ПО и закономерности их связей. Эти знания объясняют явления и могут использоваться для прогнозирования поведения объектов и более устойчивы, чем поверхностные.
По степени определенности знания принято делить на «жесткие» (определенные) и «мягкие» (расплывчатые). Определенные знания дают однозначные ответы на вопросы, которые могут возникнуть по поводу свойств сущностей ПО и характера отношений между ними. Расплывчатые знания на эти же вопросы дают, как правило, вариантные или неопределенные ответы.
По этимологии (источнику происхождения) различают знания концептуальные и экспертные. Концептуальные знания выражают свойства сущностей ПО и отношения между ними через описания базовых понятий конкретной ПО. Эти описания должны отражать понятийную и операционную часть каждого базового понятия. Экспертные знания основаны на знаниях высоко квалифицированного специалиста в конкретной предметной области, они часто носят характер оригинальных и субъективных.
Понятийная (декларативная) и операционная (процедурная) части экспертных знаний могут существенно отличаться от понятийной и операционной частей концептуальных знаний. Как правило, концептуальные и экспертные, жесткие и мягкие, глубинные и поверхностные знания используются совместно.
Форма представления знаний оказывает существенное влияние на характеристики ИИС. В интеллектуальных системах требуется четко разделить знания на те, которые предназначены для обработки компьютером, и знания, используемые человеком. При выборе модели представления знаний следует учитывать однородность их представления и простоту понимания. Однородность представления приводит к упрощению механизма управления знаниями. Простота понимания важна для пользователей интеллектуальных систем и экспертов, чьи знания закладываются в ИИС.
Если форма представления знаний будет трудна для понимания, то усложняются процессы приобретения и интерпретации знаний. Наиболее общими методами представления знаний в ЭС являются: правила, семантические сети, фреймы, либо комбинация перечисленных методов.
Способ представления знаний в виде правил наиболее понятный и популярный метод представления знаний. Правила обеспечивают формальный способ представления рекомендаций, знаний или стратегий. Они чаще подходят в тех случаях, когда предметные знания возникают из эмпирических ассоциаций, накопленных за годы работы по решению задач в данной области.
В ЭС, основанных на правилах, предметные знания представляются набором правил, которые проверяются на группе фактов и знаний о текущей ситуации (входной информации). Когда часть правила если удовлетворяет фактам, то действия, указанные в части то, выполняется. Когда это происходит, то говорят, что правило срабатывает. Интерпретатор правил сопоставляет части правил если с фактами и выполняет то правило, часть если которого сходится с фактами, т.е. интерпретатор правил работает в цикле "Сопоставить – выполнить", формируя последовательность действий.
Процесс сопоставления с фактами частей если порождает цепочку выводов. Эта цепочка выводов показывает как система, используя правила, выводит заключение. Цепочки выводов ЭС могут быть предъявлены пользователю, что помогает понять, как система достигает свои заключения.
По сравнению с другими способами представления знания, правила имеют следующие преимущества: модульность, единообразие структуры, естественность (вывод заключения в такой системе аналогичен процессу рассуждения эксперта), гибкость иерархии понятий, которая поддерживается только как связи между правилами (изменив правило, возможно изменить иерархию). Недостатки таких систем следующие: менее эффективный, чем при других способах представления процесс вывода и трудность управления этим процессом, а также сложность представления иерархии понятий.
Представление знаний в виде правил иногда называют плоским, так как в них отсутствуют средства для установления иерархии правил. На правилах основаны большинство существующих коммерческих ЭС, при этом правила могут быть представлены в одном из двух видов: Если в зависимости от возможных четких значений входных параметров делается вывод о значениях выходного параметра, то такая система называется системой L(1) -типа. Если в зависимости от возможных значений выходной ситуации (Вj) экспертом делается предположение о возможной входной ситуации (Аj), система экспертных высказываний называется системой L(2) – типа.
система L(1) –типа: где m – число экспертных высказываний; Aj – четкое значение входного параметра; Bj – четкое значение выходного параметра или некоторое конкретное действие процесса проектирования.
система L(2) –типа: где m – число экспертных высказываний; Aj – четкое значение входного параметра; Bj – четкое значение выходного параметра или некоторое конкретное действие процесса проектирования.
Представление знаний, основанных на фреймах, дает возможность хранить иерархию понятий в базе знаний в явной форме. Фреймом называется структура для описания стереотипной ситуации, состоящая из характеристик этой ситуации и их значений. Характеристики называются слотами, а значения – заполнителями. Слот может содержать не только конкретное значение, но и имя процедуры, позволяющей вычислить его по заданному алгоритму, а также одно или несколько правил, с помощью которых это значение можно найти. Располагающиеся в слоте процедуры называются связанными.
В слот может входить не одно, а несколько значений. Иногда слот включает компонент называемый фасетом, задающий диапазон или перечень его возможных значений. Пример. Пусть есть фрейм, содержащий данные о человеке и включающий слоты "Дата рождения" и "Возраст". В первом слоте содержится некоторое значение, а во втором слоте может стоять процедура, вычисляющая возраст по дате рождения и текущей дате. Здесь связанная процедура будет активизироваться при каждом изменении текущей даты.
Чаще всего используются следующие процедуры: "если – добавлено" – выполняется, когда новая информация помещается в слот; "если – удалено" – выполняется, когда информация удаляется из слота; "если – нужно" – выполняется, когда запрашивается информация из слота, а он пустой. Эти процедуры могут проверять, что при изменении значения производятся соответствующие действия.
Совокупность фреймов, моделирующая какую-нибудь предметную область – это иерархическая структура, в которую они соединяются. На верхнем уровне иерархии находится фрейм, содержащий наиболее общую информацию, истинную для всех остальных. Фреймы обладают способностью наследовать значения характеристик своих родителей, находящихся на более высоком уровне иерархии.
Значения характеристик могут по умолчанию передаваться фреймам, находящимся ниже них в иерархии. Но если низшие фреймы содержат собственные значения этих характеристик, то в качестве истинных данных принимаются именно они. Это обстоятельство позволяет легко учитывать во фреймовых системах различного рода исключения. Различают статические и динамические системы фреймов. В системах статических фреймы не могут быть изменены в процессе решения задачи, в динамических системах это допустимо.
Фреймовые системы представления знаний очень хороши, если связи между объектами изменяются нечасто и предметная область насчитывает немного исключений. Значения слотов представляются в системе в единственном экземпляре, включаемом только в один фрейм, описывающий наиболее общее понятие из всех, содержащих слот с данным именем. Такое свойство систем фреймов дает возможность уменьшить объем памяти, необходимый для их размещения в компьютере. Однако основное достоинство состоит не в экономии памяти, а в представлении в БЗ связей, существующих между понятиями предметной области.
Термин "семантическая сеть" используется для описания метода представления знания, основанного на сетевой структуре. Этот метод является одним из наиболее эффективных методов хранения знаний. Семантические сети состоят из: узлов, соответствующих объектам, понятиям и событиям, и дуг, связывающих узлы и описывающих отношения между ними. Иными словами, семантическая сеть отображает совокупность объектов предметной области и отношений между ними. При этом, объектам соответствуют вершины сети, а отношениям – соединяющие их дуги.
В семантическую сеть включаются только те объекты предметной области, которые необходимы для решения прикладных задач. В качестве объектов могут выступать события, действия, обобщенны понятия или свойства объектов. Вершины сети соединяются дугой, если соответствующие объекты предметной области находятся в каком-либо отношении.
Наиболее распространенными являются следующие типы отношений: "является" – означает, что объект входит в состав данного класса; "имеет" – позволяет задавать свойства объектов. Возможны также отношения вида: "является следствием" – отражает причинно- следственные связи; "имеет значение" – задает значение свойств объектов.
Свойства семантических сетей наследовать узлами более высокого уровня свойств узлов более низкого уровня, принято называть иерархией наследования. Принцип иерархии наследования позволяет исключать дублирование информации в семантических сетях. Основной недостаток такого способа представления знаний – сложность обработки исключений.