Операции унифицированной технологии построения цифровых пространств знаний
Пространства знаний Концептуальные пространства знаний – общие модели отражающие разнообразные представления о многообразиях знаний в предметных областях и средствах работы со знаниями. Цифровые пространства знаний - информационные системы, содержащие в структурированном и связном виде знания предметных областей, поддерживающие процессы их приобретения и практического использования. Абстрактные пространства знаний – формальные модели, позволяющие изучать свойства многообразий идеальных знаний с помощью математических инструментов.
ПРОБЛЕМАТИКА И ЦЕЛИ РАБОТЫ ЦЕЛИ 1. Разработка унифицированного, универсального, теоретически обоснованного формализма абстрактного пространства знаний. 2. Построение языка и эффективной технологии построения моделей пространств знаний и их трансформации в программно реализуемые модели. ФУНДАМЕНТАЛЬНАЯ ПРОБЛЕМА Создание научных основ для современных моделей многообразий знаний исследование информационных технологий и методов работы со знаниями
АБСТРАКТНОЕ ПРОСТРАНСТВО ЗНАНИЙ
1. Множество объектов, представляющих отдельные абстрактные знания, бесконечное и вычислимое. 2. Абстрактным знаниям эффективно сопоставляются их структурные представления. 3. На множестве абстрактных знаний определяются разрешимые отношения, позволяющие оценивать сходство и различие структурных представлений знаний. 4. Операции над знаниями, а также процессы пространств знаний моделируются специальными классами вычислимых отображений (морфизмов) и процессов. ОСНОВЫ ФОРМАЛИЗАЦИИ
1. Семантическое пространство Семантическое пространство - алгебраическая система = (R, O, C), где : 1.R бесконечное вычислимое множество разрешимых бинарных отношений на M, содержащее отношения E = и T = R R. 2. O множество операций на, включающее объединение, пересечение, обращение, произведение и композицию 3. С множество логических операций, для которого отношение 1 вложения элементов R является разрешимым. Пусть M - бесконечное вычислимое множество конфигураций, содержащее пустую конфигурацию.
2. Пространства конфигураций z, z 1z 1 (z) : M M M - декомпозиция : : M R - связывание Определение Декомпозицией конфигураций из M называется пара d = (, ), где и являются отображениями разложения и связывания конфигураций. Определение Пространством конфигураций называется всякая пара М = (M, d), для которой 1. M – бесконечное вычислимое множество конфигураций; 2. d – декомпозиция элементов M. z 2z 2 (z) = (z 1, z 2 )
Структурные представления конфигураций ((z) ) = (z 1, z 2 ) ПСП конфигураций ПАП конфигураций (z) [z] D(z) – все вершины O(z ) – все висячие вершины дерева [z] (( z )), если D(z) \ O (z) [ z ] = ( z ), если O (z) [z] d z 1, z 2 ([z] ) = [ z ] 0 ([z] ) = [ z ]
Трассирования К – трассирования ( = ) О - трассирования ( = ) с - трассирования ( = = ) р - трассирования Определение Изотонное отображение : I I называется трассированием конфигурации z 1 в конфигурацию z 2, если: 1. D ( z 1 ) ( D( z 1 ) \ О ( z 1 ) ( ) D( z 2 ) \ О( z 2 )); 2., D( z 1 ), { 0, 1 }, I (( ( ) ( )) ( ) ( ) ). 3. Сравнения конфигураций
Определение. Конфигурация z 1 I -трассируется в конфигурацию z 2 (z 1 I z 2, I { о, р, с, }), если существует такое I трассирование : I I, z 1 в z 2, что: 1. O( z 1 ) (( z 1 ) 0 ( z 2 ) ( ) ); 2. D( z 1 ) \ O(z 1 ) ( [ z 1 ] 1 [z 2 ] ( ) ). Определение. Конфигурация z 1 I –вложена, I { о, р, с, к }, в конфигурацию z 2 ( z 1 I z 2 )), если z 1 ( z 1 ), z 2 ( z 2 ) ( z 1 I z 2 ). Определение. Конфигурации z 1 и z 2 эквивалентные в отношении I - вложения, если z 1 I z 2 и z 2 I z 1.
Операции над формализованными знаниями моделируют универсальную систему этапов жизненных циклов знаний. Универсальность системы операций для пространств знаний может рассматриваться в содержательном и точном смыслах. Во втором случае используются формальные критерии, позволяющие определять полную систему классов операций, согласованную с содержательными представлениями. Одним из таких критериев является монотонность относительно трассирований или вложений. 4. Морфизмы пространств знаний Основные форматы операций: f : M * M * M *; f : M M ; f : M M * ; f : M * R
Селектирующие морфизмы Фильтрующие Булевские Произведения Разности Пересечения Объединения Селектирующие морфизмы Данный класс составляют аналоги теоретико-множественных операций: морфизмы пересечения, объединения и разности, произведения и фильтры.
1. Морфизм : M* M* M* называется пересечением, если V 1, V 2 M* V M* (V V 1 & V V 2 V (V 1, V 2 )). 2. Морфизм : M* M* M* называется объединением, если V 1, V 2 M* V M* ((V V 1 V V 2 ) V (V 1, V 2 )). 3. Морфизм : M* M fin M* называется разностью, если V 1, V 2 M*( (V 1, V 2 ) = { z z M & {z} V 1 & {z} V 2 } ) Морфизм : M* M* называется фильтром, если V 1, V 2 M*( (V 1 V 2 ) = (V 1 ) (V 2 )) и V M*( (V) V ) Морфизм : M* M* M* называется произведением, если V 1,V 2 M* z 1 V 1, z 2 V 2 z (V 1,V 2 ) (z 1 z & z 2 z ); V 1,V 2 M* z (V 1,V 2 ) z 1 V 1, z 2 V 2 (z 1 z & z 2 z )
Обобщающие морфизмы Замыкающие Факторизации Расширения Структурные факторизации Семантические факторизации Обобщающие морфизмы
Морфизм : M* M* называется факторизацией, если V M* z V z 1 (V ) (z = (z 1 ) 0 ) & & z 1 (V ) z V (z = (z 1 ) 0 ) Морфизм : M* M* называется замыкающим, если V M*( (V ) [V] \ V ) Расширением V M* называется множество, образованное всеми такими конфигурациями, для которых существуют разбиения, составленные из конфигураций множества V. Если V M*, то [V] – множество конфигураций, к которым сходятся вычислимые подмножества V
Трансформирующие морфизмы Интеграции Адаптации Компоновки Декомпозиции Расщепления Сжатия Связывания Разложения Трансформирующие морфизмы
Прямая сумма конфигураций z 1 z 2 Теорема Если z 1 о z и z 2 о z и z - неэлементарная, то z 1 z 2 о z. z 1z 1 z 2z 2 = z 1z 1 z 2z 2 E Биморфизмы конфигураций
Унифицирующие биморфизмы Определение. Биморфизм называется унифицирующим, если: z 1, z 2 M ( (z 1, z 2 ) о z 1 ( (z 1, z 2 ) о z 2 )). Отношение на множестве унифицирующих биморфизмов 1, 2 ( 1 2 z 1, z 2 M ( 1 (z 1, z 2 ) о 2 (z 1, z 2 ))). Определим подкласс s – морфизмов. 1.отображения трассирования тождественные для внутренних вершин ПСП конфигураций. 2.z 1 о z 2 z 1 о z 2. Определение. Биморфизм : M 2 M называется s – биморфизмом, если z 0 M ( (z 0, z) и (z, z 0 ) - это s – морфизмы). SU – множество простых биморфизмов. Теорема. ms является наибольшим элементом множества ( SU, s ).
р (z), z M, - множество изотонных отображений соответствующих определению р – трассирования R (z), нагруженное бинарное дерево с вершинами создаваемое из вершин ПСП z области значений. Эндоморфизмы конфигураций Теорема. Если р (z) транзитивное отображение, то R (z) образует ПСП некоторой конфигурации. Пусть : I I изотонное и выполняются условия 1. I ( ( ) D(z)) 2.Если { i | i N & 1 = & j (| j + 1 |= | j | + 1)} – бесконечная последовательность, то i ( ( i ) O(z) ) Определим множества: R(, z) = { | Q(, z) ( = ( ))}; Q(, z) = { | ( ) D(z) & = & ( ) O(z) & ( ) D(z) ( ) D(z) \ O(z) }
Определение. Вычмслмое множество конфигураций = { z i }, i N, s-сходится к конфигурации z если: 1. i N ( z i о z ); 2. z M ( i N (z i о z ) z о z ); 3. O( z ) ( [ z ] M ( ) { }); 4. D( z ) \ O( z ) ( [ z ] R ( ) { E }). 5. Топологические свойства пространств знаний Теорема. Пусть 1 = { z 1 i }, i N, и 2 = { z 2 i }, i N, - это s-сходящиеся вычислимые множества конфигураций. Тогда вычислимые множество конфигураций 3 = 1 2 также является сходящимся. Следствие. Если непустое вычислимое множество M M имеет конечную верхнюю грань, то M является s-сходящимся.
6. Эволюции конфигураций 1. Предназначены для моделирования процессов и жизненных циклов в пространствах знаний; 2. Отличаются от морфизмов зависимостью результатов от времени и порядка поступления начальных данных; 3. Выполняются в неограниченном дискретном времени; 4. Группируются в системы процессов с общими механизмами построения процессов и определения их значений.
F = { ( T, S ) I 0 } T - оператор перехода S - оператор остановки T (z i z* j ) = [z i + 1 ], S (z i z* j ) {0, 1, }, I 0, i = 0, 1, Шаг процесса z i z i Начальное данное процесса: вычислимая последовательность = (z* 0, t 0 ),..., (z* j, t j ), Процесс для начального данного - последовательность пар W = (z 0, 0),..., (z i, i), Значение процесса W в компоненте I 0 F (W) = {((z i ), i) S (z i z* j ) = 0 }, где z* j - конфигурация в I 1 в момент i I 0 I 0 – область процесса I 1 - область начального данного 01 Представления процессов и их значений
Универсальные пространства эволюций конфигураций Теорема. Существует универсальное пространство эволюций конфигураций. Определение. Пространство эволюций конфигураций с базисом F u = (T u, S u ) называется универсальным, если F = (T, S ) F I 0 ( L (F ( )) = L (F u ( ( )) ( ) ) множество всюду определённых вычислимых отображений : I 0 I 0. Определение. Вычислимое отображение : является морфизмом эволюций конфигураций, если, t ( t = ( L( ( )) = L( ( ))) множество всех морфизмов эволюций конфигураций.
Абстрактное пространство знаний Семантическое пространство Пространство конфигураций Пространство эволюций конфигураций Пространство структур эволюций конфигураций Пространство структур конфигураций – Алгебраическая система = (R, O, C) R бесконечное вычислимое множество разрешимых бинарных отношений на M. O, C - множества вычислимых алгебраических и логических операций на R - Вычислимое семейство последовательностей конфигураций, порождаемых операторами перехода и остановки некоторого базиса F = (T, S ) I 0 – пара М = (M, d), M – бесконечное вычислимое множество конфигураций d – вычислимая декомпозиция элементов M d = (, ), : M M M и : M R – вычислимые отображения разложения и связывания конфигураций - Алгебраическая система = (, O) - множество структур O - множество вычислимых операций формирования структур
a. Операции конструирования и трансформации моделей пространств знаний b. Форматы описаний компонентов пространств знаний Элементы языка моделирования пространств знаний KML 7. Язык и Технология пространств знаний
Операции конструирования и трансформации пространств знаний Базовые операции на множестве формальных моделей: 1. Интеграция – расщепление 2 Гомоморфное расширение – гомоморфное вложение Модели компонентов пространств знаний представляются формальными системами вида = (T, F, P) T, F, P - системы классов данных, морфизмов и предикатов структурированных отношениями вложения и агрегирования Свойства классов представляются формализованными описаниями специальной структуры.
Унифицированная формальная модель Формальная модель Множество данных Множество морфизмов Множество предикатов На множествах T, F и P определены вычислимые семейства классов CT, CF и CP, содержащих все элементы данных множеств. Такие семейства структурированы разрешимыми отношениями вложения и агрегирования классов, обозначаемыми в виде и.
Диаграмма процесса построения формальной модели абстрактного пространства знаний 0 S S M 0 базовая модель S семантическое пространство M пространство конфигураций множество конфигураций с операцией разложения
Гомоморфные вложения формальных моделей f (x 1,..., x n ) (y 1,..., y m ) 1. Соответствие классов (данных, морфизмов, предикатов) 2. Сохранение значений h f f (x 1,..., x n ) = ( 1 (x 1,..., x n ),..., m (x 1,..., x n ) ) p (x 1,..., x n ) (y 1,..., y m ) p (x 1,..., x n ) = ( 1 (x 1,..., x n ),..., m (x 1,..., x n ) )
Программно реализуемые модели Диаграмма трансформаций моделей интеллектуальных систем и их программных реализаций Теоретические модели
Язык моделирования пространств знаний KML
Модели апробации, расширения и уточнения языка Абстрактное пространство знаний Формальная модель ( PS ) Формальная модель ( WSV ) Формальная модель ( PR )
Диаграммы классов объектов абстрактного пространства знаний 1 2 3
DT-section DF-section 1. Диаграмма классов 2. Описания классов DP-section имяформатысвойстваалгоритмы Унифицированная структура определений элементов абстрактного пространства знаний Описание класса: ( ) ;; ;
Примеры описаний классов 1.Класс данных Класс конфигураций (M; {z i | i N}; M ; G( M ), D( M )). 2. Класс данных Семантическое пространство} (R;{ r i | i N & r i ( M M)* }; E R, T R; G(R), D(R)). 3. Класс данных Семейство параметризованных классов вершин ПСП конфигураций} (D(z); { | z M & = = & I & {0,1} & ((z) ) (, ) }; G(D(z) ), D(D(z))). 4. Класс морфизмов Каноническое разложение конфигураций ({ }; : M M M; ( )= (, ); G({ }). 5. Класс морфизмов Каноническое семантическое связывание} ( { }; : M R; z M ( (z)= (z 1, z 2 ) & z 1 z 2 ) (z) (z)), r R z 1, z 2 M ! z M( (z)= (z 1, z 2 ) & (z) (z)) ;G({ }). 6. Класс Предикатов Вложение двоичных наборов ({Incl}= { }; (I, I);, I( I( = )); G({Incl}). 7. Класс предикатов Трассируемость конфигураций ({Tr};Tr(M, M); Tr(z 1, z 2 ) F Tr ( D(z 1 ) \ O(z 1 ) ([z 1 ] 1 [z 2 ] ( ) )& & O(z 1 )((z 1 ) ) 0 [z 2 ] ( ) ); G({Tr}).
Общая структура описаний Section begin Subsection Basic begin Subsection Basic end Subsection Special begin Subsection Special end Subsection Universal begin Subsection Universal end Section end Разделы описаний: Section DT – классы данных Section DF – классы морфизмов Section DP – классы предикатов
XML –структура пространства знаний (1)
XML –структура пространства знаний (2)
Элементы языка описания компонентов цифрового пространства знаний = "section" "begin" { | } "section" "end". = "subsection" "begin" { | } "subsection" "end". = "{" "}" "(" [";" ] [";" ] [";" ] ").".
Классы модели пространства знаний = { "=" }. = ( { " " } ) | |. = [ | "*" | ] [ | ]. = "(" { "," } ")". = "{" "}" | "{" "}".
Область форматов = |. = "{" { ("," ) | ",…" } "}". = "{" ( ":" | "|" ) "}". = ":" { " " } " " { " " }. = "(" { "," } ")".
Область имен формального определения класса = { "=" }. = ( { " " } ) | |. = [ | "*" | ] [ | ]. = "(" { "," } ")". = "{" "}" | "{" "}".
Простое сжатие Расщепление Фильтрация Интеграция Операции унифицированной технологии построения цифровых пространств знаний Костенко Константин Иванович Кубанский государственный университет