Онтологическая семантика текста: форматирование лексики в семантическом словаре Г.В. Лезин Санкт-Петербургский экономико-математический институт РАН
Аннотация В статье рассматривается задача выработки единого представления информации в семантической сети текста, лексиконе и в базовой онтологии. Предлагается дополнить стандартные описания классов в онтологии форматами многокомпонентных толкований, подготовленных для использования в лексиконе. Рассматривается семантика форматов и их связь с онтологией и лексиконом
Общие характеристики семантической основы лексикона Выделение подсловаря исходных (атомарных) понятий, используемых в толкованиях. Построение общей таксономической иерархии понятий лексикона. Определение развитого списка свойств (ролей, атрибутов), позволяющих связывать атомарные понятия в общую формулу толкования лексемы.
Семантические компоненты описания языка БазоваяOWL-онтология Описания атомарных классов Описания форматированных классов RDF-шаблоны классов RDF-форматы толкований Лексикон: RDF-толкования лексем
Компоненты описания класса в OWL-онтологии Имя класса. Место описываемого класса в общей системе классов онтологии (задается отношениями rdf:type owl:Class, rdfs:subClassOf имя класса) Список свойств, сопоставляемых классу указаниями ограничений на свойства.
Основные виды ограничений на свойства А) Ограничение "only V": любой индивид u из класса C I может иметь свойство prop c областью значений, ограниченной исключительно классом V, т.е.: u rdf:type C I ; prop v v rdf:type V. Б) Ограничение "some V": факт принадлежности индивида u классу C I свидетельствует о наличии у него некоторого значения v свойства prop, т.е. : u rdf:type C I (u prop v. v rdf:type V) В) Ограничения кардинальности: каждый индивид u из класса C I должен иметь в семантической сети значения свойства prop в количестве, удовлетворяющем ограничению.
Пример описания класса ont:Нахождение_Место rdf:type owl:Class;rdfs:subClassOf ont:СостояниеОбъект; rdfs:subClassOf [rdf:type owl:Restriction;owl:onProperty ont:с_Уровнем_высоты; owl:allValuesFrom ont:РазмерДистанции ] ; rdfs:subClassOf [rdf:type owl:Restriction; owl:onProperty ont:с_Уровнем_высоты; owl:someValuesFrom ont: РазмерДистанции ] ; rdfs:subClassOf [rdf:type owl:Restriction ; owl:onProperty ont:с_Местом ; owl:someValuesFrom ont:Место_Объекты ] ; rdfs:subClassOf [rdf:type owl:Restriction; owl:onProperty ont:с_Местом; owl:allValuesFrom ont:Место_Объекты ] ; rdfs:subClassOf [rdf:type owl:Restriction; owl:onProperty ont:с_Дистанцией; owl:allValuesFrom ont:РазмерДистанции.
Шаблон класса Определение: _:x rdf:type ont:ClassId; ont:prop1 _:x1; … ; ont:propN _:xN. Пример: _:x rdf:type ont:Нахождение_Место; ont:с_Объектом _:x1; ont:с_Местом _:x5; ont:с_Дистанцией _:x6; ont:с_Уровнем высоты _:x7; ont:с_Началом _:x2; ont:с_Концом _:x3; ont:с_Модальностью _:x4.
Процедура определения формата толкования А) Определяется структура формата - набор шаблонов,образующих толкование. Шаблоны задаются указанием соответствующих классов базовой OWL-онтологии. Б) Нормализация (переобозначение) переменных в шаблонах. В результате этой операции переменные в шаблонах не имеют совпадающих обозначений. В) Параметризация шаблонов. Переменным в шаблонах, обозначающим общие узлы графа толкования, присваиваются общие обозначения Г) Формату толкования сопоставляется класс OWL-онтологии. В качестве свойств этого класса, явно заданных в его описании или наследованных, указываются имена ролей, задающих параметры формата толкования.
Сценарий перемещения _:x rdf:type ont: СценарийПеремещения; ont:с_Объектом _:Y1; ont:рольИточка _:Y2; ont:рольИдистанция _:Y3; ont:рольИвысота _:Y4; ont:рольКточка _:Y5; ont:рольКдистанция _:Y6; ont:рольКвысота _:Y7; ont:рольНачало _:Y8; ont:рольКонец; _:Y9". _:x1 rdf:type ont: Нахождение_Место ; ont:с_Объектом _:Y1; ont:с_Местом _:Y2; ont:с_Дистанцией _:Y3; ont:с_Уровнем_высоты _:Y4; ont:с_Началом [ ]; ont:с_Концом _:Y8. _:x2 rdf:type ont: ДвижениеПроцесс ; ont:с_Агенсом [ ]; ont:с_Объектом_:Y1; ont:со_Скоростью [ ]; ont:мимо [ ];ont:следом [ ]; ont:с_Началом _:Y8; ont:с_Концом _:Y9. _:x3 rdf:type ont: Нахождение_Место ; ont:с_Объектом _:Y1; ont:_Местом _:Y5; ont:с_Дистанцией _:Y6; ont:с_Уровнем_высоты _:Y7; ont:с_Началом _:Y9; ont:с_Концом [ ].
Основная аксиома формата Обозначения: F – любой из классов общей OWL-онтологии, которому сопоставлен формат толкования; X F - общий список параметров формата F ; x F - переменная, определенная на классе F ; V F - набор переменных, определенных на классах шаблонов, образующих толкование; (V F ) - факт существования кортежа значений для переменных из набора V F ; H F (x F, X F ) – RDF-высказывание, заданное заголовком формата F; S F (V F, X F ) – RDF-высказывание тела F. Заголовок формата F и его тело связаны отношением эквивалентности: (F)[ (x F )[ H F (x F, X F ) (V F ) S F (V F, X F )] (V F )[ S F (V F, X F ) (x F ) H F (x F, X F )]] при взаимно однозначном соответствии между значениями x F и конкретными кортежами значений V F
Особенности форматированных онтологий 1) Наличие двух категорий классов: общие классы, полностью определенные средствами онтологии, и F-классы, которым наряду с их описанием в онтологии сопоставлен формат толкования. 2) Шаблон F класса является заголовком сопоставленного классу формата толкования и строится по общим правилам. 3) Список параметров шаблона F класса совпадает со списком параметров, заданных телом его толкования. Ограничения на значения параметров в описании F класса в онтологии не должны противоречить ограничениям на эти же параметры в теле толкования класса. 4) Список свойств F класса должен обеспечивать в рамках описания класса взаимно однозначное соответствие между свойством и параметром, указанным в качестве значения свойства. 5) Вхождение шаблона F класса в какое-либо RDF высказывание (например, в состав толкования лексемы) равносильно ссылке на тело толкования в формате этого класса.
Пример толкования лексемы ПЕРЕДВИНУТЬ Синтактика: Z1:!Им, Z2:!Вин, Z3:!Откуда,Z4:!Куда Семантика лексемы: voc:ПЕРЕДВИНУТЬ rdf:subClassOf ont:СценарийПеремещения; _:x rdf:type voc:ПЕРЕДВИНУТЬ; ont:с_Агенсом :Z1; ont:с_Объектом_:Z2; ont:рольИточка _:Z3; ont:рольКточка _:Z4; ont:рольНачало _:Y8; ont:рольКонец; _:Y9". _:Y8 rdf:type ont:НачалоСитуации. _:Y9 rdf:type ont:КонецСитуации.
Спасибо за внимание!