Исследование применения онтологических моделей для семантического поиска Цель: определение основных способов и средств построения онтологических моделей и выбор специализированного языка для их описания
Актуальность Современные средства поиска, каталогизации, описания текстов не удовлетворяют нарастающим потребностям пользователей. Требуется их развитие в направлении повышения эффективности поиска информации и упрощения взаимодействия с пользователем. Существующие поисковые системы имеют ряд недостатков: избыточность - в пословном индексе используются слова-синонимы, выражающие одни и те же понятия; избыточность - в пословном индексе используются слова-синонимы, выражающие одни и те же понятия; слова текста считаются независимыми друг от друга, что не соответствует свойствам связного текста; слова текста считаются независимыми друг от друга, что не соответствует свойствам связного текста; многозначность слов - поскольку многозначные слова могут рассматриваться как дизъюнкция двух или более понятий, то маловероятно, что все элементы этой дизъюнкции интересуют пользователя. многозначность слов - поскольку многозначные слова могут рассматриваться как дизъюнкция двух или более понятий, то маловероятно, что все элементы этой дизъюнкции интересуют пользователя.
Семантическая модель информации все синонимы сведены к одному и тому же понятию многозначные слова отнесены к разным понятиям связи между понятиями и соответствующим и словами описаны и могут быть использованы при анализе текста
Диаграмма потоков данных при поиске
Под онтологией можно понимать: надежный семантический базис в определении содержания; общую логическую теорию, которая состоит из словаря и набора утверждений на некотором языке логики; основу для коммуникации между людьми и компьютерными агентами.
Концепт 1 Концепт 2 Свойство 1 Свойство n Свойство 1 Свойство т …… Связь k Связь 1 ограничения Основные компоненты онтологической модели: Концепты – понятия, классы, сущности, категории Свойства – слоты, атрибуты, роли Отношения – связи, зависимости, функции Ограничения - аксиомы
Анализ средств разработки онтологических моделей Название параметра OilEd OntoE dit Ontolin gua OntoSa urus ProtégéWebODEWebOnto Архитектура приложения 3–х уровневая Клиент/ сервер 3–х уровневая n- уровневая Клиент/ сервер Хранение онтологий файлы файлы, CУБД СУБДФайлы Язык ПОJava Lisp Java Java+ Lisp Осн. язык представления знания DAML+OILOXML Ontolingu a LOOMOKBC-OCML Интерфейс пользователя Локк-ое приложение HTML Локк-ое приложен ие HTML и апплеты Апплеты Графич. редакт. таксономии концептов Редактор формальных аксиом
Языки построения онтологий Традиционные языки Специальные языки для обмена данными через web Ontolingu a CycL LOOM OKBC OCML Flogic XOL SHOE UPML RDF(S) DAML,OIL OWL Более поздние языкии, основанные на web-стандартах Анализ форматов представления данных
График применения различных форматов при построении онтологии
Заключение Исходя из анализа основных параметров различных редакторов онтологий, наиболее приемлемым является редактор Protégé, именно он будет взят за основу в дальнейшей работе. Среди форматов представления данных, лидирующие позиции занял RDF(S), который будет использован для построения онтологии предметной области электронной библиотеки кафедры АСУ
Спасибо за внимание