1 Средства автоматической интеграции разнородных онтологий Панасенко Алексей, 525 группа Научный руководитель Большакова Е.И.
2 Понятие онтологии Онтология – конструкция для представления знаний в Интернете, представляющая собой множество объектов, классифицированных в соответствии с некоторыми критериями, плюс описание свойств этих объектов. Онтология кодирует объекты и свойства в понятном для компьютера формате.
3 Применение онтологий Информационный поиск (Information retrieval) –Обеспечение концептуального индексирования Семантический Веб (Semantic Web) –Автоматизация «интеллектуальных» задач обработки значения ресурсов сети
4 Методы создания 3 подхода к созданию онтологий –Автоматическое извлечение знаний –Использование экспертов –Использование сообщества У каждого – свои недостатки Для получения наилучшего результата необходимо комбинировать подходы
5 Цель дипломной работы Цель – разработка средств интеграции двух разнородных онтологий – русскоязычной Wikipedia и базы знаний, составленной сотрудниками НИВЦ МГУ.
6 Задачи Анализ существующих проектов Выбор формата результирующей онтологии Проектирование и кодирование средств автоматической интеграции Выборочное тестирование результирующей онтологии
7 Обзор аналогов Наиболее близкий аналог – YAGO –Авторы – Fabian M. Suchanek, Gerhard Weikum –Автоматическое получение знаний из WordNet и Wikipedia –1.7 миллиона сущностей –15 миллионов фактов – Язык описания онтологии – RDF/RDFS
8 Язык описания результата RDF/RDFS – Resource Description Framework Разработан World Wide Web Consortium Создан специально для обмена онтологиями через Internet Синтаксис на основе XML
9 Средства интеграции Язык разработки – Python Сначала онтология НИВЦ конвертируется в RDF, затем пополняется из XML-dump Wikipedia Для пополнения используются категории и панели информации Wikipedia
10 Результат Проведен обзор аналогов Выбран стандарт RDF/XML в качестве языка описания результирующей онтологии На языке Python созданы средства интеграции онтологий
11 Направления дальнейшей работы Улучшение эвристик для определения категорий сущностей Тестирование новых эвристик Оптимизация программы по скорости выполнения
12 Спасибо за внимание