Концептуальные модели представления гетерогенных данныхданных Гарипов Олег
Содержание доклада Что есть концептуальное моделирование Виды концептуальных моделей данных Достоинства и недостатки различных КМД Чему должны удовлетворять новые модели?
Концептуальное моделирование КМ - деятельность формального описания некоторых аспектов физического и социального мира вокруг нас для понимания этих аспектов и коммуникации [Малопулос] Концептуальное моделирование (КМ) предметной области (ПО) – моделирование понятий (концептов) и концептуальных структур ПО [Когаловский] КМ - деятельность формального описания некоторых аспектов физического и социального мира вокруг нас для понимания этих аспектов и коммуникации [Малопулос] Концептуальное моделирование (КМ) предметной области (ПО) – моделирование понятий (концептов) и концептуальных структур ПО [Когаловский]
Концептуальное моделирование Концептуальная модель ПО в технологиях БД - это концептуальная схема (КС) базы данных Инструмент представления концептуальной схемы - концептуальная модель данных. Концептуальная модель ПО в технологиях БД - это концептуальная схема (КС) базы данных Инструмент представления концептуальной схемы - концептуальная модель данных.
Концептуальные модели данных Модель «сущностей-связей »(ER-модель) ( Чен ). Модель «объектов-ролей» ORM ( Фалкенберг ) / NIAM ( Найсен ) Расширенная реляционная модель RM/T ( Кодд ) Функциональная модель DAPLEX ( Шипмана ). Семантические сети Онтологии И т.д Модель «сущностей-связей »(ER-модель) ( Чен ). Модель «объектов-ролей» ORM ( Фалкенберг ) / NIAM ( Найсен ) Расширенная реляционная модель RM/T ( Кодд ) Функциональная модель DAPLEX ( Шипмана ). Семантические сети Онтологии И т.д
ER модель (пример)
ER – модель Предложена Ченом в 1972 году Наиболее распространенная модель. Фрагменты ПО представляются как множество сущностей с множеством связей. Удобный способ представления структуры данных Недостатки Отсутствие аппарата формальных преобразований Чувствительна к изменению атрибутов Влияет на реализацию Далека от естественного языка Предложена Ченом в 1972 году Наиболее распространенная модель. Фрагменты ПО представляются как множество сущностей с множеством связей. Удобный способ представления структуры данных Недостатки Отсутствие аппарата формальных преобразований Чувствительна к изменению атрибутов Влияет на реализацию Далека от естественного языка
Модель Object-Role (ORM) (пример)
Модель Object-Role (ORM) Модель, основанная на фактах Факты рассматриваются как отношения Недостатки: Факты из взаимосвязей фактов не вытекает взаимосвязь типов объектов Семантически не полная модель Плюсы: Близки к естественному языку Понятны не техническим специалистам Богатая графическая нотация Семантическая стабильность Более подробно: Модель, основанная на фактах Факты рассматриваются как отношения Недостатки: Факты из взаимосвязей фактов не вытекает взаимосвязь типов объектов Семантически не полная модель Плюсы: Близки к естественному языку Понятны не техническим специалистам Богатая графическая нотация Семантическая стабильность Более подробно:
Функциональные модели Первые разработки Sibley и Kershberg [1977] Модель Shipmanа. Язык DAPLEX [1979] Разработка языка FDL. Poulovassilis [1990] Первые разработки Sibley и Kershberg [1977] Модель Shipmanа. Язык DAPLEX [1979] Разработка языка FDL. Poulovassilis [1990]
Функциональная модель СУЩНОСТИ И ОТНОШЕНИЯ - ФУНКЦИИ
Функциональные модели Достоинства: Позволяет смотреть рассматривать объекты по отдельности и в «совокупности» Динамическая Строгая типизация Математическая основа Недостатки Тяжелая для понимания Необходимо знание теории функций Достоинства: Позволяет смотреть рассматривать объекты по отдельности и в «совокупности» Динамическая Строгая типизация Математическая основа Недостатки Тяжелая для понимания Необходимо знание теории функций
Модели на семантических сетях В основе моделей – семантическая сеть. Общий случай: =(,1,2,…,) В основе моделей – семантическая сеть. Общий случай: =(,1,2,…,)
Пример семантической сети Расширенная семантическая сеть: Every parents loves their childs Расширенная семантическая сеть: Every parents loves their childs
Семантические сети Достоинства: Наглядность Возможность описывать данные в виде связей структур Преобразования в логику первого порядка Недостатки Трудное графич. представление больших сетей Трудность обработки информации Трудность получения знания Сложность поиска в сети Достоинства: Наглядность Возможность описывать данные в виде связей структур Преобразования в логику первого порядка Недостатки Трудное графич. представление больших сетей Трудность обработки информации Трудность получения знания Сложность поиска в сети
Онтологии МакГраф: онтология – теория о существующих понятиях, независимых от определенного языка или языков, которым они описаны. 2 вида Формальные Лингвистические МакГраф: онтология – теория о существующих понятиях, независимых от определенного языка или языков, которым они описаны. 2 вида Формальные Лингвистические
Проблемы интеграции средствами онтологий Конфликты измерений «Цена продукта» ( Доллар vs. Рубль ) Конфликты контекста «Вес человека» (зависит от времени взвешивания) Конфликты представления «Студент» ( «Имя» + «Фамилия» vs. «ФИО» ) Конфликты имен «Статус человека» ( тип занятости vs. семейный статус) Конфликты измерений «Цена продукта» ( Доллар vs. Рубль ) Конфликты контекста «Вес человека» (зависит от времени взвешивания) Конфликты представления «Студент» ( «Имя» + «Фамилия» vs. «ФИО» ) Конфликты имен «Статус человека» ( тип занятости vs. семейный статус)
Онтологии Достоинства: Распределенное создание Возможность трактовки понятий с различных точек зрения Недостатки Сохранение целостности в процессе развития Сложность интеграции Неточность, избыточность информации Достоинства: Распределенное создание Возможность трактовки понятий с различных точек зрения Недостатки Сохранение целостности в процессе развития Сложность интеграции Неточность, избыточность информации
Требования к модели гетерогенных данных Строгая типизация Легкость развития модели Независимость от реализации ИС Совместить модель данных и модель знаний Модель данных должна иметь удобную нотацию представления. Строгая типизация Легкость развития модели Независимость от реализации ИС Совместить модель данных и модель знаний Модель данных должна иметь удобную нотацию представления.
Требования к моделям гетерогенных данных Должны существовать механизмы проверки целостности, непротиворечивости и избыточности данных Должна позволять рассматривать данные с различных точек зрения Повторное использование. Должны существовать механизмы проверки целостности, непротиворечивости и избыточности данных Должна позволять рассматривать данные с различных точек зрения Повторное использование.
The End Спасибо! Вопросы? Гарипов Олег