Новые технологии построения каталогов нормативно-справочной информации (НСИ) Сергей Горшков, «Бизнес Семантика»
НСИ и интеграция НСИ являются необходимым компонентом любой сложной интеграционной системы. Типичным подходом к их организации, с точки зрения ИТ, является MDM-система. Содержательную основу многих видов НСИ составляют классификаторы, имеющие официальный статус – ГОСТы, ТУ и т.д.
Как выглядит типичный классификатор? Код: подшипник шариковый радиальный однорядный с диаметром отверстия 4 мм, серии диаметров 9, основного конструктивного исполнения, серии ширин 1 Что делать, если появится одиннадцатый вариант конструктивного исполнения? Что делать, если появится еще одна важная характеристика, по которой надо будет классифицировать подшипники? Что тогда делать с информационными системами, в которых она используется? Код: Придется менять схему!
Мало того: Такой классификатор невозможно использовать без «ключа». Каждый классификатор применим только к одной, очень узкой предметной области. Существуют тысячи подобных классификаторов, перекрывающие друг друга.
Почему так получилось? Потому что такие классификаторы были нужны, когда изделия в них искал человек, листая страницы каталога. Сегодня весь поиск осуществляется через информационные системы. Значит, классификатор должен быть: машинно-читаемым, гибким, универсальным.
Требования к классификатору: НЕТ позиционным кодам! Нельзя хранить информацию в идентификаторе. Динамический набор характеристик. Характеристика – самостоятельная единица классификатора: диаметр есть и у трубы, и у подшипника. Структура не зависит от содержания – единый способ построения для любой предметной области. Истинная фасетная классификация.
Принцип Semantic Web: кодирование информации в семантическую форму Как этого достичь? Подлежащее – сказуемое – определение Подлежащее: универсальный идентификатор объекта Сказуемое: связь объекта с другим объектом, или название его свойства Определение: объект или литерал Пример: Подшипник ABC111 – имеет внутренний диаметр – 20 мм
Что такого можно делать на семантике, чего нельзя сделать на обычной базе данных? Работать с нетипизированным содержимым, в условиях меняющейся модели данных Анализировать связи между объектами (пример из жизни: Facebook Graph Search) Работать со множественными значениями атрибутов
Стандарт ISO (ГОСТ Р ИСО 15926) Начал создаваться в середине 1990-х, первоначально – в нефтегазовой сфере Состоит из 11 частей (на сегодня) Цель – разработка способа обмена информацией, не зависящей от ее структуры в конкретной системе После появления Semantic Web эти технологии приняты в качестве технологической основы стандарта Поддерживается POSC Caesar (BP, Statoil, Total, Bechtel, IBM, Aveva…)
ISO 15926: архитектура справочных данных
ISO в России Цели проекта: - Создание российского RDL (RuJORD, аналог JORD) - Создание инструмента моделирования онтологий
РЕЗУЛЬТАТ НАШЕЙ РАБОТЫ Что такое onto.pro? Это инструмент моделирования онтологий. Онтология – это универсальная электронная информационная модель знаний. Это редактор каталогов НСИ (нормативно- справочной информации), в том числе – построенных в соответствии со стандартом ISO / ГОСТ Р ИСО Это площадка для коллективной работы экспертов (инженеров, онтологов) над моделями и содержимым каталогов НСИ. Это программная платформа для размещения модели отраслевого обмена данными (например, между предприятием и его поставщиками).
Прикладные задачи ВИНК Стандартизация требований к оборудованию Обмен котировками с поставщиками, мониторинг цен Создание цифровых хранилищ инженерной документации Аналитические инструменты … и многое другое
Строительная индустрия – ? Существенная доля капитальных затрат в НГК – это строительство Создание семантических каталогов для строительства – неизбежно. Вопрос в том, кто организует этот процесс, и будет первым.
Семантика в строительстве Помощь проектировщикам – подбор изделий по параметрам Взаимодействие с заказчиками кап. строительства – обмен спецификациями, проектной документацией Автоматизация подачи и обработки предложений на тендеры
620075, Россия, г. Екатеринбург, ул. Бажова, д (343)