Платформа реализации электронных архивов данных и документов Марчук А.Г., Марчук П.А. Институт систем информатики СО РАН, г. Новосибирск
Что такое архив документов? Листы в иерархии мест расположения (Архивы/шкафы/папки) Возможно, другие виды единиц хранения Файлы и сборки файлов - электронные документы (медиа и документы) Электронный архив = Электронные копии документов + база данных + программы и интерфейсы поддержания и публикования
Для кого предназначено платформенное решение? Для разработчиков архивных систем Для желающих создать свой архив и запустить его в научный оборот через Интернет Для упорядочивания корпоративных или индивидуальных массивов информации и документов
Что из себя представляет платформенное решение? База данных представляется RDF-документами Электронные документы и копии «бумажных» документов размещаются в специализированных хранилищах – кассетах База данных сформирована по схеме BONE – базовой онтологии неспецифических сущностей Кассеты формируются и редактируются приложением CManager База данных формируется и редактируется Web- приложением Ursul. Архив данных и документов доступен для внешних программ через Web-сервис Локальный архив пользователя может иметь приватную и публичную части и также может использовать публичную информацию других архивов
Кассета – хранилище документов и базы данных Имеет простую файл-директорную структуру, размещает оригиналы документных файлов, предвычисленные копии, базу данных кассеты; Ключевая позиция – размещение RDF-базы данных в хранилище в виде документов Имеется API работы с кассетами
RDF – как формат представления базы данных Гибкий инструмент для формирования распределенных баз данных Высокая степень стандартизации (URI, N3, XML, XSD, OWL и др.) Имеется рекомендованный язык запросов Sparql, имеется множество опробованных словарей (онтологий) Трудность: стандарт RDF не поддерживает полноценного редактирования базы данных.
BONE – Basic Ontology for Non-specific Entities Персона Орг. система Документ Гео. система Нахождение отражение авторство работа учеба семья
Архитектура фактографической системы Ввод первичных документов Распределенная база данных Динамическая синхронизация ОператорыПользователи
Архив данных и документов как сервис и как Web-сервис Распределенная база данных Клиент -Получение информации из базы данных по идентификатору узла или поисковому образу, добавление или изменение информации -Получение контента документов по идентификатору, добавление документных файлов -Синхронизация изменений в моделях
CManager – приложение создания и редактирования кассет
Редактирование базы данных
Шаблонные деревья
Системная организация Публичные и специальные интерфейсы Эволюция системы Состав и особенности системы Использованные технологии
Спасибо за внимание!