«Информационное обеспечение науки: Новые технологии» Новые возможности программного комплекса «SciRus» Михаил Якшин, БЕН РАН 2013
Часть 1: новые возможности
Новый тип поля: длинный HTML-текст Новый способ отображения длинного текста без преобразования HTML-тэгов Используется в первую очередь для импорта из готовых HTML-документов с разметкой Потенциально опасен, не рекомендуется к использованию, если БД будет редактироваться средствами SciRus
Новый тип поля: ссылка на изображение Текст, введенные в текстовое поле, интерпретируется как ссылка на адрес изображения, доступного публично по http Например: – Содержимое поля: – Отображение: Используется для отображения изображений, выложенных на какой-то хостинг и уже доступных по http
Хостинг файлов Иногда файлы есть только на рабочей стацнии пользователя и не доступны публично по http Если пользователю проще загружать их по одному и вести их учет средствами SciRus – это можно сделать с помощью встроенного хостинга файлов и типа поля «Хранимый файл»
Хостинг файлов: добавление поля
Хостинг файлов: ввод записи
Хостинг файлов: отображение файла-фотографии
Хостинг файлов: отображение прочих файлов
Хостинг файлов: механизм работы Загружаемый файл размещается в локальной ФС сервера по пути, доступ к которому публично предоставляется по http (по умолчанию – hosted-files ) Имя файла формируется автоматически как функция от: – имени таблица (=типа сущности) – идентификатора записи – идентификатора поля
Хостинг файлов: хранение в таблице СУБД В таблице хранится расширения файла, по которому определяется его тип и связанные с ним действия: – показывать встроенным в документ с помощью тэга img – показывать ссылку для скачивания Пустое значение означает, что файл не загружен (файл в локальной ФС синхронизируются с этим значением)
Хостинг файлов: пример формирования файла Обязательная часть Имя таблицы Идентификатор поля Идентификатор записи Содержимое записи в БД
Рубрикатор Рубрикатор определенный заранее древовидный классификатор, использование ветвей и листьев которого приводит к выполнению поисковых запросов, выводящих все записи в ветви или листе Поиск производится по началу вхождения строки, тем самым достигается поиск внутри ветви, например: – FO1.1 => FO1.1, FO1.1.9, FO1.1.3, FO – FO1.1.9 => FO1.1.9 – FO1.1.3 => FO1.1.3, FO
Режим гостевого входа Исторически, SciRus всегда работал в режиме принудительной необходимости авторизации Для более эффективного публичного представления массивов в WWW (в том числе для индексации поисковыми роботами) нужен режим без авторизации Реализовано 2 режима: – публичный (без авторизации) доступ только для поиска и чтения; – авторизованный доступ на запись, авторизация через специальную страницу
Часть 2: новые проекты на основе SciRus
«История геологии и горного дела»: внешний вид
«История геологии и горного дела»: цель проекта Создание структурированной информационной системы, содержащий данные о выдающихся геологах Основная сущность персона – 18 полей – 4 из них – длинные слабоструктурированные тексты К персоне привязаны: – документы (полнотекстовые, доступны в формате PDF) – фотографии – организации, отношение к котором имела/имеет персона
«История геологии и горного дела»: структура БД Документы Персоналии ОрганизацииФотографии Источники Хостинг файлов
«История геологии и горного дела»: результаты 502 персон – 529 фотографий – 72 организации – 76 документов (41 полнотекстовый документ) 25 источников Первоначальная загрузка – импорт специальным конвертером из RDF (система на основе ЕНИП) Дальнейшие работы – через пользовательский интерфейс SciRus
Проект НЦВО («Волоконная оптика») Две разных базы объединены в одной структуре: – БД публикаций сотрудников НЦВО пополняется вручную сотрудниками НЦВО – БД публикаций по тематикам волоконной оптики пополняется за счет сложных тематических выборок из Web of Science и экспорта/импорта в формате RIS
Проект НЦВО («Волоконная оптика»): структура БД Публикации Персоналии Организации Источники
RIS-подобный формат загрузки: конвертер Разработан двухшаговый конвертер для загрузки присылаемых данных в БД Шаг 1: много файлов (рубрика в названии файла) в формате RIS -> один файл, рубрика внутри файла Шаг 2: загрузка получившегося файла в БД последовательно с созданием необходимых связанных записей
RIS-подобный формат загрузки: пример Файл с именем « Multimode optical fiber3.txt» # TI New method to calculate mode conversion coefficients in SI multimode optical fibers AU Zubia J., Durana G., Aldabaldetreku G., Arrue J., Losada M. A., Lopez-Higuera M. SO JOURNAL OF LIGHTWAVE TECHNOLOGY PY V. 21. Is. 3. P Address: /JLT Один общий файл: RUB # TI New method to calculate mode conversion coefficients in SI multimode optical fibers AU Zubia J., Durana G., Aldabaldetreku G., Arrue J., Losada M. A., Lopez-Higuera M. SO JOURNAL OF LIGHTWAVE TECHNOLOGY PY V. 21. Is. 3. P Address: /JLT
Проект НЦВО: внешний вид 1
Проект НЦВО: внешний вид 2
Проект НЦВО: рубрикатор
Проект НЦВО: поиск без авторизации
Проект НЦВО: срез БД по публикациям только сотрудников НЦВО
Проект НЦВО («Волоконная оптика»): результаты публикаций 6641 источников (журналов) авторов (70 сотрудников НЦВО) – 5 организаций