Устойчивые (постоянные) идентификаторы информационных ресурсов Тема 4
Сущность проблемы: Доступ к документам в WWW осуществляется обычно через универсальный адрес ресурса (Universal Resource Locator - URL). Адреса URL используются для создания гиперссылок в сети (а также для других целей и по другим протоколам). Поскольку этот метод доступа – просмотр или запрос на документ через Интернет – требует URL как метода адресации, адрес URL стал предпочтительным методом ссылки на документ, например, при его цитировании. Однако, все чаще и чаще случается, что документ оказывается не доступным по адресу, указанному в ссылке. В таких случаях веб серверы выдают неприятный ответ 404 not found. Это напоминает ситуацию, когда в очень большой библиотеке книги не оказывается на месте, указанном в каталожной записи. Как ее найти? Было бы еще хуже, если бы такое сообщение не появлялось. Иногда нестабильность выражается в том, что ресурс по данному адресу ресурс просто заменяется другим. В этом случае связь между ссылкой и документом также прерывается, но пользователь может этого не понять, так как он не получает сообщения об ошибке, и ему предоставляется «неправильный» документ.
Отрицательные последствия: Все трудней становится обратиться к цитируемым источникам. Они зачастую и вовсе недостоверны. Таким образом, прерванные связи могут компрометировать документы, которые сами по себе доступны, но используют в цитатах ссылки с прерванными связями. Для того, чтобы найти утраченный ресурс требуются значительные трудозатраты, а иногда это и вовсе невозможно. Информации о доступе к ресурсу по другому адресу может не быть, хотя где-то ресурс может быть доступен. Связи с ресурсами тоже возможно будут нарушены, так как они в основном зависят от цитирования и накопленных ссылок от других документов и на другие документы и базы данных. Результаты научных работ – часто финансируемых обществом – могут быть утеряны.
Состояние вопроса: Речь идет об расширении системы доступа к документам. Наряду с адресами ресурса, (которые оказываются часто меняющимися, что ведет к значительным информационным потерям) предполагается использовать идентификаторы, которые основаны на имени ресурса, а не на его адресе. Существуют целый ряд технологий и концепций именования (при этом используются и такие известные в библиотечной сфере идентификаторы как номер национальной библиографии, ISBN, ISSN)
В докладе Вим ван Дриммельн на конференции 2006 года сообщил, что для решения вопросов связанных с устойчивыми идентификаторами необходимо: Создать Европейскую инфраструктуру присвоения устойчивых (постоянных) идентификаторов. Для подготовки и развития такой инфраструктуры следует решить три технических вопроса (стандартный синтаксис для URL, содержащий URN, постоянный базовый URL), а также принять список локальных агентств, присваивающих идентификатор. Эти вопросы должны быть разрешены путем создания небольшой рабочей группы технических специалистов из национальных библиотек Нидерландов, Великобритании, Германии и Финляндии. Для упрощения переговоров с коммерческими службами было принято решение, чтобы членство представителей CENL в фонде по унифицированным идентификаторам цифровых объектов (IDF) было продлено еще на год.