ИСПОЛЬЗОВАНИЕ ИНФОРМАЦИОННО- ПОИСКОВЫХ ЯЗЫКОВ В ПРОЦЕССЕ НАУЧНОЙ ОБРАБОТКИ ДОКУМЕНТОВ И СОЗДАНИЯ ЭЛЕКТРОННОГО КАТАЛОГА. Пяткова И.Н.
Поисковый образ документа (ПОД) – текст, состоящий из лексических единиц информационно- поискового языка (ИПЯ), выражающий содержание документа или информационного запроса и предназначенный для реализации информационного поиска
ИПЯ – формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью последующего хранения и поиска.
ИПЯ – основа лингвистического обеспечения информационно-поисковых систем.
Виды ИПЯ: Классификационные ИПЯ: Иерархические классификации (ББК, УДК, МКИ, др.) Неиерархические (линейные) классификации (предметные рубрики, АПК) Дескрипторный ИПЯ; Язык библиографического описания (ЯБО); ИПЯ объектно-признакового вида.
Индексирование документов – процесс перевода содержания документов и запросов с естественного языка на ИПЯ, в результате чего создаются ПОД.
Основные этапы процессов индексирования: Анализ содержания и формы индексируемого источника (документа или запроса). Перевод результатов анализа с естественного языка на ИПЯ. Составление ПОД.
Показатели качества индексирования: Глубина индексирования – степень детальности ПОД. Полнота индексирования – широта тематического содержания документов, что связано с количеством используемых ИПЯ.
Каждая запись ЭК содержит набор лингвистических средств: Библиографическое описание Классификационный индекс Авторский знак Предметные рубрики Перечень дисциплин, кафедр (для учебной литератури) Ключевые слова Международный стандартный номер Номер учета Место хранения в фонде
Технологические процессы, которые задействованы в создании лингвистических средств: Комплектование и учет фонда Техническая обработка Библиографическое описание Систематизация, предметизация Работа с фондом
Основные решения библиотеки УИПА в вопросах ЛО ЭК: - о вводе полного библиографического описания не только на новые поступления, но и на документы ретроввода; - о создании предметных рубрик; - о вводе данных факльтет – кафедра – дисциплина для учебных изданий; - о вводе содержания книг.
После конвертации в программу ИРБИС редактировались следующие элементы ЛО: ЯБО: -индивидуальный автор, инициалы -коллективный автор -названия журналов и газет, кумуляция по годам изданий -названия серий -описание законодательных документов Классификационные ИПЯ: -шифры систематизации УДК и ББК -предметные рубрики ИПЯ объектно-признакового характера: -количество и место хранения документов в фонде - штрих-коды
Современные АИБС предлагают в качестве ЛО: - автоматическое формирование словарей на основе данных электронной записи; - автоматизированное рабочее место систематизатора; - создание файлов авторитетных данных; - использование тезауруса.
При разработке ЛО необходимо решить следующие проблемы: Проблемы поиска Совместимости лингвистических средств Обмена данными
Обеспечение релевантного поиска – основная цель разработки ЛО
«Любая излишняя, ненужная и несвоевременная информация может квалифицироваться как информационный шум». Ларсон фон Триер
Поисковые возможности Web-модуля недостаточно эффективны: - неудобен поиск по автору, т.к. инициалы автора не участвуют в формулировке запроса; -не принимают участия в поиске данные АФ ИА; - в поиске по предметным рубрикам участвует не более 3-х слов; - сложно найти зарегистрированные номера журналов, которые расписываются аналитически.
Пользователи, не владеющие техникой поиска: - испытывают затруднения в формулировке информационных потребностей; - не знают свойств ИПЯ, используют терминологию, не совпадающую с лексикой словарей ИПЯ; - не осведомлены о необходимости проведения навигации по словарю.
Совместимость лингвистических средств Совместимость - это возможность использования в различных БД поисковых образов документов на одном ИПЯ, а поисковых предписаний - на другом.
Корпоративные методы работы Ассоциация региональных библиотечных консорциумов (АРБИКОН + МАРС) Центральный Украинский Кооперативный каталог (ЦУКК) на базе Кировоградской областной научной библиотеки им. Д.И. Чижевского
Обмен данными предполагает наличие коммуникативных (обменных) форматов, которые накладывают определенные ограничения по составу, структуре и правилам заполнения для каждого обязательного состава полей.
Спасибо за внимание!