Л ЕКЦИЯ 8. Т ЕЗАУРУСЫ, УПРАВЛЯЕМЫЕ СЛОВАРИ И МЕТАДАННЫЕ Метаданные Метаданные 1 Управляемые словари Управляемые словари 2 Тезаурусы Тезаурусы 3 1
В ОБРАБОТКЕ ДАННЫХ МЕТАДАННЫЕ ПРЕДСТАВЛЯЮТ СОБОЙ ОПИСАТЕЛЬНЫЕ ДАННЫЕ, СОДЕРЖАЩИЕ СВЕДЕНИЯ ИЛИ ДОКУМЕНТАЦИЮ О ДРУГИХ ДАННЫХ, С КОТОРЫМИ ОСУЩЕСТВЛЯЮТСЯ ДЕЙСТВИЯ В ПРИЛОЖЕНИИ ИЛИ СРЕДЕ. Н АПРИМЕР, В МЕТАДАННЫХ МОГУТ РЕГИСТРИРОВАТЬСЯ ДАННЫЕ ОБ ЭЛЕМЕНТАХ ДАННЫХ ИЛИ АТРИБУТАХ ( ТАКИХ КАК ИМЯ, РАЗМЕР, ТИП ДАННЫХ И Т. Д.), ДАННЫЕ О ЗАПИСЯХ ИЛИ СТРУКТУРАХ ДАННЫХ ( ДЛИНА, ПОЛЯ, КОЛОНКИ И Т. Д.) И ДАННЫЕ О ДАННЫХ ( ГДЕ ОНИ НАХОДЯТСЯ, КАК СВЯЗАНЫ, КТО ВЛАДЕЛЕЦ И Т. Д.). 2
Типы управляемых словарей 3
Кольцо синонимов 4 Увеличивают полноту, но теряется точность © Louis Rozenfeld and Peter Morville, 2002
Синсеты WordNet 5
Нормативные файлы 6
Телефонные коды городов Харьковской области 7
8
9
Указатель производителей на tabletki.ua 10
Схемы классификации (таксономии) Таксономия - иерархическая организация предпочтительных терминов: Иерархия на стороне клиента, типа Yahoo, допускающая навигацию и являющаяся видимой составной частью пользовательского интерфейса. Инструмент на сервере, применяемый информационными архитекторами, авторами содержимого и создателями указателей для организации документов и разметки их с помощью тегов. 11 © Louis Rozenfeld and Peter Morville, 2002
Универсальный десятичный классификатор - УДК 12
Т ЕЗАУРУС - « КНИГА СИНОНИМОВ, ЧАСТО СОДЕРЖАЩАЯ БЛИЗКИЕ ИЛИ ПРОТИВОПОЛОЖНЫЕ СЛОВА И АНТОНИМЫ ». П РЕДСТАВЛЯЕТ СОБОЙ СЕМАНТИЧЕСКУЮ СЕТЬ ПОНЯТИЙ, СВЯЗЫВАЯ СЛОВА СО СВОИМИ СИНОНИМАМИ, ОМОНИМАМИ, АНТОНИМАМИ, ВЫШЕСТОЯЩИМИ И НИЖЕСТОЯЩИМИ ДЕСКРИПТОРАМИ, А ТАКЖЕ С АССОЦИАТИВНЫМИ ДЕСКРИПТОРАМИ. У ПРАВЛЯЕМЫЙ СЛОВАРЬ, В КОТОРОМ ОПРЕДЕЛЕНЫ ЭКВИВАЛЕНТНОСТЬ, ИЕРАРХИЧЕСКИЕ И АССОЦИАТИВНЫЕ СВЯЗИ ДЛЯ ЦЕЛЕЙ УЛУЧШЕНИЯ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ. 13
Семантические отношения в тезаурусе 14 © Louis Rozenfeld and Peter Morville, 2002
Технический жаргон accepted term (принятый термин), acceptable value (приемлемое значение) или descriptor (дескриптор). Все связи определяются относительно предпочтительного термина. Preferred Term (PT) – предпочтительный термин непредпочтительный термин (nonpreferred term). Альтернативные термины определяются как эквивалентные или почти синонимичные предпочтительному термину. Variant Term (VT) – альтернативный термин является родительским по отношению к предпочтительному термину. В иерархии он располагается на один уровень выше. Broader Term (BT) – вышестоящий дескриптор является дочерним для предпочтительного термина. В иерархии он располагается на один уровень ниже Narrower Term (NT) – нижестоящий дескриптор связан с предпочтительным термином отношением ассоциативности. Эта связь часто выражается посредством «см. также». Related Term (RT) – ассоциативный дескриптор следующий синтаксис: альтернативный термин Use предпочтительный термин Use (U) – смотри (см.) обратное отношение: предпочтительный термин синонимичен альтернативному термину. Used For (UF) – синоним (с) определение предпочтительного термина особого типа, ограничивающее значение этого термина, чтобы устранить неоднозначность. Scope Note (SN) – лексическое примечание к тезаурусной статье 15
Семантические отношения в тезаурусе вин 16
Типы тезаурусов 17
Стандарты тезаурусов 18 ISO 2788 (1974, 1985, 1986, международный) BS 5723 (1987, британский) AFNOR NFZ (1981, French) DIN 1463 ( , немецкий) ANSI/NISO Z39.19 (1994, США)
Преимущества стандартов тезаурусов Эти принципы основаны на здравых рассуждениях и интеллекте. Большая часть программного обеспечения для управления тезаурусами спроектирована с учетом совместимости со стандартом ANSI/NISO, поэтому полезно придерживаться этого стандарта с точки зрения интеграции технологий. Соответствие этому стандарту обеспечивает лучшие возможности совместимости между базами данных, поэтому объединение двух комплектов словарей при слиянии конкурирующих компаний вызовет меньше трудностей. 19
Эквивалентность Иерархичность Ассоциативность 20
Эквивалентность синонимы близкие синонимы акронимы аббревиатуры лексические варианты распространенные варианты ошибочного написания 21
Иерархичность Родовое Целое – часть Экземпляр 22
Ассоциативность Область исследований и объект исследований Процесс и его агент Понятия и их свойства Действие и его результат Причинная зависимость 23
Аспекты терминологии Формат терминов Выбор термина Определение термина Специфичность терминов 24
Иерархия и полииерархия 25
Пример полииерархии 26
Фасетная классификация 27
28 Т ЕМА СЛЕДУЮЩЕЙ ЛЕКЦИИ : «О СНОВЫ ПРОЕКТИРОВАНИЯ ЧЕЛОВЕКО - МАШИННЫХ ИНТЕРФЕЙСОВ »