Информационно-поисковые системы. Сычев А.В г. 1 Информационный поиск vs. выборка данных Воронежский государственный университет Факультет компьютерных наук Кафедра информационных систем
Информационно-поисковые системы. Сычев А.В г. 2 Информационный поиск vs выборка данных Информационный поиск vs выборка данных ПараметрВыборка данныхИнформационный поиск СоответствиеТочное соответствиеЧастичное (лучшее) сответствие Механизм выводаДедуктивныйИндуктивный МодельДетерминистическаяВероятностная КлассификацияМонотетическаяПолитетическая Язык запросаИскусственныйЕстественный Формулировка запроса ЗавершеннаяНезавершенная Поиск элементовСоответствие запросуРелевантные Чувствительность к ошибкам ЧувствительнаНечувствителен
Информационно-поисковые системы. Сычев А.В г. 3 Классификация Определяет соотношение между свойствами и классами. Монотетическая Класс определяется совокупностью свойств, которые являются необходимыми и достаточными для членства объекта в классе Политетическая Класс определяется множеством свойств таких, что для членства в классе объект должен иметь некоторое число (обычно большое) этих свойств, при этом ни один из членов класса не обладает всеми этими свойствами.
Информационно-поисковые системы. Сычев А.В г. 4 Определение информационного поиска (Information Retrieval) Информационный поиск связан с представлением, хранением и организацией слабо структурированных данных. Элементарной единицей информационного поиска является документ. При этом содержимое документа, как правило, рассматривается как текстовое (в виде совокупности слов).
Информационно-поисковые системы. Сычев А.В г. 5 Структура процесса информационного поиска Структура процесса информационного поиска Baeza-Yates99
Информационно-поисковые системы. Сычев А.В г. 6 Задача тематического поиска Распространенной является задача тематического поиска: Вначале поиска пользователь не знает четко свою информационную потребность, а имеет о ней лишь общее представление, т.е. тему. Он может сформулировать лишь запрос самого общего характера. В процессе поиска пользователь уточняет свою информационную потребность и отбирает нужные ему документы. Побочным результатом является уяснение им самим своей информационной потребности.
Информационно-поисковые системы. Сычев А.В г. 7 Особенности Web, затрудняющие классический информационный поиск Распределенность данных Высокий процент изменчивых данных Большой объем данных Неструктурированность данных Избыточность данных Качество данных Разнородность данных Дополнительные характеристики документов: HTML-тэги гиперссылки Неквалифицированные пользователи, предпочитающие короткие запросы Поисковый спам
Информационно-поисковые системы. Сычев А.В г. 8 C. J. Rijsbergen Information Retrieval. London: Butterworths, 1979 ( ) R. Baeza-Yates, B. Ribeiro-Neto Modern Information Retrieval. Addison Wesley, 1999 ( ) Источники