Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемМарта Строева
1 © ElVisti Лекция 4 Информационно-поисковые языки, интерфейсы пользователей ИПС Дмитрий Владимирович ЛАНДЭ МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ
2 © ElVisti2 Лингвистическое обеспечение ИПС Информационно-поисковый язык - формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью последующего хранения и поиска. (Глоссарий.ru) Информационно-поисковые языки (ИПЯ), то есть языки, на которых обращаются пользователи к системе. Языки представления данных в ИПС. Естественные языки и языки разметки, на которых представлены документы- первоисточники.
3 © ElVisti3 Возможности ИПЯ: поиск по словам и словоформам Все поисковые системы обеспечивают поиск хотя бы по одному слову. Некоторые системы рассматривают все слова запроса как правые усечения. У некоторых такая возможность не реализована, например у Google, Alltheweb. В Рамблер и в Яndex, морфологический инструментарий позволяет искать по всем словоформам исходного терма.
4 © ElVisti4 Возможности ИПЯ: поиск по словам и словоформам Поиск по словоформам является результатом серьезного лингвистического анализа и реализован в русскоязычных системах Апорт, Яndex и Рамблер, а также в укранской системе META. Большинство современных систем способно реализовывать контекстный поиск заключенной в кавычки фразы (Google, Alltheweb, AltaVista, Lycos и др.). Такая способность - это реализация неявно указанных с помощью кавычек операторов контекстной близости.
5 © ElVisti5 Возможности ИПЯ: операторы В большинстве современных систем реализованы булевы операторы AND, OR и NOT, а также работа со скобками. Можно отметить, что у самой популярной в мире системы Google - самый лаконичный набор логических операторов - "+", OR и "-".
6 © ElVisti6 Возможности ИПЯ: операторы Большинство поисковых систем обеспечивает выполнение операций контекстной близости, одна из реализаций которой - поиск выражений в кавычках. Слова запроса, заключенного в двойные кавычки, ищутся в документах в том порядке и в тех формах, в которых они встретились в запросе. В свое время функции контекстной близости получили наибольшее развитие в системе Lycos, где были реализованы с помощью четырех операторов: ADJ, NEAR, FAR и BEFORE. При построении запросов может быть реализована возможность объединения слов в группы, которые будут аргументами некоторого оператора. Такие группы заключаются в скобки. Использование скобок позволяет создавать вложенные запросы, а также изменять приоритеты операторов, принятые по умолчанию.
7 © ElVisti7 Возможности ИПЯ: поиск по параметрам документов Возможность поиска по параметрам документов зачастую позволяет ограничивать диапазон поиска значениями URL, датам, заглавий и т.п. Чаще всего выйти на возможность поиска по параметрам можно из режима расширенного поиска. Во многих системах обеспечивается поиск по данным в форматах: HTML, PDF, RTF, MsWord. В Google, например, обеспечивается поиск по сайту ("site:"), определение ссылок на сайт ("admission site:"), поиск по ценам, например "DVD player $ ", странам, датам, доменам и т.д.
8 © ElVisti8 Адаптивные поисковые механизмы В последнее время получили распространение адаптивные интерфейсы уточнения запросов, чаще всего реализуемые путем кластеризации результатов первичного поиска. Появилось такое понятие, как метод "папок поиска" (Custom Search Folders), который представляет собой множество подходов, общее у которых - попытка сгруппировать результаты поиска и представить кластеры в удобном для пользователей виде.
9 © ElVisti9 Адаптивные поисковые механизмы
10 © ElVisti10 Информационный альбом InfoStream – совокупность нескольких показателей Слова и словосочетания в информационных портретах, применяемых, например, в системах Галактика Zoom и InfoStream, также позволяют адаптивно уточнять первичные запросы. В системе InfoStream информационный портрет расширен многочисленными дополнительными парметрами.
11 © ElVisti11 Классификатор-навигатор InfoStream
12 © ElVisti12 Алгоритм построения классификатора-навигатора
13 © ElVisti13 Практические рекомендации по поиску Начинайте поиск с наиболее известных и мощных поисковых серверов. Используйте специализированные видовые, тематические или региональные поисковые серверы, если они Вам известны. Внимательно прочтите инструкцию (help, FAQ) по выбранной поисковой системе. Выделяйте ключевые слова для поиска, наиболее точно отражающие интересующую Вас проблематику. Используйте поиск по параметрам, чаще всего предлагаемый в режимах расширенного поиска - это обеспечит фильтрацию документов по форматам, датам, размерам, странам, языкам и т.д.
14 © ElVisti14 Практические рекомендации по поиску Начинайте поиск с простых запросов в режимах простого поиска. По мере получения результатов расширяйте или уточняйте запросы с помощью дополнительных возможностей - используя логические и контекстные операторы, поиск по параметрам, переходя в режим расширенного поиска. Если Вас интересует достаточно широкий спектр информации, имеющей отношение к первичному запросу (например, при составлении обзора), смело используйте режим "поиск подобных документов". В случае наличия средств ранжирования выдачи по релевантности обязательно используйте их. Это позволит Вам достаточно быстро оценить результаты поиска в случаях, когда общие объемы выдачи могут превышать все разумные рамки.
15 © ElVisti Спасибо за внимание! Ландэ Д.В МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ Киев, Украина
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.