Основные понятия информационного поиска YANDEX.RUОсновные понятия информационного поиска YANDEX.RU.

Презентация:



Advertisements
Похожие презентации
Поисковые системы Интернет Тайны Всемирной паутины.
Advertisements

Средства поиска данных в Интернет yagod-sch.ucoz.ru (все уроки) Составил учитель ИКТ Фоломкин А.И.
Поисковые системы Интернет. Количество информации в мире растет: Калифорнийский университет подсчитал, что в 2002 году в мире произведено терабайт.
Поиск информации. Утенков С.А. Гимназия 1 г.Рузы Поисковые системы Интернет.
Поиск информации в Интернете Количество информации в мире растет: Калифорнийский университет подсчитал, что в 2002 году в мире произведено
Технология поиска информации в Интернете. Поиск по адресам URL URL (Uniform Resource Locator) используется в World Wide Web для задания местоположения.
Язык запросов. Общие принципы Поисковая система Яндекс (Yandex)
Поиск информации с использованием компьютера. Поиск папок и файлов на компьютере Если пользователь не помнит, в каком именно месте он сохранил папку или.
Кто ищет - тот находит! Способы поиска в Интернете Три способа поиска Поисковые серверы Язык запросов поисковой системы МУНИЦИПАЛЬНОЕ ОБЩЕОРАЗОВАТЕЛЬНОЕ.
Поиск информации в сети Интернет Презентация 8-11.
БИЦ (библиотечно- информационный центр) МОУ гимназия 28 г. Костромы Поиск информации в Интернете. Поисковая система Яндекс.
Поиск информации в Интернете. Поисковые системы содержат тематически сгруппированную информацию об информационных ресурсах Всемирной паутины в базах данных.
ОРГАНИЗАЦИЯ ПОИСКА ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ Использование поисковых каталогов Навигация по перекрестным ссылкам Обращение к поисковому серверу ИНФОРМАЦИЯ.
Интернет служба World Wide Web. Способы поиска информации в Интернете В интернете есть все? Пространство Web быстрее наполняется или систематизируется?
Урок 8.Передача информации в компьютерных сетях Язык запросов поисковой системы.
ЯЗЫК ЗАПРОСОВ ПОИСКОВОЙ СИСТЕМЫ «YANDEX» Синтаксис оператораКомментарийПримеры запросов пробел Логическое И (в пределах предложения) лечебная физкультура.
Поиск информации. Информатика 5 класс Учитель информатики МБОУ СОШ 20 Токар И.Н. Информатика ФГОСС.
Проверка домашнего задания. Ответьте на вопросы: 1.Что такое компьютерная сеть? Система компьютеров, связанных каналами передачи информации, называются.
Поисковые системы в сети Интернет. Поисковая система Поисковая система - специальный web- сайт, на котором пользователь по заданному запросу может получить.
Учитель информатики Артеменко Т.В. Поиск информации в Интернет.
Транксрипт:

Основные понятия информационного поиска YANDEX.RU

ПЛАН ЗАНЯТИЯ:

Основы структуры Линейные файлы Инвертированные файлы

Определение: запись, поле. Запись – обособленный элемент внутри базы данных; коллекция информации об определенном документе или предмете. Например: библиография + индексация и отрывок Поле - это обособленный элемент информации внутри записи, содержащий отдельный кусочек информации о документе Например: поле автора, поле заглавия и т.п.

Инвертированный файл Линейные файлы содержат записи Записи содержат поля Индексы или инвертированные файлы создаются из из слов в полях Поиск идет по индексам, а не по линейным файлам или самим документам.

Словарная и фразовая индексация Отдельные слова в полях могут быть выделены и отправлены в инвертированный файл: --> словарная индексация Фразы в полях также могут быть выделены и отправлены в инвертированный файл: --> фразовая индексация; индексация терминов; Поля могут иметь обе словарную и фразовую индексацию

Отличия словарной и фразовой индексации: Ключевое слово: вождение в пьяном виде Словарная индексация: Вождение Пьяный Вид Обе словарная и фразовая индексация: Вождение Вождение в пьяном виде Пьяный Вид Фразовая индексация: Вождение в пьяном виде

YANDEX.RU – СЛОВАРНАЯ ИНДЕКСАЦИЯ Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Если вы набрали в запросе слово с большой буквы, будут найдены только слова с большой буквы (если это слово не первое в предложении), в противном случае будут найдены как слова с большой, так и с маленькой буквы. По умолчанию поиск учитывает все формы заданного слова согласно правилам русского языка. Однако существует возможность поиска по точной словоформе, для этого перед словоформой надо поставить восклицательный знак '!'. '!Лужкову'

ПУНКТУАЦИЯ Каким образом трактуются знаки пунктуации при словарной индексации? (чаще всего игнорируются - трактуются как пробел). При фразовой индексации иногда знаки препинания остаются.

Логические операторы «И» «ИЛИ» «НЕТ»

«И»

Использование «И» Для уточнения результатов Для уменьшения количества результатов

YANDEX.RU Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа. Тот же самый эффект произведет употребление символа '&'. 'лечебная физкультура' или 'лечебная & физкультура'

«ИЛИ»

Использование «ИЛИ» Для синонимов и эквивалентов: студенты или учащиеся Для близких по смыслу слов: пневмония или заболевание легких Варианты написания (особенно английский): honor или honour

YANDEX.RU Между словами можно поставить знак '|', чтобы найти документы, содержащие любое из этих слов. 'фото | фотография | фотоснимок | снимок | фотоизображение'

«НЕТ»

Использование «НЕТ» Для удаления ненужных результатов Следует быть очень осторожными – среди удаленных результатов может быть очень полезная информация, использовать только в самом крайнем случае

YANDEX.RU Еще один знак, тильда '~', позволит найти документы с предложением, содержащим первое слово, но не содержащим второе. По запросу 'банки ~ закон' будут найдены все документы, содержащие слово 'банки', рядом с которым (в пределах предложения) нет слова 'закон'.

YANDEX.RU Знаки "+" и "-". Если вы хотите, чтобы слова из запроса обязательно были найдены, поставьте перед каждым из них "+". Если вы хотите исключить какие- либо слова из результата поиска, поставьте перед каждым из них "-". Знак "-" надо писать через пробел от предыдущего и слитно с последующим словом, вот так: 'рак -гороскоп'.

«Приближенность» или операторы расстояния Нахождение слов на расстоянии N- количества слов друг от друга: Oscar Wilde Oscar Fingal OFlahertie Wills Wilde Oscar (3N) Wilde

YANDEX.RU Задав запрос 'поставщики /2 кофе', вы требуете найти документы, в которых содержатся и слово 'поставщики' и слово 'кофе', причем расстояние между ними должно быть не более двух слов и они должны находиться в одном предложении. (Найдутся "поставщики колумбийского кофе", "поставщики кофе из Колумбии" и т.д.)

YANDEX.RU Если порядок слов и расстояние точно известны, можно воспользоваться пунктуацией '/+n'. Так, например, задается поиск слов, стоящих подряд. Запрос 'синяя /+1 борода' означает, что слово 'борода' должно следовать непосредственно за словом 'синяя'.

В общем виде ограничение по расстоянию задается при помощи пунктуации вида '/(n m)', где 'n' минимальное, а 'm' максимально допустимое расстояние. Отсюда следует, что запись '/n' эквивалентна '/(-n +n)', а запись '/+n' эквивалентна '/(+n +n)' Запрос 'музыкальное /(-2 4) образование' означает, что 'музыкальное' должна находиться от 'образование' в интервале расстояний от 2 слов слева до 4 слов справа.

YANDEX.RU Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки. Например, запрос '(история | технология | изготовление) /+1 (сыра | творога)' задает поиск документов, которые содержат любую из фраз 'история сыра', 'технология творога', 'изготовление сыра', 'история творога'.

Сокращение Библиотека Библиотекарь Библиотечный и пр. Сокращение позволяет вам найти все эти слова в документе не прибегая к их перечислению: Библиоте*

YANDEX.RU Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка.

Направленный поиск:

Ограничения Язык Тип файла Время Размер (картинки)

Ранжирование Порядок вывода документов на экран, Обычно, наиболее соответствующие запросу и «свежие» ссылки идут первыми.

YANDEX.RU При поиске для каждого найденного документа Яндекс вычисляет величину релевантности (соответствия) содержания этого документа поисковому запросу. Список найденных документов перед выдачей пользователю сортируется по этой величине в порядке убывания. Релевантность документа зависит от ряда факторов, в том числе от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.

YANDEX.RU Задание веса слова или выражения применяется для того, чтобы увеличить релевантность документов, cодержащих "взвешенное" выражение. Синтаксис: слово:число или (поисковое_выражение):число По запросу 'поисковые механизмы:5' будут найдены те же документы, что и по запросу 'поисковые механизмы'. Разница состоит в том, что наверху списка найденного окажутся документы, где чаще встречается именно слово 'механизмы'. Запрос 'поисковые (механизмы | машины | аппараты):5 ' равнозначен запросу 'поисковые (механизмы:5 | машины:5 | аппараты:5)'.

YANDEX.RU Задание уточняющего слова или выражения применяется для того, чтобы увеличить релеватность документов, cодержащих уточняющее выражение. Синтаксис: