Технология поиска информации в Интернете
Поиск по адресам URL URL (Uniform Resource Locator) используется в World Wide Web для задания местоположения файлов на других серверах сети. URL (Uniform Resource Locator) используется в World Wide Web для задания местоположения файлов на других серверах сети. Примером URL является:
Поисковые системы Поисковые машины – это автоматические системы, опрашивающие серверы, подключенные к глобальной сети, и сохраняющие в своей базе информацию об имеющихся на серверах данных.
Поисковые машины состоят из трех частей: Робот(Spider, Robot или Bot) –программа, которая посещает веб страницы и считывает(полностью или частично) их содержимое. Робот(Spider, Robot или Bot) –программа, которая посещает веб страницы и считывает(полностью или частично) их содержимое. Индекс поисковой системы – это хранилище поисковых образов, посещенных роботами страниц. Поисковый образ документа (в том числе и веб-страницы) – это описание содержания документа на специальном информационно-поисковом языке. Это описание содержит коды ключевых слов документа, отражающих его смысл и содержание. Индекс поисковой системы – это хранилище поисковых образов, посещенных роботами страниц. Поисковый образ документа (в том числе и веб-страницы) – это описание содержания документа на специальном информационно-поисковом языке. Это описание содержит коды ключевых слов документа, отражающих его смысл и содержание.
Программа обработки запроса – это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы. Множество ссылок на выходе системы распределяется программой в порядке убывания релевантности, то есть от наибольшей степени соответствия ссылки запросу к наименьшей. Программа обработки запроса – это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы. Множество ссылок на выходе системы распределяется программой в порядке убывания релевантности, то есть от наибольшей степени соответствия ссылки запросу к наименьшей.
Поисковые системы для российских пользователей: Яндекс ( Яндекс ( Апорт ( Апорт ( Рамблер ( Рамблер (
Поисковые машины различаются по охвату информационных ресурсов: Поисковые машины общей тематики имеют базу данных по всем направлениям знаний и отличаются обширным индексом и большим объемом накапливаемой информации; Поисковые машины общей тематики имеют базу данных по всем направлениям знаний и отличаются обширным индексом и большим объемом накапливаемой информации; Поисковые машины специального назначения просматривают только сайты по определенной тематике, например музыкальные или музейные. Поисковые машины специального назначения просматривают только сайты по определенной тематике, например музыкальные или музейные.
Основными характеристиками поисковых машин являются: Объем документов в индексе; Объем документов в индексе; Частота обновления информации; Частота обновления информации; Информационное пространство, которое охватывает робот поисковой машины, и разнообразие типов документов, о которых собирается информация; Информационное пространство, которое охватывает робот поисковой машины, и разнообразие типов документов, о которых собирается информация; Скорость обработки запроса; Скорость обработки запроса; Критерий определения релевантности (соответствия найденного документа поисковому запросу); Критерий определения релевантности (соответствия найденного документа поисковому запросу); Возможность детализации и уточнения запроса Возможность детализации и уточнения запроса
Поиск по рубрикатору поисковой системы. Поиск по ключевым словам
Правила формирования запроса: Ключевые слова в запросе следует писать строчными (маленькими) буквами. Ключевые слова в запросе следует писать строчными (маленькими) буквами. При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе. При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе. Для поиска устойчивого словосочетания следует заключить слова в кавычки. Для поиска устойчивого словосочетания следует заключить слова в кавычки. Для поиска по точной словоформе перед словом надо поставить восклицательный знак. Для поиска по точной словоформе перед словом надо поставить восклицательный знак. Для поиска внутри одного предложения слова в запросе разделяют пробелом или знаком &. Для поиска внутри одного предложения слова в запросе разделяют пробелом или знаком &.
Правила формирования запроса: Что бы были отобраны только те документы, в которых встретилось каждое слово, указанное в запросе, поставьте перед каждым из них знак плюс «+». Если вы хотите исключить какие либо слова из результата поиска, поставьте перед этим словом минус «-». Знаки надо писать через пробел от предыдущего и слитно со следующим словом. Что бы были отобраны только те документы, в которых встретилось каждое слово, указанное в запросе, поставьте перед каждым из них знак плюс «+». Если вы хотите исключить какие либо слова из результата поиска, поставьте перед этим словом минус «-». Знаки надо писать через пробел от предыдущего и слитно со следующим словом. При поиске синонимов или близких по значению слов между словами можно поставить вертикальную черту «|». Например, по запросу «ребенок | малыш | младенец» будут найдены документы с любым из этих слов. При поиске синонимов или близких по значению слов между словами можно поставить вертикальную черту «|». Например, по запросу «ребенок | малыш | младенец» будут найдены документы с любым из этих слов. Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки, например «(ребенок | малыш | дети | младенец) +(уход | воспитание)». Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки, например «(ребенок | малыш | дети | младенец) +(уход | воспитание)». Знак «~» (тильда) позволяет найти документы с предложением, содержащим первое слово, но не содержащим второе. Например «книги ~ магазин». Знак «~» (тильда) позволяет найти документы с предложением, содержащим первое слово, но не содержащим второе. Например «книги ~ магазин». Если оператор повторяется один раз (например, & или ~), поиск производится в пределах предложения. Двойной оператор (&&, ~~) задает поиск в пределах одного документа. Например, по запросу «рак ~~ астрология» Если оператор повторяется один раз (например, & или ~), поиск производится в пределах предложения. Двойной оператор (&&, ~~) задает поиск в пределах одного документа. Например, по запросу «рак ~~ астрология»
I вариант Поисковые машины – Поисковые машины – Индекс поисковой системы – Индекс поисковой системы – Программа обработки запроса – Программа обработки запроса – Основными характеристиками поисковых машин являются: Основными характеристиками поисковых машин являются: Правила формирования запроса: Правила формирования запроса: II вариант Робот(Spider, Robot или Bot) – Робот(Spider, Robot или Bot) – Поисковый образ документа – Поисковый образ документа – Поисковые системы для российских пользователей: Поисковые системы для российских пользователей: Поисковые машины по охвату информационных ресурсов: Поисковые машины по охвату информационных ресурсов: Правила формирования запроса: Правила формирования запроса: