ПОИСКОВАЯ СИСТЕМА Поисковая система Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу)
ПОПУЛЯРНЫЕ ПОИСКОВЫЕ СИСТЕМЫ
ЗАДАЧА ПОИСКОВОЙ СИСТЕМЫ задача любой поисковой системы Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут. Алгоритмы и принципы работы поисковых систем позволяют находить пользователям искомую ими информацию.
ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ПОИСКОВОЙ СИСТЕМЫ 1. Полнота 2. Точность 3. Актуальность 4. Скорость поиска 5. Наглядность
СОСТАВ ПОИСКОВОЙ СИСТЕМЫ 1. Модуль индексирования 2. База данных 3. Поисковый сервер
ПОЛНОТА и ТОЧНОСТЬ Полнота Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. Точность - характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя.
АКТУАЛЬНОСТЬ, СКОРОСТЬ ПОИСКА и НАГЛЯДНОСТЬ Актуальность Актуальность - характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Скорость поиска Скорость поиска - посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов. Наглядность - представления результатов является важным компонентом удобного поиска. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.
МОДУЛЬ ИНДЕКСИРОВАНИЯ Spider (паук) Spider (паук) – программа, предназначенная для скачивания веб- страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Crawler («путешествующий» паук) Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе. Indexer (робот- индексатор) Indexer (робот- индексатор) - программа, которая анализирует веб- страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы.