Каждая наука лишь тогда достигает своего совершенства, когда породнится с математикой. Кант СИСТЕМНОЕ И ПРИКЛАДНОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ Тема лекции: Служба WWW Автор-составитель: к.ф.-м.н., доцент каф. ВМ и И СамГУ, Ширяева Л.К.
2 WWW (World Wide Web) – это гипертекстовая информационно- справочная система в Интернет. Основной структурный элемент WWW– это Web-страница. Опр. Web-страница –это файл, форматированный средствами языка HTML и содержащий текстовую и (или) графическую информацию, а также ссылки на другие документы сети Интернет. Таким образом, физически Web-страница представляет собой файл с расширением.htm или.html. Графические объекты, содержащиеся в Web-странице, это файлы форматов.Gif или.Jpg. В ссылку Web-страницы встраивается невидимый для пользователя указатель в формате URL. Для перехода к документу, на который указывает ссылка, достаточно щелкнуть по ней левой кнопкой мыши. Замечание. Гипертекст-это документ, который наряду с текстовой и графической информацией содержит ссылки на другие документы. Важным свойством гипертекста является автоматический доступ к информации, связанной со ссылкой. Ссылки могут быть связаны с определением, пояснением отдельных слов, изображений, входящих в текст. Всемирная Паутина представляет собой расширение гипертекстовых систем на тексты, которые могут находиться в любом из компьютеров Сети. Это означает, что информация, связанная с гипертекстовым полем какого-либо текста, может фактически находиться не на том компьютере, на котором просматривается текст, но на некотором другом компьютере Сети, удаленном от данного, быть может, на десятки тысяч км. Понятие WWW
3 Компоненты WWW Информационный Ресурс: Web- страница Web-сайт Web-портал Web-сервер Универсальный Web-клиент Протокол взаимодействия клиента с Web- сервером HTTP
4 HTTP Hyper Text Transfer Protocol Принцип взаимодействия на основе протокола HTTP предполагает следующую последовательность действий: 1) Клиент формирует сообщение-запрос и передает его клиенту 2) Сервер получает сообщение-запрос, анализирует и обрабатывает его, формирует сообщение-ответ и отправляет его клиенту. Сообщение-запрос всегда содержит строку запроса с командой для сервера, а также параметры команды: URL, ключевые слова и т.д.
5 Группа Web-страниц образует сайт (от англ. site-участок). Сайт – это совокупность Web-страниц, принадлежащая частному лицу или организации и размещенная на каком-либо Web-сервере. В целом,Web-страницы, сайты, Web-серверы и образуют Всемирную Паутину- WWW. Замечание. На одном Web-сервере могут находиться несколько сайтов. Иногда сайтом называют также подкаталог лица или организации на FTP-сервере.
6 СПОСОБЫ ОРГАНИЗАЦИИ Web-сайтов Иерархическая организация Линейная организация Паутинная организация
7 Иерархическая организация Web-сайта Данный подход удобен, если информация легко разбивается на категории и подкатегории. При этом к страницам самого нижнего уровня ведет только один путь, а сам Web-сайт имеет только одну точку входа.
8 Линейная организация Web-сайта Линейная организация используется, если необходимо, чтобы пользователи читали содержимое сайта как книгу, от начала и до конца. При такой организации какая-то страница может иметь несколько связей с примечаниями и дополнениями, но для продвижения дальше пользователь должен вернуться на нее снова.
9 Паутинная организация сайта В этом случае страницы связаны друг с другом общим контекстом. К одной странице может вести насколько связей (гиперссылок). Эти связи иногда образуют круг. Для такой организации характерен быстрый проход и большая свобода передвижения.
10 Для адресации ресурсов Сети используется адрес, или унифицированный указатель на ресурс- URL (Uniform Resource Locator). АДРЕСАЦИЯ УЗЛОВ СЕТИ РЕСУРСЫ СЕТИ СЕРВЕРЫСАЙТЫКаталогиФайлы
11 Общий формат URL Замечание. Если путь к конкретной странице не указан, то подразумевается начальная страница Web-сайта или Web- сервера. Если не указан путь к файлу или каталогу, то подразумевается корневой каталог данного FTP-сервера.
12 Примеры URL. а) для протокола HTTP: б) для протокола FTP:
13 г) для протокола TELNET в) для протокола GOPHER
14 ПОИСК ИНФОРМАЦИИ В СЕТИ ОСНОВНАЯ ПРОБЛЕМА: в Сети содержатся миллионы документов с неструктурированной текстовой информацией, а также с графикой и видео. Другая проблема: как разыскать необходимую информацию в условиях, когда ее поток непрерывно и практически бесконтрольно возрастает?
15 Классификацию поисковых служб строят на основании того, насколько автоматизированы в них сбор и обработка информации, т.е. кто набирает БД- люди или компьютеры. СПРАВОЧНЫЕ (ПОИСКОВЫЕ) СЛУЖБЫ СЕТИ ИНТЕРНЕТ ПОИСКОВЫЕ СЛУЖБЫ СЕТИ УНИВЕРСАЛЬНЫЕ СЛУЖБЫ СПЕЦИАЛИЗИРОВАННЫЕ СЛУЖБЫ, или ТЕМАТИЧЕСКИЕ КАТАЛОГИ Основной принцип поиска в неструктурированных документах- поиск по ключевым словам
16 WEB-сервер ПОИСКОВАЯ МАШИНА ПОИСКОВЫЙ РОБОТ (ПАУЧОК) СТРУКТУРА УНИВЕРСАЛЬНОЙ СЛУЖБЫ ПОИСКА
17 непрерывно просматривает WEB-страницы, выбирает ключевые слова, составляет БД индексов Эта БД содержит ключевые слова и адреса документов, в эти слова обнаружены. 1. ФУНКЦИИ ПОИСКОВОГО РОБОТА: 3. ФУНКЦИИ WEB-СЕРВЕРА: Принимает от пользователя запрос на поиск, преобразует его и передает поисковой машине Получает от поисковой машины результаты запроса, оформляет результаты запроса в удобном для пользователя виде и передает их на машину клиента.. 2. ФУНКЦИИ ПОИСКОВОЙ МАШИНЫ: Просматривает БД индексов и составляет список страниц, удовлетворяющих условиям запроса
18 RAMBLER, LYCOS, AltaVista, INFOSEEK ПРИМЕРЫ универсальных поисковых служб
19 Специализированные справочные службы: Хранят структурированные сведения об адресах серверов по той или иной тематике
20 ПРИМЕРЫ специализированных поисковых служб YAHOO, GALAXY, MAGELLAN, Библиотека Мошкова
21 Основные принципы создания запросов на поиск информации Поиск в Сети гораздо менее формализирован, чем в структуированных БД. В каждой поисковой системе приняты собственные соглашения на создание запросов. В основе запросов на поиск и выборку информации лежит аппарат алгебры логики.
22 Пример: AltaVista Простейший запрос- отобразить страницы Интернет, которые содержат одно заданное слово. Сложный запрос содержит несколько слов. 1. Несколько слов, набранные через пробел, обозначают запрос, соответствующий логической операции «ИЛИ=OR» 2. Несколько слов, заключенных в каывчки воспринимаются как одно целое. 3. Слова, соединенные знаком «+», соответствуют операции логического умножения «И=AND»