Учебная и научная тематика кафедры компьютерных технологий Введение в Internet Web-технологии Поиск в WWW Учебная и научная тематика кафедры компьютерных технологий Введение в Internet Web-технологии Поиск в WWW Лекция 15. Толстых Виктор Константинович, д. ф.-м. н., д. т. н., профессор кафедры компьютерных технологий ДонНУ. 1
доктор физико-математических наук, доктор технических наук, профессор кафедры компьютерных т ехнологий ДонНУ, член научного математического общества – Society for Industrial and Applied Mathematics, URL Дисциплины В. К. Толстых, читаемые студентам: 1.Internet-технологиии разработки приложений, 2.Современные Internet-технологии, 3.Интеллектуальные Web-технологии, 4.Программирование в Delphi, 5.Численные методы Полный перечень дисциплин – Основные научные публикации В. К. Толстых: 2 Толстых Виктор Константинович
Структура лекции 1.Введение в Internet, протоколы TCP/IP 2.Internet-адрес URL, домены 3.Web-сервер, Web-сайт, Web-браузер 4.Информационно-поисковые системы в Web, правила поиска 5.Разработка Web-страниц 3
Internet – это глобальная сеть компьютеров, работающая по протоколам TCP/IP Протокол – это правило приёма и передачи данных между компьютерами. IP IP (Internet Protocol) – интернет протокол, описывающий правила назначения адресов компьютерам. Всякий компьютер, имеющий IP-адрес называют хост- компьютером. TCP TCP (Transmission Control Protocol) – протокол, описывающий правила надёжной доставки данных хост-компьютерам. Файл, передаваемый в сетях TCP/IP, разбивается на маленькие пакеты (несколько КБ) с IP адресом получателя и контрольной сумой, согласно TCP. Эти пакеты самостоятельно приходят через Internet к получателю и там собираются в исходный файл. Испорченные пакеты, согласно TCP, повторяются заново. 4
Настройка сети: 5 URL стандарт (определитель местонахождения) ресурса) протокол://адрес сервера/путь к ресурсу/имя ресурса Домен IP-адрес (это делает DNS-сервер) Клиент–сервер сетевая архитектура, в которой работа распределена между поставщиками услуг – программы- серверы и заказчиками услуг – программы- клиенты, например,
Взаимодействие Клиент – Web-сервер Запрос клиента Ответ сервера Клиент создаёт запрос (Web-браузер: Internet Explorer, Opera, Mozila…) Web-Сервер готовит ответ Web-сайты Web-приложение (расширение сервера DLL, exe, ASP …) 6
HTTP HTML OK
Поиск в WWW Лидеры информационно-поисковых систем (ИПС) 8 Международные: Российские: Украинские:
Как работают ИПС Поисковая машина – это комплект программ: Spider («паук») программа, которая загружает в поисковую машину Web- страницы. Работает аналогично браузеру, но ничего не отображает ни на каком экране. Crawler («червяк», или «путешествующий паук») программа, способная найти на Web-странице все ссылки на другие страницы. Ее задача определить, куда дальше должен ползти «паук», руководствуясь ссылками или заранее заданным списком адресов. Indexer (индексатор) программа, которая «разбирает» страницу на составные части и анализирует их. Вычленяются и анализируются заголовки Web-страниц, заголовки документов, ссылки, текст документов, отдельно текст, выделенный полужирным шрифтом, курсивом и т.д. Глубина индексации может быть разной. Полные тексты документов в базу данных копируют не все поисковые роботы некоторые ограничиваются лишь заголовками. Database (база данных) хранилище всех данных, которые поисковая система загружает и анализирует. Требует огромных ресурсов как для хранения, так и для последующей обработки. Search Engine Results Engine (система выдачи результатов поиска) решает, какие страницы удовлетворяют запросу пользователя и в какой степени. Именно с этой частью поисковой системы «общается» пользователь.
Основные логические операторы Оператор RamblerЯndexGoogle Логическое И And & пробел & пробел (в пределах предложения) && (в пределах документа) пробел Логическое ИЛИ Or | | OR Логическое НЕ NOT ! ~ (в пределах предложения) ~~ (в пределах документа) – Группировка()
11 Есть или сыр, или колбаса Есть одновременно и сыр и колбаса
12 Есть одновременно и сыр и грибы Есть сыр но нет грибов
Разработка Web-страниц Файл test.htmltest.html Теги Теги – средства оформительской разметки текста Web-страницы для показа в браузере. Теги могут иметь атрибуты, уточняющие действие тега. Перечень тегов и их атрибутов приводятся в справочниках. 13
Свойства браузера 14
Пример теста 16 Что такое TCP-протокол? 1.правило контроля качества передачи пакетов в Internet-сетях 2.реестр посетителей Internet 3.правило надёжной доставки данных хост-компьютерам 4.правило адресации компьютеров в Internet 5.правило доступа к Internet-серверам Правильные ответы 1, 3
Термины и их определения 17 IP IP – Internet Protocol TCP TCP – Transmission Control Protocol URL URL – Uniform Resource Locator Сервер Сервер – программа поставщик услуг Клиент Клиент – программа заказчик услуг Web-сервер Web-сервер – программа поставщик Web-услуг HTTP HTTP – HyperText Transfer Protocol HTML HTML – HyperText Markup Language ИПС ИПС – информационно-поисковая система Spider Spider – программа «паук» ИПС Crawler Crawler – программа « червяк » ИПС Теги Теги – средства разметки текста Web-страницы Атрибуты Атрибуты – уточняют действия тегов Временные Интернет файлы Временные Интернет файлы – кэш копии Web-ресурсов, полученных браузером Куки Куки – файлы «памяти» Web-сервера, хранящиеся в браузере
Список литературы Интернет [Электронный ресурс] // ВикипедиЯ Режим доступа к ресурсу: Толстых В. К. Характеристики ИПС Режим доступа к ресурсу: Internet- technologies/Характеристики ИПС.ppt Internet- technologies/Характеристики ИПС.ppt Толстых В. К. Введение в Web-технологии Режим доступа к ресурсу: Internet-applications/Введение в Web-технологии.ppt Internet-applications/Введение в Web-технологии.ppt