©Академия последипломного образования, 2012 Поиск информации в Internet
©Академия последипломного образования, Процедура поиска информации Запрос Поиск Гостиница «Минск» Город Минск Столица РБ Возникновение информационной потребности «Минск»
©Академия последипломного образования, Основные понятия Информационная потребность – формирование у пользователя необходимости найти сведения по какому-либо вопросу. Ключевые слова – набор понятий и терминов, характеризующих информационную потребность. Запрос – выделенное множество ключевых слов с зафиксированными отношениями между ними. Информационно-поисковое пространство – множество документов, над которым работает система поиска.
©Академия последипломного образования, Основные понятия Выдача (отклик) – список документов, отобранных информационно-поисковой системой. Релевантность отклика – мера соответствия отклика запросу. Информационный шум – документы, формально релевантные запросу, но не соответствующие информационной потребности
©Академия последипломного образования, Характеристики результатов поиска Гостиница «Минск» Город Минск Столица РБ Запрос: «Минск» Соответствуют информационной потребности Релевантны запросу
©Академия последипломного образования, Характеристики результатов поиска Выданные документы Выданные релевантные документы Релевантные документы Пространство документов
©Академия последипломного образования, Характеристики результатов поиска Число выданных релевантных документов Полнота = Число релевантных документов Internet Выданные документы Выданные релевантные документы Релевантные документы Пространство документов
©Академия последипломного образования, Характеристики результатов поиска Число выданных релевантных документов Точность = Число выданных документов Выданные документы Выданные релевантные документы Релевантные документы Пространство документов
©Академия последипломного образования, Характеристики результатов поиска Выданные документы Выданные релевантные документы Релевантные документы Пространство документов Пространство доступных ИПС документов Пространство релевантных документов, недоступных ИПС
©Академия последипломного образования, Характеристики результатов поиска Актуальность Пространство документов Документы, представленные в ИПС, реально отсутствующие в сети Документы, представленные в ИПС присутствующие в сети Пространство документов, представленных в ресурсах, на которых осуществляется поиск
©Академия последипломного образования, Характеристики результатов поиска Полнота Точность Актуальность Скорость получения информации выбор информационно- поискового пространства внутри сети особенности информационно-поисковой системы «качество» построения запроса
©Академия последипломного образования, Основные информационные пространства Интернет Документально-информационные ресурсы страницы во всемирной паутине WWW файлы в службах передачи файлов (FTP) базы данных …….. Коммуникационные ресурсы форумы социальные ресурсы ………
©Академия последипломного образования, Понижение точности поиска: Полисемия (многозначные слова) Омонимия (разные слова, но пишутся одинаково) Наличие омографов (замок/замок) Наличие омоформ (печь/печь) Учет особенностей естественного языка Особенности составления запросов Повышение точности поиска использование профессионализмов использование названий, фамилий и т.д. использование синонимов использование гипонимов (береза – дерево)
©Академия последипломного образования, Уточнение запроса посредством использования возможностей расширенного поиска Особенности составления запросов
©Академия последипломного образования, Особенности лексики документов Internet Особенности составления запросов Произвольное использование заимствованных и интернациональных слов (Интернет – Internet) Некорректное использование лексических единиц языка (болотный – болотистый)
ПОИСКОВЫЕ СИСТЕМЫ. ОПРЕДЕЛЕНИЕ Программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете 16
17 ПОИСКОВЫЕ СИСТЕМЫ. КЛАССИФИКАЦИЯ По области поиска: локальные региональные глобальные специализированные
18 КЛАССИФИКАЦИЯ СРЕДСТВ ПОИСКА WWW
19 АДРЕСА ИЗВЕСТНЫХ КАТАЛОГОВ Зарубежные: Open Directory – Российские: Weblist – Белорусские: All.By: Весь белорусский интернет –
АДРЕСА ПОПУЛЯРНЫХ ПОИСКОВЫХ МАШИН Зарубежные: Google – Bing – Российские: Рамблер – Яndex – Белорусские: TUT.BY – 20
АДРЕСА МЕТАПОИСКОВЫХ СИСТЕМ MetaCrawler - Dogpile - Search.com - Нигма - интеллектуальная поисковая система
22 ПОПУЛЯРНЫЕ ПРОГРАММЫ УСКОРЕННОГО ПОИСКА. АДРЕСА РАЗРАБОТЧИКОВ WebFerret - Copernic - Subject Search Spider (SSSpider) -
23
35
51