Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемАфанасий Трефолев
1 РАЗРАБОТКА ТРАНСЛЯТОРА ПОИСКОВЫХ ЗАПРОСОВ К ПОИСКОВЫМ СИСТЕМАМ Р.М. Пономаренко \ Волжский политехнический институт (филиал) ВолгГТУ г. Волжский, Волгоградская обл., Россия
2 В данной статье автор рассматривает разработку транслятора поисковых запросов к информационно - поисковым системам и проведение исследования о влияние формирования запроса на эффективность использования информационно - поисковых систем 2
3 Основные протоколы, используемые в Интернете, не обеспечены достаточными встроенными функциями поиска, не говоря уже о миллионах серверах, находящихся в нем. Из - за быстрого роста информации, доступной в сети, навигационные методы просмотра быстро достигают предела их функциональных возможностей, не говоря уже о пределе их эффективности. И по сколько очень сложно найти нужную информацию среди большого объема данных, проблема эффективного поиска в Интернете является актуальной, и по сей день. Помощь в решении этой проблемы может оказать язык запросов поисковых систем, дающий широкие функциональные возможности для детализации поиска и экономии времени. Но по сколько количество поисковых систем очень велико и все они имеют свои собственные каталоги ссылок на документы, то зачастую информация, не найденная в одной поисковой системе, может быть найдена в другой. Все крупные поисковые системы имеют специальную форму расширенного поиска, включающую операторы языка запросов, не доступные в основной форме поиска. Знание операторов языка запросов не только существенно облегчает работу с поисковой системой, но и помогает находить информацию, добыть которую только с помощью простых запросов практически невозможно. Расширенный поиск – мощный инструмент, который позволяет искать информацию и документы определенного формата, только на определенном сайте, опубликованную в строго заданном временном диапазоне, опубликованную на каком – либо из языков и т. п. 3
4 Но, на подбор и написание операторов для требуемого запроса необходимо время и, к сожалению, не существует общепринятого стандарта для операторов языка поисковых машин. Для примера рассмотрим запрос с использованием обязательного присутствия слова, точной фразы и исключенным словом в таблице 1: Таблица 1 – Сравнение операторов языка запроса на примере В связи с этим был разработан транслятор поисковых запросов популярнейших в России поисковых систем – GRYa Simple, который повышает эффективность задачи поисковых запросов и предоставляет новый рациональный интерфейс, который гораздо удобней воспринимается пользователем и позволяет, задав все необходимые параметры поиска, сгенерировать автоматические команды для трех поисковых систем одновременно [2]. Но, так как пользователю информационно - поисковой системы предоставляется полный контроль над составлением запроса, то было решено уделить внимание тому, влияет ли особенность формирования запроса на эффективность использования информационно - поисковых систем. 4 Запрос к поисковой системе Google + периферийные + устройства OR " драйвер SLI" - принтер Яндекс & периферийные & устройства | " драйвер SLI" - принтер Rambler && периферийные && устройства || " драйвер SLI" ! принтер
5 Исходя из принципа композиции Фреге, то значение слова ( или группы слов ) можно определить по формам и расположению окружающих слов. Это означает, что если в поисковом запросе опустить некоторое слово или группу слов ( создать « смысловую ловушку »), то в результатах поисковой выдачи будут автоматически получены документы, где на месте пропущенного слова будут стоять новые знания, которые близки к смыслу исходного документа [1]. Для оценки адекватности моделей каждый из опытов включал в себя две независимые реплики, тематически не связанные между собой. Во время планирования и выполнения эксперимента рассматривались две функции отклика : число найденных в результате запроса документов (Y 1 ) и число релевантных документов, содержащихся в первых 50- ти найденных документах (Y 2 ). Эксперимент проводился по исследованию влияния трех факторов : A - наличие пропущенного фрагмента текста ; B - учет порядка слов в запросе ; C - учет морфологических форм слов. По результатам эксперимента были построены математические модели : Y 1 =0,432-0,016A-0,408B+0,053C+0,021AB+0,009AC-0,028BC-0,004ABC Y 2 =0,365-0,087A-0,026B-0,083C-0,042AB-0,03AC+0,087BC-0,026ABC Данный эксперимент оказался удачным и показал, что благодаря построению « смысловых ловушек » можно получать новые знания из Интернета, а учет синтаксиса ( порядка слов ) ведет к уменьшению общего числа найденных страниц. Поскольку это не уменьшает числа релевантных ссылок на первых страницах результата поиска, то это еще раз доказывает, что учет синтаксиса снижает шум поиска ( уменьшает количество нерелевантных документов ), а создание « смысловых ловушек » в запросе увеличивает число релевантных результатов поиска [1]. 5
6 Список использованных источников Воскресенский А. Л. Формирование запросов к поисковой машине для извлечения знаний из интернета. Труды международной конференции Диалог '2005, 2005 г. Формирование Пономаренко Р. М., Рыбанов А. А. Анализ показателей поисковых систем. Труды конференции Пятнадцатая межвузовская научно - практическая конференция молодых ученых и студентов г. Волжского, 2009 г. 6
7 Расширенный поиск информационно - поисковой системы Google 9
8 Расширенный поиск информационно - поисковой системы Rambler 9
9 Расширенный поиск информационно - поисковой системы Яндекс 9
10 Сравнение основных операторов языка запроса поисковых систем Google, Rambler и Яндекс 10 Операторы языка запросовRamblerЯндексGoogle Логическое и.AND или &&& или ++ Логическое неNOT или !~~– Логическое илиOR или |||~ Поиск на сайте-urlsite Поиск по заголовкам-titleintitle Формат файлов-mimefiletype
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.