РАЗРАБОТКА ТРАНСЛЯТОРА ПОИСКОВЫХ ЗАПРОСОВ К ПОИСКОВЫМ СИСТЕМАМ Р.М. Пономаренко \ www.ponomarenko.com.ru www.ponomarenko.com.ru Волжский политехнический.

Презентация:



Advertisements
Похожие презентации
Диалог-2005, "Звенигородский" 1 ФОРМИРОВАНИЕ ЗАПРОСОВ К ПОИСКОВОЙ МАШИНЕ ДЛЯ ИЗВЛЕЧЕНИЯ ЗНАНИЙ ИЗ ИНТЕРНЕТА А.Л. Воскресенский,
Advertisements

Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета. Существуют три основных способа.
Ачинский район, 2010 г. Районный конкурс педагогических работников – молодых специалистов «ПОЗИТИВ» Богданова Дарья Вячеславовна, учитель информатики МОУ.
Интернет Интернет – это … … сеть, которая включает в себя …, … и … сети и объединяет миллионы … по всему миру.
Учитель математики, информатики и ВТ Земскова В.Х п. Кушокы.
Учитель информатики Артеменко Т.В. Поиск информации в Интернет.
Анализ данных Введение в информационный поиск. План оставшихся лекций 1.Введение в информационный поиск 2.Нормализация и извлечение информации из текста.
Как найти "бесплатный сыр" в интернете? Работа с поисковыми системами.
Кто ищет - тот находит! Способы поиска в Интернете Три способа поиска Поисковые серверы Язык запросов поисковой системы МУНИЦИПАЛЬНОЕ ОБЩЕОРАЗОВАТЕЛЬНОЕ.
SoftInform Search Technology PlagiatInform.
Безопасный поиск в сети ИНТЕРНЕТ. Интернет Интернет – это … … сеть, которая включает в себя …, … и … сети и объединяет миллионы … по всему миру.
Поисковая оптимизация (SEO) – введение Поисковые машины Сервисы статистики, оценка трафика Обзор основных инструментов.
Интернет служба World Wide Web. Способы поиска информации в Интернете В интернете есть все? Пространство Web быстрее наполняется или систематизируется?
УЧИТЕЛЬ ИНФОРМАТИКИ ХАХУЛИНА И.Н. МОУ СОШ 3 Поисковые системы.
П ОИСК ИНФОРМАЦИИ В И НТЕРНЕТЕ Работу выполнила: Забавина Татьяна.
ПРАКТИЧЕСКИЕ СОВЕТЫ ПО РАЦИОНАЛЬНОМУ ПОИСКУ ИНФОРМАЦИИ В СЕТИ INTERNET.
Система поиска и оценки научно-технической информации Зуев Иван К.б.н., доцент кафедры водных и наземных экосистем СФУ.
Разработка учителя информатики и ИКТ МОУ «Майская гимназия Белгородского района» Токарь Татьяны Васильевны Разработка учителя информатики и ИКТ МОУ «Майская.
ГСНТИ задание 2.2«Разработать сервер доступа к библиотечным информационным ресурсам по протоколу z39.50 и систему обслуживания по принципу «Одно.
Поиск информации в Интернет (web). Способы поиска информации в web Поиск информации – одна из самых востребованных на практике задач, которую приходится.
Транксрипт:

РАЗРАБОТКА ТРАНСЛЯТОРА ПОИСКОВЫХ ЗАПРОСОВ К ПОИСКОВЫМ СИСТЕМАМ Р.М. Пономаренко \ Волжский политехнический институт (филиал) ВолгГТУ г. Волжский, Волгоградская обл., Россия

В данной статье автор рассматривает разработку транслятора поисковых запросов к информационно - поисковым системам и проведение исследования о влияние формирования запроса на эффективность использования информационно - поисковых систем 2

Основные протоколы, используемые в Интернете, не обеспечены достаточными встроенными функциями поиска, не говоря уже о миллионах серверах, находящихся в нем. Из - за быстрого роста информации, доступной в сети, навигационные методы просмотра быстро достигают предела их функциональных возможностей, не говоря уже о пределе их эффективности. И по сколько очень сложно найти нужную информацию среди большого объема данных, проблема эффективного поиска в Интернете является актуальной, и по сей день. Помощь в решении этой проблемы может оказать язык запросов поисковых систем, дающий широкие функциональные возможности для детализации поиска и экономии времени. Но по сколько количество поисковых систем очень велико и все они имеют свои собственные каталоги ссылок на документы, то зачастую информация, не найденная в одной поисковой системе, может быть найдена в другой. Все крупные поисковые системы имеют специальную форму расширенного поиска, включающую операторы языка запросов, не доступные в основной форме поиска. Знание операторов языка запросов не только существенно облегчает работу с поисковой системой, но и помогает находить информацию, добыть которую только с помощью простых запросов практически невозможно. Расширенный поиск – мощный инструмент, который позволяет искать информацию и документы определенного формата, только на определенном сайте, опубликованную в строго заданном временном диапазоне, опубликованную на каком – либо из языков и т. п. 3

Но, на подбор и написание операторов для требуемого запроса необходимо время и, к сожалению, не существует общепринятого стандарта для операторов языка поисковых машин. Для примера рассмотрим запрос с использованием обязательного присутствия слова, точной фразы и исключенным словом в таблице 1: Таблица 1 – Сравнение операторов языка запроса на примере В связи с этим был разработан транслятор поисковых запросов популярнейших в России поисковых систем – GRYa Simple, который повышает эффективность задачи поисковых запросов и предоставляет новый рациональный интерфейс, который гораздо удобней воспринимается пользователем и позволяет, задав все необходимые параметры поиска, сгенерировать автоматические команды для трех поисковых систем одновременно [2]. Но, так как пользователю информационно - поисковой системы предоставляется полный контроль над составлением запроса, то было решено уделить внимание тому, влияет ли особенность формирования запроса на эффективность использования информационно - поисковых систем. 4 Запрос к поисковой системе Google + периферийные + устройства OR " драйвер SLI" - принтер Яндекс & периферийные & устройства | " драйвер SLI" - принтер Rambler && периферийные && устройства || " драйвер SLI" ! принтер

Исходя из принципа композиции Фреге, то значение слова ( или группы слов ) можно определить по формам и расположению окружающих слов. Это означает, что если в поисковом запросе опустить некоторое слово или группу слов ( создать « смысловую ловушку »), то в результатах поисковой выдачи будут автоматически получены документы, где на месте пропущенного слова будут стоять новые знания, которые близки к смыслу исходного документа [1]. Для оценки адекватности моделей каждый из опытов включал в себя две независимые реплики, тематически не связанные между собой. Во время планирования и выполнения эксперимента рассматривались две функции отклика : число найденных в результате запроса документов (Y 1 ) и число релевантных документов, содержащихся в первых 50- ти найденных документах (Y 2 ). Эксперимент проводился по исследованию влияния трех факторов : A - наличие пропущенного фрагмента текста ; B - учет порядка слов в запросе ; C - учет морфологических форм слов. По результатам эксперимента были построены математические модели : Y 1 =0,432-0,016A-0,408B+0,053C+0,021AB+0,009AC-0,028BC-0,004ABC Y 2 =0,365-0,087A-0,026B-0,083C-0,042AB-0,03AC+0,087BC-0,026ABC Данный эксперимент оказался удачным и показал, что благодаря построению « смысловых ловушек » можно получать новые знания из Интернета, а учет синтаксиса ( порядка слов ) ведет к уменьшению общего числа найденных страниц. Поскольку это не уменьшает числа релевантных ссылок на первых страницах результата поиска, то это еще раз доказывает, что учет синтаксиса снижает шум поиска ( уменьшает количество нерелевантных документов ), а создание « смысловых ловушек » в запросе увеличивает число релевантных результатов поиска [1]. 5

Список использованных источников Воскресенский А. Л. Формирование запросов к поисковой машине для извлечения знаний из интернета. Труды международной конференции Диалог '2005, 2005 г. Формирование Пономаренко Р. М., Рыбанов А. А. Анализ показателей поисковых систем. Труды конференции Пятнадцатая межвузовская научно - практическая конференция молодых ученых и студентов г. Волжского, 2009 г. 6

Расширенный поиск информационно - поисковой системы Google 9

Расширенный поиск информационно - поисковой системы Rambler 9

Расширенный поиск информационно - поисковой системы Яндекс 9

Сравнение основных операторов языка запроса поисковых систем Google, Rambler и Яндекс 10 Операторы языка запросовRamblerЯндексGoogle Логическое и.AND или &&& или ++ Логическое неNOT или !~~– Логическое илиOR или |||~ Поиск на сайте-urlsite Поиск по заголовкам-titleintitle Формат файлов-mimefiletype