Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемНиколай Таланов
1 Яндекс Лекция 3
2 Яndex – Генеральный директор - Аркадий Волож Открыт как подразделение компании CompTek, которая выпускала софт для поиска
3 Версии Яндекса Четверка Родео Родео2 Семерка – октябрь 2007 Восьмерка – Восьмёрка sp1 – Магадан – Магадан 2.0 Находка – Арзамас – (Анадырь) Арзамас 1.2 – Арзамас Арзамас – 1.5 SP1 Снежинск – (MatrixNet) Конаково – (+1250 городов) Обнинск – Краснодар – Рейкьявик –
4 Восьмёрка SP1 Навигационный поиск Студия Лебедева Ответы на любые запросы Колдунщики Распознание ссылочных накруток Качество ссылок и страниц, учет доверия к сайту
«гамбургский» Транслит и перевод – тойота и toyota, mail и почта Аббревиатуры – БМВ Улучшена распознаваемость фамилий и географических назв" title="Магадан – 19.05.2008 Обработка стоп слов - "C++" и "Европа+" Переход из одной части речи в другую «гамбург» -> «гамбургский» Транслит и перевод – тойота и toyota, mail и почта Аббревиатуры – БМВ Улучшена распознаваемость фамилий и географических назв" class="link_thumb"> 5 Магадан – Обработка стоп слов - "C++" и "Европа+" Переход из одной части речи в другую «гамбург» -> «гамбургский» Транслит и перевод – тойота и toyota, mail и почта Аббревиатуры – БМВ Улучшена распознаваемость фамилий и географических названий (Львов, Киров) Дореволюционная орфография «гамбургский» Транслит и перевод – тойота и toyota, mail и почта Аббревиатуры – БМВ Улучшена распознаваемость фамилий и географических назв"> «гамбургский» Транслит и перевод – тойота и toyota, mail и почта Аббревиатуры – БМВ Улучшена распознаваемость фамилий и географических названий (Львов, Киров) Дореволюционная орфография"> «гамбургский» Транслит и перевод – тойота и toyota, mail и почта Аббревиатуры – БМВ Улучшена распознаваемость фамилий и географических назв" title="Магадан – 19.05.2008 Обработка стоп слов - "C++" и "Европа+" Переход из одной части речи в другую «гамбург» -> «гамбургский» Транслит и перевод – тойота и toyota, mail и почта Аббревиатуры – БМВ Улучшена распознаваемость фамилий и географических назв">
6 Магадан Обработка несогласованных запросов Пластиковые окна Москва ДО: (слово 1 &(-3 3) слово 2 &(-3 3) слово 3) ПОСЛЕ: (слово 1 &(-3 3) слово 2 &&(- 3 3) слово3)
7 Магадан уникальность контента, классификатор порнографии, геоклассификатор запроса, классификатор коммерциализированности
8 Находка Длительность работы сайта Отличия в учёте стоп-слов Расширен тезаурус Склейка слитного и раздельного написания слов «авто ваз» и «автоваз»
9 Арзамас – региональный поиск Ввод Москва, Санкт-Петербург и Россия Вызов такси, доставка пиццы Возможность сравнения выдач в разных регионах Сравнение показало наличие большого количества багов в первой версии
10 Арзамас - Сколько голов у Павлюченко? Снятие омонимии на основе сочетаемости и анализа запросов Картинки над поиском Портрет Гагарина, Анджелина Джоли, карта Европы, Тадж-Махал Запросы определяются по маркёрам, либо на основе поведения пользователей (часто искали их в Картинках, быстро либо надолго уходили в Картинки)
11 Арзамас
12 Арзамас Ввели отдельную выдачу для Екатеринбурга
13 Арзамас Улучшенный гео-классификатор Для запроса учитывается не только регион пользователя и сайта, но и авторитетность и качество контента
14 Арзамас российских городов Своя выдача в в Новосибирске, Красноярске, Омске, Ростове-на- Дону, Краснодаре, Нижнем Новгороде, Уфе, Перми, Казани, Самаре, Челябинске, Владивостоке, Кемерово, Иркутске, Барнауле и Воронеже.
15 Арзамас Улучшили формулу для гео- независимых запросов
16 Снежинск Ввели MatrixNet В формуле ранжирования раньше были полиномы, а теперь – деревья Раньше формулу настраивали программисты – путём поиска наиболее аппроксимирующей функции. Теперь, решение ищется по дереву.
17 Снежинск Асессоры – люди, которые ставят оценку сайту (реальные люди, работающие в Яндексе) До: придумывалась функция от каких-то факторов с неизвестными коэффициентами. И они подбирались уже исходя из данных от асессоров. После: машина анализирует сайты, которым поставили оценки асессоры, сам находит факторы и нужные коэффициенты для узлов (!) деревьев.
18 MatrixNet 6 уровней При определённых значениях параметра – результат не меняется При некоторых малейших изменениях, результат может сильно поменяться
19 MatrixNet В итоговой функции может использоваться несколько таких деревьев. Они суммируются. Возможно с какими-то коэффициентами. Обратная сторона медали – зависимость от каких-то странных факторов – цвет фона сайта.
20 Конаково Тот же MatrixNet, который обучился до поиска ещё по 1250 регионам.
21 Обнинск Улучшили ранжирование по ГНЗ запросам К чему стремимся – большие информационные порталы, хорошо перевязанные внутри с естественными текстами и внешними ссылками.
22 Краснодар (Спектр) Ответы на незаданные пользователем вопросы Многозначные запросы: калина (машина, косметический концерн, ягода), суши (рецепты, доставка) Комм. запросы: Продвижение сайта самостоятельно
23 Краснодар (Спектр) В выдаче всегда подсвечиваются не набранные слова-несинонимы Источники спектральных слов: wordstat, wikipedia, поисковые подсказки Самостоятельно, своими руками, отзывы, цены, купить, выбрать, сравнить, доставка…
24 Рейкьявик Персонализация выдачи по англоязычным запросам 8% пользователей предпочитают иностранные ресурсы Выдача формируется в зависимости от предпочтений пользователя
25 Рейкьявик Борьба с переоптимизированными текстами Новая формула для московского региона
26 Архитектура поиска
27 Обработка запроса Запрос поступает на один из фронтов С фронта происходит сбор документов, релевантных запросу, и их слияние в выдачу Выдача сохраняется! При следующем таком запросе алгоритм не отрабатывается. Выдача берётся из кэша.
28 Все Вопросы?
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.