Региональное ранжирование в эпоху MatrixNet Сергей ЛЮДКЕВИЧ, начальник отдела аналитики.

Презентация:



Advertisements
Похожие презентации
Особенности регионального ранжирования Яндекса. Украинская формула Сергей ЛЮДКЕВИЧ, начальник отдела исследований и аналитики.
Advertisements

Факторы ранжирования Яндекса Сергей ЛЮДКЕВИЧ, начальник отдела аналитики.
Региональное ранжирование Яндекса Сергей ЛЮДКЕВИЧ, начальник отдела аналитики.
Что может тянуть сайт вниз в поисковой выдаче Яндекса? Сергей ЛЮДКЕВИЧ, начальник отдела аналитики.
НЮАНСЫ АЛГОРИТМОВ РАНЖИРОВАНИЯ ПОИСКОВЫХ СИСТЕМ Сергей ЛЮДКЕВИЧ, начальник отдела аналитики и исследований.
Эволюция алгоритмов ранжирования Яндекса в гг. Сергей ЛЮДКЕВИЧ, начальник отдела исследований и аналитики.
ПОВЕДЕНЧЕСКИЕ ФАКТОРЫ РАНЖИРОВАНИЯ Сергей ЛЮДКЕВИЧ, начальник отдела аналитики и исследований.
ИСПОЛЬЗОВАНИЕ ВОЗМОЖНОСТЕЙ ЯЗЫКА ЗАПРОСОВ ЯНДЕКСА ДЛЯ ИССЛЕДОВАТЕЛЬСКИХ ЗАДАЧ Сергей ЛЮДКЕВИЧ, начальник отдела аналитики.
Тема: Серия изменений алгоритма Яндекса «Арзамас» Докладчик: Игорь Владимирович Чуркин.
Поисковая оптимизация (SEO) – введение Поисковые машины Сервисы статистики, оценка трафика Обзор основных инструментов.
Ранжирование документов в поисковых машинах Сергей Людкевич, руководитель департамента Интернет-маркетинга.
Изменения в поисковых алгоритмах Яндекса Игорь Чуркин.
Что такое ROOKEE? о стереотипах АГРЕГАТОР ИНСТРУМЕНТ ОПТИМИЗАТОРА -Профессиональный -Надежный -Простой в использовании.
Москва, 11 ноября 2010 года Руководитель отдела веб-поиска Александр Садовский Поиск Яндекса: год спустя.
Харьков, 15 октября 2010 года Руководитель отдела веб-поиска Александр Садовский Yandex.ua: год спустя.
Изучение алгоритмов поисковых систем с помощью автоматизированной системы комплексной аналитики Евгений Трофименко Начальник отдела исследований и аналитики,
Продвижение интернет- магазинов. Как заставить интернет-магазин продавать? Ксения Бабий руководитель отдела продвижения Семинар «1С-Битрикс: Веб для бизнеса»
Директор по развитию УЧЕТ ТРЕБОВАНИЙ К БУДУЩЕМУ ПРОДВИЖЕНИЮ НА ЭТАПЕ РАЗРАБОТКИ САЙТА Алексей Довжиков.
IFB_M. Раскручиваем сайты. Держитесь крепче! Поисковое продвижение в интернете. Оптимизация сайтов.
Денис Бессонов, руководитель отдела продвижения «Илма Груп», автор сео-блога mexboy.ru Текстовое ранжирование в Яндексе. Особенности подхода TF*IDF.
Транксрипт:

Региональное ранжирование в эпоху MatrixNet Сергей ЛЮДКЕВИЧ, начальник отдела аналитики

ОБУЧАЮЩАЯ ВЫБОРКА Набор запросов q (i) Набор документов d j (i) для каждого запроса q (i) Rel(q (i), d j (i) ) - ручная оценка соответствия документа запросу (выполняется асессорами) Конкурс «Интернет-математика – 2009»: Rel(q, d) - значения из диапазона [0, 4] (4 – «высокая релевантность»,…, 0 – «нерелевантно»)

ФАКТОРЫ РАНЖИРОВАНИЯ Набор факторов ранжирования F = (f 1 (q,d), …, f N (q,d)) Базовые факторы – 420 (апрель 2010) Производные факторы (произведения базовых факторов) – несколько тысяч

ФУНКЦИЯ РЕЛЕВАНТНОСТИ Числовое соответствие документа запросу Fr(q, d) = Fr(F(q,d)) = Fr(f 1 (q,d), …, f N (q,d)) Метод построения функции релевантности в релизе «Снежинск»: Жадный (greedy) алгоритм MatrixNet Подробнее о MatrixNet:

МАШИННОЕ ОБУЧЕНИЕ Обучающие данные (q (i), d j (i) ), i=1,…,n; j=1,…m(n). Определение значений факторов Асессоры Обучающий алгоритм Ранжирующий алгоритм F(q (i), d j (i) ) Rel(q (i), d j (i) ) Fr(F(q,d)) Тестовые данные (q, d j ), j=1,…,m Fr(F(q, d j )) Определение значений факторов F(q, d j )

РЕГИОНАЛЬНЫЕ ФОРМУЛЫ Отдельные функции релевантности: Москва Санкт-Петербург + Екатеринбург + 16 городов России релиза «Арзамас+16»: Новосибирск, Самара, Воронеж и др. Украина Белоруссия Казахстан Общероссийская + все остальные города России + остальные зарубежные страны + выдача без учета региона (Земля)

ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Запросные длина запроса в словах; коммерциолизированность запроса. Текстовые наличие точного вхождения запроса в тексте документа; наличие точного вхождения запроса в заголовке документа; tf*idf; различные модификации формулы Okapi_BM25.

ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Ссылочные статические PageRank; ТИЦ; количество ссылок на документ. Ссылочные динамические процент ссылок на документ, содержащих точное вхождение запроса; tf*idf по текстам ссылок.

ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Свойства документа и сайта это важный сайт (Wikipedia); это главная страница сайта; порнографичность контента. Антиспамовые содержит ли попандеры или кликандеры; естественность текста; уникальность контента.

ПРИМЕРЫ ФАКТОРОВ РАНЖИРОВАНИЯ Поведенческие посещаемость сайта; кликабельность документа в выдаче. Региональные совпадение региона запроса и документа; региональность ссылок на документ; употребление названия региона в тексте документа и в тексте ссылок на документ.

УЛУЧШЕНИЕ РЕГИОНАЛЬНЫХ ФАКТОРОВ РАНЖИРОВАНИЯ Присвоение сайту данного региона Получение входящих ссылок с сайтов данного региона Употребление названия данного региона в тексте документа Употребление названия данного региона в текстах входящих ссылок на документ

Спасибо за внимание! Для продолжения темы посетите , Россия, Москва, ул. Б. Тульская, д. 13, 4-й этаж ТЦ «Ереван Плаза» Телефон: (495) (многоканальный)