Евгений Правильные апдейты Яндекса Трофименко Евгений сЭо-эксперт
Евгений Что там есть пользуются: в день Апдейты: текстовые – выкладка новых проиндексированных документов ссылочные – учет новых проиндексированных ссылок (НПС) гео – изменение числа геопривязанных сайтов «релизы» - изменение выдачи без выкладывания индекса тИЦ по тулбару и кнопке Сервисы: Аффилиаты (на лето 2010, дырка в тестовом XML) Переформулировки запросов (на осень 2010, дырка в XML) Веса слов (контрастность по русской, буржуйской базам, и восст.) Регионы сайтов (малая база уже есть, большая будет) Подозрительные запросы из last20 Мониторинг выдачи – степень изменения выдачи по запросам
Евгений Правильные апдейты Яндекса
Евгений Апдейты Яндекса: текстовые русский и западный индексы Выкладывание новых проиндексированных страниц, появление в поиске текстов страниц. Метод: увеличение числа страниц и сайтов поиском date:YYYYMMDD Как отличаем русский от западного: lang:ru (uk) и lang:en (de, fr) Обычно западный индекс апдейтится раньше. Примерное время: около часа ночи, раз в 3 дня Апометр Дениса Иванова – упорядочение по дате. Быстроробот мешает. Важно: новые страницы и обновления старых не видны раньше апдейта
Евгений Апдейты Яндекса: текстовые сохраненной копии (метод komdir) Выкладывание новой сохраненной копии происходит чуть раньше. На ~10-15 минут раньше. Проблемы: иногда сохраненная копия берется «на лету» и кажется слишком свежей. Редко, но бывает: обновляется на день позже. Важно: Проверка ссылок в сохраненных копиях страниц не даст эффекта, если ее обновления не произошло.
Евгений Апдейты Яндекса: ссылочные новые ссылки в анкор-файле Обновление анкор-файла, учет новых проиндексированных ссылок. Метод: поиск свежих не-быстророботных-НПС «найденных по ссылке» Экспериментальные сайты и быстроиндексируемые ссылки, время взятия ссылки роботом написано сразу в НПС Время: около 4-5 утра Частота – в последние дни каждый текстовый апдейт, раньше – раз в три недели. *** важно: пересчет «веса» ссылок может происходить независимо от обновления анкор-файла.
Евгений Апдейты Яндекса: гео Изменение числа геопривязанных сайтов Число сайтов и страниц, найденных с ограничением по региону меняется резко и не всегда по всем регионам. Метод: поиск c ограничением по регионам &rstr=-213 (11 регионов) и с ограничением по хостам для уменьшения числа найденных сайтов. Число сайтов и страниц не только увеличивается, но и уменьшается. Время: около 5 утра, но иногда и в середине и в конце дня. За половину изменений выдачи без выкладывания текстового индекса - отвечают в том числе и они. В отсутствие других пересчетов изменения очень слабые.
Евгений Апов нет, а выдача изменилась? = обновление формулы? …или многое другое: например, пересчет весов ссылок? 1.Есть запросы, где в результатах много НПС 2.Положение НПС относительно друг друга меняется около 4 утра и без ссылочных апдейтов. 3.Видимо, это пересчет вИЦ и релевантности ссылок … это был анонс по сервису
Евгений Изменения выдачи по раным классам запросов
Евгений Мониторинг выдачи – с 2008 Есть ~370 исходных запросов, разбитых на классы по Числу слов в запросе Конкурентности Др. (операторы, число стопслов) Каждому запросу соответствует 15 «изменений» вида Поиск в title Поиск в тексте без title В кавычках С весами С расстояниями Др. Итого, выдача по ~7К запросов пробивается ежедневно, по ней считается степень изменения выдачи и не только.
Евгений Изменения выдачи у них:
Евгений Изменения выдачи у меня: Метод – учет наличия упроядоченных пар сайтов в выдачах вчера и сегодня. Позволяет избежать сложностей с выпадением сайтов, сменой релевантных страниц (кажущихся сильных изменений выдачи)
Евгений Взвешенные параметры Как посчитать «среднее по больнице»? Как именно взвешиваем? Чем больше место в выдаче – тем ниже вес, меньше влияние найденной позиции Сумма весов (видимостей) по топ50 равна 1 – нормировка Сумма весов 1-10 (первая страница) вдвое выше (вторая страница) - это соответствует статистике переходов на вторую страницу вес(pos)=0.074*2 (-pos/10)
Евгений Изменения взвешенных параметров: Обычное и взвешенное изменение выдачи Взвешенные параметры: тИЦ число страниц «еще с сайта» доля быстроробота доля НПС доля морд доля Я.Каталога рел. пассажей, вес страницы, общее число страниц и сайтов доля регионов и релевантности
Евгений По срезам, по датам:
Евгений Я: число документов в индексе Число документов (сумма по дням индексации за последние 3 месяца) уменьшилось за год в 4-5 раз (было 4500М, стало 800М)
Евгений Я: скорость индексации Рунета Скорость переиндексации рунета уменьшилась за год в три раза: Было ~50-60 дней, стало ~ дней Метод: операторами дат ищем число документов за интервалы и взвешиваем число документов по дате (ищем «центр масс»)
Евгений Переформулировки запросов База по данным на осень 2010 Переформулировки по данным XML через дырку в 1.3 М запросов с найденными переформулировками веса слов продвижение сайтов = (продвижение::19047 ^ ((про::2793-движение::8030)) ^ продвигать::40288 ^ продвигаться::199208) &&/( ) сайтов::410
Евгений Еле вошло в презентацию: 1. Аффилиаты 2. ::веса слов 3. API апдейтов 4. база регионов сайтов 5. подозрительные запросы last20 6. скорость переиндексации
Евгений регистрация дает доступ к: Переформулировкам Весам слов Аффилиатам Мониторингу выдачи Базе регионов
Евгений ВСЁ. Что платно, а что нет – еще не решено Правильные апдейты Яндекса Трофименко Евгений сЭо-эксперт