Установки релевантности страницы

24 мая 2014 Выкл. Автор Владимир Андросов

seoguruЧитая многих “супер-пупер-мега сеошников”, я нигде не встречал хоть какие-то намеки на поисковый механизм яндекса. Они любят писать, о том куда потратили пару лямов и какую резкую тачку приобрели. Вот только кому это увлекательно? Следственно их давным-давно нет в моей ленте.
Последнею неделю занимался обзором выдачи яндекса (делал программные интерфейсы на основе поиска яндекса), и подчерпнул некоторые увлекательные данные, о которых прежде не знал, либо знал Отчасти.
1) Самый увлекательный момент. Робот яндекса при индексации вашей страницы, делит ее на “пасажи”, то есть это определенный аналог предложений. Но яндекс отчего-то подчеркивает, что пассаж — это одно предложение, исключительно если оно не слишком длинное. На основе пассажей строится выдача. Т.е. если вы задали запрос “тиц яндекса”, то яндекс вначале обнаружит пассажи в которых встречаются оба слова, а остальные нам и неинтересны:)
Кроме этого добавлю, что пассажи бывают 2-х типов — обыкновенные, и обнаруженные по ссылке. 2-й вариант думаю пояснять не нужно.

Проверенная информация о пассажах:
Сколько бы релевантных пассажей не было на странице, title+единтсвенный пассаж в выдаче неизменно будут выше чем даже 10 релевантных пассажей, но без надобного title. Title имеет наивысший приоритет.
Если вы спросили в поиске слово “яндекс”, то слова “яндексу” и “в яндексе” будут безусловно одинаковы по силе релеватности (подробности во втором пункте).

Предположение по поводу пассажей:

На основе пассажей определяется уникальность документа. Скорее каждого механизм яндекса проверяет % соотношение пассажей, из каждого этого итог — перемешивать предложения безрезультатно. Уникальности вы этим не добьетесь.

2) Существует несколько типов словесных соответствий запросу. Это phrase — буквальное соответствие (скорее каждого имеются ввиду падежи), strict — точное соответствие (обнаружены все слова), all — все остальное (наверно частичное вступление слов из запроса)

3) Яндекс для чего-то имеет информацию о числе страниц с одного сайта соответствующих запросу (и называет это статистическими данными). Но на выдачу это никак не влияет. Мой сайт находится на первом месте в выдаче и имеет в этом параметре значение 4096, воторой сайт имеет значение 1. Для чего эти данные тогда? Не врубился. Но отсель итог, что сайт может иметь безусловное несоответствие тем на страницах. То есть одну страницу вы можете прокачивать текстами про то, как сделать молоко, а на иной писать про seo. Всякая страница будет равна в потенциале попасть в топ.