Yandex seo. Особенности продвижения сайта (часть 1)
Yandex является основной поисковой системой русского интернета. Ей присущи свои фильтры и особенности. Её развитие идет по собственному извилистому и не протоптанному пути. Если вспомнить историю алгоритмов, то всплывут как взлеты, так и промахи. Порой новый изменения наносили больше вред, нежели пользу для рядовых пользователей. В настоящий момент технология «Матрикснет» позволяет показывает хорошие результаты при ранжировании сайтов. Технология же «Спектр» делает выдачу не только релевантной но и нужной именно для нашего региона.
Seo особенности поисковой системы Yandex
Написано множество книг, статей, а также официальных инструкций по основным принципам работы и дальнейшего развития главного русскоязычного поисковика. Информации столько, что хватит на том войны и мир. Попробуем объединить все источники в единое целое. Информация очень важная и ценная. Храните её в темном и секретном месте 🙂
История алгоритмов
В момент написания статьи Yandex насчитывает 6 введенных алгоритмов ранжирования. Каждому присвоено название города: Магадан; Находка; Арзамас; Снежинск; Обнинск и Краснодар. Почти каждый «город» имеет несколько усовершенствований. До подобной системы имен существовали алгоритмы Я7; Я8, однако нам они не интересны в силу незначительных изменений и малой информации о них. В последующих статьях мы более подробно рассмотрим все технологии.
Все вводимые новшества корректировали ранжирование в лучшую сторону, однако без ошибок не получалось — порой в выдаче были сателлиты, дорвеи и не качественные сайты. Сейчас же, перед официальным запуском измененной системы, яндекс позволяет протестировать бета поиск всем желающим по адресу http://buki.yandex.ru/
Как работает Yandex
1)Сканирование
а) До того, как сайт появится в результатах поиска, системе необходимо его проанализировать и детально изучить. Для этого планировщик (краулер) строит маршрут обхода документов. Т.е. находятся все ссылки в рамках одного сайта. Важны показатели цитируемости и частоты обновления документов.
б) Вторым этапам пауки обходят найденные по маршрутам документы. Если же сайт стал не доступен (проблемы с сервером), то на данном уровне он может полностью выпасть из индекса. Если все в порядке, то происходит выкачивание документов с последующим определением их формата (html,PDF,SWF…), кодировки и языка. Собранные сведения отправляются в хранилище.
в) Происходит разбор информации по составляющим:
— производится очистка от картинок и html разметки
— оставляется чистый текст
— выделяются данные о местоположении каждого слова с последующим добавлением их в индекс.
г) Исходный вид документа остается в слепке (хранилище) до последующего обхода планировщика.
2)Обновление
Что бы все изменения стали доступны, их нужно перенести в базовый поиск — т.е. на сервера, которые как раз и отвечают пользователям на запросы. Содержится материал без спама, дубликатов(зеркал) сайтов и прочего мусора. Обновление базового поиска происходит ночью — это позволяет снизить нагрузку на сервера. Процесс выглядит следующим образом: новые части информации ставят рядом с прошлым обновлением. Происходит проверка по множеству факторов, после которой информация обновляется. Однако существует исключение — быстрый робот ORANGE. Служит он для моментального добавления недавно-появившихся страниц в индекс. Работает днем.
Метапоиск. Не тратим силы на то, что уже искали
Яндекс обрабатывает миллионы запросов в режиме реального времени. В процессе выясняются сведения: из какого региона был осуществлен поиск, проводит лингвистический анализ, а затем проверяет были ли в ближайшем времени точные запросы. Ведь зачем второй раз нагружать сервера? Верно не зачем — экономия залог успеха не только экономики, но и быстрой работы система ранжирования поиска.
Сам процесс обработки запроса выглядит следующим образом:
Факторы запроса
В промежутке между введенным запросом и выдачей поисковика собираются весьма ценные данные:
Лингвистический анализ — слова похожего значения. К примеру «гостиница в Иркутске» = «отели в Иркутске» = «Иркутские гостиницы» = «Иркутск гостиница».
Определения языка запроса. Иногда одно и тоже слово может означать разные значения в разных языках. Что бы предоставить необходимы результат достаточно в большинстве случаев знать IP адрес пользователя, по которому легко определить из какой страны, города человек вышел в интернет. К примеру, слово «Дружина» в русском языке означает «военная рать», а в украинском — «военная рать» и «жена».
Морфология — различные формы одних и тех же слов. Яндекс приводит следующий пример: словосочетание «Стали для ножей» может иметь форму «сталь ножа», а также «ножи сталь». Слово может быть в различном числе, падеже. Это важно знать при анализе миллионов текстов.
Омонимия — когда одно слово может быть существительным и глаголом. Другими словами —
это совпадение словоформ с разным лексическим значением. Важно понимать, когда «сталь» — материал для изготовления вещей, а когда «стали» — глагол. В данном случае берется часто употребляемое словосочетание слов во всем поиске, отсюда и весь анализ.
Расширение запроса
МГУ = московский государственный университет
установка скайпа = установка Skype
Екатерина 1 = Екатерина первая
Новосибирский = Новосибирск
Автосервис тоёта — автосерси тойота
общага = общежитие
Тезариус — словарь связей.
авто ваз = автоваз
Устойчивые объекты и словосочетания
а) Словарь имен и фамилий: поиск понимает, что Дмитрий Медведев — это человек, а не медведь 🙂 Поиск не будет расширяться до медведей.
б) Словарь топонимов — названия отдельных географических мест (населенный пункт, угодье). Парк культуры — место, не нужно его разделять и показывать информацию про парки и про культуру в стране.
в) Опечатка. Если в запросе была допущена ошибка, то яндекс её исправит и выдаст по слову без опечатки. Внизу будет надпись «в запросе «таком то» была допущена опечатка»
г) Редкое слово. Если слово редкое то поисковая система найдет по нему результаты, однако спросит чуть ниже «быть может вы искали «вот это слово»?»
Ранжирование
После того, как все факторы известны, Yandex формирует выдачу сайтов и выстраивает их в порядке убывания. Однако как определить какой сайт лучше, а какой хуже? Как раз для этого и нужен Матрикснет.
Технология Матрикснет — система машинного обучения, которая позволяет по тысячам факторов определить хорошие ответа на заданные вопросы пользователей. Для этого она анализирует свойства веб страниц и поисковых запросов и строит правило.
Выделяются признаки страниц:
Статические — связаны с самой страницей: количество ссылок на эту страницу в интернете.
Динамические — связаны с запросом и страницей: присутствие в тексте страницы слов запроса, их плотность и расположение.
Отличить хорошие ответы от плохих помогают Асессоры — специалисты, занимающиеся оценкой качества той или иной страницы под конкретный запрос. Необходимы для составления образцов идеальных сайтов.
Образцы — связка запросов и страницы, которые максимально подходят на ответы по заданным запросам.
Не однозначные запросы
При вводе запроса «Наполеон» кто-то будет искать рецепт вкусного лакомства, а кто-то великого полководца. Как же угодить всем? А если набрать «суп» как яндекс во множестве SEO оптимизированных страниц определит правильный ответ. Ведь комуто нужен ресторан, а кому то рецепт. Как раз тут и помогает СПЕКТР — который учитывает неявные запросы пользователей.
В процессе его работы лежат статистические признаки запросов — т.е. выделяются имена, названия фильмов, книг, модели авто и т.д. К примеру при поиске «терафлю инструкция» — поисковой механизм отнесет запрос к категории «Лекарства». А если искать «Достоевского» — то к категории «поэты»
Выделяется более 60 категорий, которые будут полезны для Seo в Yandex.
Выделим основные категории
товары:
цена, каталог, отзывы, купить, доставка, выбрать, оптом.
поэты:
родился, биография, реферат, фамилия.
знаменитости:
фото, биография, скачать, mp3, тексты песен, официальный сайт, аккорды, клипы.
лекарства:
комментарий, описание, свечи, таблетки, инструкция, купить.
фильмы, книги:
смотреть, онлайн, скачать.
авто:
продажа, отзывы, цены, б/у, фото, технические характеристики.
города:
время, погода, работа, вакансии, достопримечательности, гостиницы, новости, карта, афиша, знакомства.
страны (туризм):
отели, туры, отдых, погода, цены, горящие туры, новости.
кулинария:
рецепт, фото, калорийность, доставка, википедия, в картинках, в домашних условиях.
одежда:
на заказ, продажа, купить, 2010, 2011, фото.
недвижимость:
цена, продажа, купить, фото, жилье
К каждой категории выясняется его потребность. К примеру категория «товары» говорит о потребности «купить, отзывы, обзоры».
Технология Спектр использует данные из справочников и энциклопедий (википедия).
К примеру «Братья гримм» -запрос может означать поиск «сказки», «музыкальные группы», «художественные фильмы» и «другое»
Результаты поиска
Название
В качестве заголовка яндекс использует чаще всего значения из «title». Однако, если оно слишком короткое или длинное, то будет использован подходящий фрагмент текста. Если нет заголовка, или заголовок не соответствует содержанию (к примеру, названия файлов мало информативные), то заголовок будет создан на основании текста и ссылок на файл.
Сниппет
Робот выбирает все фрагменты текста, которые содержат запрос. Фрагменты разбиваются на несколько частей (ключевой запрос в начале, в середине, в конце). Далее программа сравнивает их между собой и выбирает лучший. Пи этом учитываются факторы: Если ключевой запрос находится в длинном предложении, то это повествование, а не навигация — а следовательно это хороший фрагмент. ! Фрагмент схожий с заголовком не попадет в сниппет для исключения дублирования.
Некоторые особенности:
— При запросе «Екатерина 1» выделится сниппет «Екатерина 1» и «Екатерина первая»
— Выделятся значимые слова при запросе «Снежная королева» — «мультфильмы» «сказка» «магазин»
— При поиске организации будут добавлены телефоны и адрес с ссылкой на карту
— Покажутся быстрые ссылки, при условии известности разделов
— Адреса преобразуются в навигационную цепочку:разделы, подразделы…
— Для видео ролика покажет размер, длительность и дату загрузки
— Для гостиницы: звездность, адрес и тд.
Для вывода сервисов от Yandex, SEO не нужно — хватает штатных модулей. Яндекс позволяет показывать погоду, адреса, цены товаров и прочие важные факторы при целевых запросах. При этом работают следующие системы:
Параллельный поиск — ответы от яндекс сервисов (погода, новости) вместе с поиском по интернету. Хорошо отвечают на заданный вопрос и отображаются в результат поиска. Результат называется «колдунщиком».
Кубики — четыре системы, которые определяют сервис, который будет отвечать на запрос.
Решатель — пятая система, которая основываясь на 4 кубиках выбирает необходимую систему и выводит колдунщики.
Действие кубиков мы разберем в следующих статьях.
Продолжение следует…
В последующей статье мы продолжим рассматривать SEO в Yandex системе, а также более подробно разберем что нравится, а что наоборот ухудшает релевантность страниц.
Tweet |
0