Яндекс сервисы: переводчик текстов, антиспам, антивирус
1
Доброго времени. В последние пару недель было мало этого самого времени — слишком много заказов в SEO. Однако нахожу силы на публикацию свежей информации. Сегодня мы продолжим рассматривать технические особенности русскоязычного поискового механизма от Яндекса. Затронем его модули, а именно: антиспам, который работает совместно с антивирусов, а также переводчик. Вы спросите «на кой мне сдались эти, не коем образом не связанные с SEO, хрени 🙂 » На самом деле все механизмы так или иначе, но работают совместно с поиском — игнорировать их не стоит. А почему не стоит — об этом как раз читаем ниже…
Яндекс антиспам на вооружении
Каждый день на почту поступает множество писем. Доля нужный корреспонденции стремится к нулю. Очень много спама, среди которого призывы что-либо скачать, перейти по ссылке и прочее. Естественно, чем засорённее почтовый сервис, тем им меньше пользуются, а значит доход от рекламы падает. Системы стараются уничтожить все массовые рассылки, тем самых зарекомендовать себя с лучшей стороны — это задача почтовиков. Задача спамеров обойти защиты и отослать письма. Цель же поисковых систем проанализировать присланные письма (в рамках собственного почтового сервиса) на наличие в них ссылок на сайты. Если ссылка употребляется часто в хороших (не Spam) письмах, то этот сайт считается востребованным, а следовательно доверие (траст) к нему повышается. Если же ссылка фигурирует в спаме, то доверие падает. Это вполне правильный подход — нужно стремиться учитывать все пользовательские показатели! Поэтому если есть крайняя необходимость рассылки не запрошенной электронной корреспонденции с указанием URL вашего проекта, то шифруйте все ссылки при помощи сервисов коротких адресов (коих туча в интернете). Во всех других (легальных) отправках Email(а) ставьте в подпись ваш веб-сайт, это не только подчеркнет значимость вашей фирмы, но и положительно повлияет со стороны SEO. Спам есть также на страницах интернета.
Поисковый спам — веб-сайты, а также их отдельные страницы и модули которые необходимы исключительно для обмана поисковых механизмов, в основном для целей манипулирования результатами выдачи.
К примеру:
— очень мелкий невидимый для человеческого глаза контент;
— текст напичканный поисковыми словами;
— текст с цветом схожим с фоновым;
— дорвеи и прочее…
Для борьбы со спамом работают асессоры, которые оценивают качество поиска, а также в какой степени выдача соответствует запросу. Далее они классифицируют спам по категориям, выделяют его по определенным характеристикам, по которым его можно отличить от качественных и действительно хороших сайтов. Все характеристики визуально различимы: сколько в процентной доле в плохом тексте переполнения ключевыми словами, что делают дорвеи и прочее. После оценки составляется математическая выборка из страниц со спамом и без него. Система при помощи формулы самообучается и совершенствуется. Поэтому необходимо сразу же на первых этапах отказаться от всех не легальных методах спама, будь-то почтового, либо веба. Изучите так же серую оптимизацию и черные методы seo для более полного понимания обширности проблемы, с которой борится Яндекс.
Антивирус
В помощь в борьбе с некачественным контентом подключается яндекс антивирус, основной задачей которого является предупреждение пользователей, которые перешли с поиска данной системы, на тот или иной сайт. Любопытно, что Яшка охватывает сразу два алгоритма сканирования, что весьма похвально, но об этом чуть ниже.
Итак, введен в совместное обращение антивирус Sophos, о котором никто не слышал в русскоязычном сегменте, но который является весьма солидным и достоверным источником информации и вирусных сигнатурах. Используемая технология позволяет при помощи пауков не только изучать веб-проекты интернета, но также и сканировать их на наличие вирусов. Если последний обнаружен, то при посещение ресурса выпадет окошко с предупреждением, а также в результатах поиска рядом с злосчастным проектом появится надпись о возможной угрозе. Данный метод получил название СИГНАТУРНЫЙ.
Второй по счету, но не меньший по значимости является поведенческий алгоритм, способный посмотреть на донора в качестве посетителя. Дело в том, что зайдя на любой ресурс паук не только выкачивает весь его код (как в матрице прям 🙂 ), но и смотрит что ему предлагают (многие сайты автоматически включают музыку, другие выводят рекламные окна, третье скрыто закачивают вирусы). Именно, исходя из поведенческой оценки изучаемого, можно сделать вывод о законности и последующих намерениях ресурса.
Не стоит обманывать поисковый алгоритм, который постоянно совершенствуется и улучшается. Вводятся многосторонние обороны и анализаторы. Если сейчас вы не в поле подозрения, то в последующем ваш портал могут заблокировать, либо понизить в доверии. Если на вашем сайте обнаружится вирус, то это увидит поисковая система и сделает всё возможное, что бы посетитель на него не попал. Это понизит посещаемость, а следовательно поведенческий фактор, что в свою очередь понизит его в выдачи.
Яндекс переводчик текстов
Яша обладает весьма интересным, и на мой взгляд инновационным, подходом к переводу текста. Когда Промт хочет обучить программу понимать значение слов, поисковая система хочет построить работу на принципах анализа и частоты употребления текстов в разных языках. В настоящий момент Яндекс в бета режиме позволяет увидеть мгновенно значение слова или предложения, однако текст весьма читабелен. Итак, как же работает сама система.
Поисковые модули сравнивают текстовую однотипную информацию в разных языках и строят определенные соотношения. Тексты изучаются, анализируются и соотносятся при помощи 3 алгоритмов:
Модель перевода
Является основной базой, которая выглядит в виде таблицы, в которой для каждого слова (выражения или фразы) имеется набор вариаций его перевода с на остальных языках с процентной долей вероятности качества соотношения.
Модель языка
Компонент «читает» миллионы, а то и миллиарды текстов на различных языках и выстраивают списки всех написанных слов (выражений) с пометками частотности их написания в рамках одного материала.
Декодер
Представляет собой итоговые «шестеренки», основной задачей которых является перевод. Происходит это в следующем порядке: вначале для каждого предложения первоначального текстового материала ищутся вариации его перевода. Далее идет анализ между собой фраз и моделей перевода. В последующем происходит упорядочение по убыванию вероятностей (в процентах или в долях).
На завершающем этапе модель языка вносит корректировки путем показа частоты употребления фраз и предложений в общем составляющем, а не в рамках одного слова.
Стоит заметить, что благодаря такому методу перевод меняется в зависимости от поколений (ведь в каждое время выражения означают разные смыслы), что позволяет получать более понятливый и читабельный материал. Кстати, хороший вклад внесла Википедия, которая предоставляет контент в переводе на десятки языков.
Подытожим
Необходимо знать, хотя бы в общих чертах, принципы работы основных систем. Каждый день меняется интернет, а вместе с ним и основной механизм поиска — Яндекс. Неизвестно, какой из факторов будет преобладать послезавтра. Изучайте технические аспекты перевода текстов от яндекса, а также работу антиспама, который работает во благо чистоты не только почты, но и выдачи. Антивирус же защищает нас ежедневно от потери информации (паролей, порчи электронного контента). Следите за всеми ветками яши, и тогда ваш проект будет защищен многосторонне, а SEO станет предсказуемым и более простым.
Tweet |
Ахах, впервые слышу про Яндекс Переводчик. Попробовала перевод с русского на английский — рукалицо. Гугл тоже частенько чудит, но тут просто слов нет! Артикли пропускает, меняет same на one, в общем, лучше им не пользоваться пока 😉