Защита контента сайта от копирования. Противостояние
5
Каждый день в интернете добавляется миллион-другой новых страниц с информацией. Однако, лишь малая часть из них полезна и уникальна — остальные либо воруют контент, либо не предоставляют ни какого полезного контента (мусор). Связано это с тем, что писать на самом деле так и легко — требуются профессиональные навыки, а также элементарные знания русского языка. Конечно, можно нанять копирайтера — но это обойдется уже в копеечку. Вот и приходится молодым интернет-проектам выживать под руководством «школьников» как придется — у одного скопируют, у другого — глядишь и нарастят показателей пузомерок — а дальше и до продаже ссылок не далеко. На этом их цель и заканчивается. Другое дело веб-ресурсы, которые не только созданы для людей (заработок второстепенен), но и предоставляют уникальную, важную и главное новую информацию. Вот для них то и опасны нерадивые сайты.
Последствия копирования контента
Разберем весьма популярную схему. Имеется хороший, но молодой сайт «А» и довольно старый, но не совсем качественный «Б» . К примеру, первый написал и разместил статью «как уменьшить вес фото» где отобразил весьма интересные и ранее не опубликованные способы обработки графики. В силу молодости проекта его страница не была найдена поисковым роботом, а следовательно не попала в индекс. Второй же ресурс «Б» скопировал дословно всю публикацию первого и его первого проиндексировал яндекс, при этом признав его первоисточником(автором) данного контента. Через какое то время Yandex «прочитал» проект «А» и увидел на нём знакомый рассказ, который по его мнению бессовестно своровали у «Б». Какие же могут быть тут действия? Либо поисковик понизит «А» в выдаче, либо не учтет страницы, а может быть и такое, что наложит фильтр «Не уникальный контент» , а возможно и АГС. Поэтому важно противостоять такому хамству. Как? А об этом чуть ниже…
Способы защиты контента от копирования
Постараюсь разобрать по пунктам как можно больше технологий защиты текста и картинок от копирования.
1. Запрещаем использование правой кнопки мыши (не рекомендовано)
Довольно простой хоть и действенный приём, который полностью блокирует работоспособность правой кнопки мыши. Тем самым усложняется процесс копирования, однако и усложняется работа с ресурсом. К примеру, в теме «раздача ключей antigate» выкладываются коды, которые не удобно набирать вручную. Оцените выгоду и если она больше возможного неудобства — тогда, и только тогда примените этот способ. Для этого разместите между тегами Head следующий код:
1 2 3 4 5 6 7 8 9 10 11 | <SCRIPT language=JavaScript> var message="Правый клик запрещён!"; function click(e) {if (document.all) {if (event.button == 2) {alert(message);return false;}} if (document.layers) {if (e.which == 3) {alert(message);return false;}}} if (document.layers) {document.captureEvents(Event.MouseDown);} document.onmousedown=click; </SCRIPT> |
Также это можно сделать при помощи плагинов, к примеру для ворпрдресса достаточно установить «WP-CopyProtect».
2. Относительный URL адрес изображения
Адрес вида «photo/seo.jpg» предпочтительный в делах графических, так как в случае копипаста потеряется связь и изображения на стороннем сайте просто напросто не отобразятся 🙂 Это позволит поисковым системам указать на авторство и уменьшить значимость дублирования.
3. Абсолютная гиперссылка (рекомендованная защита)
Абсолютный адрес позволяет сохранить рабочей ссылку, тем самым передать на акцептор вес, что поможет при продвижении. Убирать вручную ссылки из кода редко кто будет, да и многие сервисы и модули автоматом берут кусок кода без обработки.
4. Отключите RSS ленту
На моём блоге лента доступна по адресу https://tekseo.su/feed и представляет собой вывод последних постов. Это удобно для многих пользователей (позволяет следить за обновлениями), да и сервис feedburner.com также без ленты не сможет работать — поэтому отключать я её не стал. Однако, если сайт молодой и есть высокая опасность утекания контента на лева — лучше отключить. Сделать это можно через плагины, либо покопавшись в коде.
5. Автоматическая вставка ссылки первоисточника (рекомендовано)
Суть следующая — при автоматическом или ручном копировании в конец текста помещается ссылка на вашу страницу. Это позволяет довольно эффективно пресечь в большей степени не внимательных воров. Идеально подойдет английский сервис tynt.com , позволяющий не только внедрить подобную функцию, но и отслеживать статистику. Зарегистрировавшись вы получите код, который необходимо скопировать между тегами HEADER.
6. Указание текста первоисточника в Веб Мастерской
Не так давно Яндекс ввел новую функцию, которая даёт право указать ваш текст, что бы сам поисковик знал что он закреплен только за вашим сайтом. Сделать это можно перейдя по ссылке webmaster.yandex.ru и добавив ваш ресурс в систему. Далее зайти в раздел «содержимое сайта» -> «Какие данные можно передать» и выберите из списка «Оригинальные тексты» и нажмите «включить». Стоит заметить, что режим находится в альфа режиме и доступен для площадок с ТИЦ от 10 пунктов и минимальным количеством символов 2000.
7. Купите на новую страницу ссылки (рекомендовано)
Эта рекомендация позволит направить поискового робота на индексацию свеженького материала. Также хорошо работают гиперссылки с социальных сетей и сервисов закладок. Плюс ко всем это увеличит траст и позволит нарастить показатели и занимаемое место по ключевому запросу.
8. Все права защищены
Установить в подвале сайта надпись, вида «Копирование материала запрещено и преследуется законодательством РФ». Это подействует лишь на молодого пользователя, однако не будет лишним в любом случае.
9. Водные знаки
Полупрозрачный текст, расположенный ка фотографиях вашего проекта защитит их от распространения. Можно воспользоваться плагинами (для Вордпресса — Watermark RELOADED), которые в авто-режиме позволяют внедрять надпись, ну или через графический редактор — ручками 🙂
10. Перелинковка (рекомендовано к защите)
Согласитесь, удобно читать текст и переходить на другие связанные по смыслу страницы проекта. Википедия — идеальный пример, когда можно найти любое определение непонятного слова пряма из читаемой статьи. И реализовано это постановкой на слова гиперссылок на прочтение более подробной информации. Также перелинковка помогает осуществить оптимизацию и распределить внутренний вес страниц. От воровства тоже идеальный вариант — усложняет публикование «чистого» текста на стороннем ресурсе.
11. Скрытые источники (не рекомендовано)
Гиперссылку можно замаскировать под любым знаком «;-/.-,» — это позволит запутать нарушителя. Однако не совсем хорошо скажется на SEO.
12. Отсрочка публикации новостей в RSS ленте (рекомендовано)
Использование плагинов позволяет отсрочить вывод в ленту новостей публикаций. Тем самым мы даём возможность проиндексировать материал поисковой системы, а далее распространить его по копипастером и тем саммы нарастить ссылочную массу. Для CMS WordPress за это отвечает плагин «Deferred RSS»
13. Имитация копирования (рекомендовано для издевательства)
Можно разрешить функцию копирования, однако не позволять помещать контент в буфер обмена при помощи замены тега BODY на код:
1 | <BODY oncopy="return false;"> |
Это позволит запутать вора — вроде бы он и скопировал, но вставить материал не куда не может 🙂 Прям чудеса для него…
14. Online контект (при необходимости)
Если ваш сайт предоставляет очень важную информацию, доступ к которой осуществляется под паролем, либо вы хотите показывать контент только в Online режиме, тогда на помощь вам код, который нужно поставить между тегами HEAD
1 2 3 | <meta http-equiv="pragma" content="no-cache" /> <meta http-equiv="no-cache" /> <meta http-equiv="cache-control" content="no-cache" /> |
Внимание! Использовать нужно любую из строк, но только одну.
Манипуляция позволяет не сохранять в кэш браузера, а следовательно и на жесткий диск, файлы вашего интернет-портала.
15. Волшебное появление (рекомендовано для издевательства)
Весьма дерзкий приём, которые позволит не только обратить внимание на факт копирования контента, но и понизит доверие у читателей к ресурсу-вора, да и к администратору в принципе. В структуру необходимо вставить:
1 2 | <div class="hidden">Этот текст был взят с сайта https://tekseo.su/ за что я очень каюсь и никогда себе этого не прощу</div> |
Не забудьте добавить в CSS файл строку:
1 | <div class="hidden">.hidden{display:none;} |
Как обнаружить копирование контента с сайта?
Найти пропажу довольно легко, для этого воспользуйтесь программой Advego Plagiatus, которая найдет текст, укажет сайт и определит его похожесть. При 80% и большей схожести — однозначно материал ваш. Аналогом является разработка Double Content Finder от textbroker.ru. Неплохо себя также зарекомендовал онлайн сервис copyscape.com
Если же речь идёт о нахождении графики, то лучший сервис — tineye.com .
Что делать, если вы признаны вором своего же контента?
Если же у вас украли статью и поисковик проиндексировал её первой на стороннем ресурсе, то не спешите разочаровываться — всё в той или иной степени поправимо. Не лишним будет попробовать следующее:
1. Свяжитесь с администратором проекта-вора и укажите (вежливо) на то, что нужно убрать ваш текст, т.к. вы не давали на согласие на его размещение. Сошлитесь на законодательство и на написанное письмо в поддержку Яндекса.
2. Напишите Платону Щукину (поддержка Yandex) и укажите все данные. Не лишним будут доказательства, что материал принадлежит вам (Это может подтвердить копирайтер, возможно также Google первым проиндексировал). При удачном стечении обстоятельств сотрудники изменят первоисточник.
3. Напишите письмо, а лучше позвоните хостинг провайдеру, на котором размещён ресурс вора. Узнать контактные данные администратора и фирму-провайдера можно через данные Whois.
Подытожим
Разобранные способы защиты контента от копирования позволяют не только свести к минимуму ошибку определения авторства, но даже и извлечь выгоду от всякого рода автоматического копипаста. Тем самым сохраняем вложенный труд и наказываем мошенников, да и поисковая выдача от этого становится хоть немного, но более релевантной и чистой.
Tweet |
Большое спасибо за статью! Много материала, а главное всё по теме, даже нечего и добавить.
Уважаемый! 🙂 Зачем морочить людям голову? Ваши советы на вашем же сайте не работают. Кроме того достаточно отключить ява-скрипты или вообще использовать исходный код страницы. Вычистить ссылки недолго. И все труды напрасно. Кто захочет утащить — утащит.
Утащить информацию можно абсолютно с любого ресурса. Для этого есть множество программ. Также взломать можно проект любой сложности — всё дело в деньгах и времени. Приведенные выше примеры работают. Защитить полностью контент никогда нельзя, если только не выколоть глаза читающему. Можно в обход любой защиты сделать принтскрин, сфотографировать, затем распознать — другое дело, что такие хлопоты не каждому нужны. Методы, указанные в данной публикации, хорошо защищают от автоматического воровства (с помощью программ, граберов и скриптов), а также от клонов (дорвеев), ручного копипаста. Также технология сводит к минимуму вероятность неправильного определения поисковыми системами первоисточника (из-за долгой индексации контента, который мог уже быть дублирован на стороннем сайте). А на счёт того что не работают на моём блоге методы — всё просто, я задействовал лишь пару способов, остальные ухудшают удобство для пользователей. Ресурс индексируется поисковыми роботами через 1-2 часа после написания статьи. для сайта, в данный момент, проблема воровства не столь актуальна.
Технически no-cache — не очень хорошее решение для посещаемых порталов, так как вырастет нагрузка на сервер. В общем, любая защита чревата издержками или неудобством для посетителей, так что нужно взвесить «за» и «против» для начала.
Против ламеров прокатит. Но! Профи парсят сайты через Scrapy, Grab, pjscrape или аналоги, от такого фиг защитишься. Так что самое надежное — приманить быстробота и бед не знать. А для фото, конечно, водяные знаки.