Антипопингуйство сегодня, и один из вариантов борьбы с ним.

12 июня 2017, 13:00

Антипопингуйство сегодня, и один из вариантов борьбы с ним.

Антипопингуйство сегодня, и один из вариантов борьбы с ним.

Сёгун повелел
Строить гейш по ранжиру
Единожды в год.

Пользователи со стажем должны смутно припоминать пост чуть ли не десятилетней давности про рефспам. Такие вещи тогда только начинали применяться в массовых масштабах, и пока ещё были в диковинку. Вебмастер, впервые столкнувшийся с рефспамом, несказано дивился на такое чудо, задумчиво приговаривая «так вот ты каков, северный олень...»

Понятно, что местного автора тоже не миновала чаша сия, но он достаточно быстро придумал, как откреститься от фиктивного трафика с реферами, дабы он не искажал существенно статистику посещений сайта. Секрета в том никакого нет - можно просто спускать в унитаз все хиты, якобы падающие на Ваш ресурс с морды другого сайта (ведь никто же не ставит прямых ссылок с морды, верно?). А можно учредить браузерный редирект со страницы, куда пришёл человек с рефером, на ту же самую страницу. Если хит фиктивный, такой редирект просто не выполнится, а сам хит не засчитается.

Понятно, что далеко не весь рефспам нейтрализуется подобным образом, и, возможно, нужны и иные подходы. От этой мысли никто не открещивается, всё вполне обсуждаемо и реализуемо.

Местный автор задумал вскоре перевести свой основной сайт на стандартную «Нану», и знает точно, что рефспама на том сайте ой как много. И с ним чего-то надо делать, ибо раздражает.

Да, так называемая «Любопытствующая Нана» умеет бороться с рефспамом по первому варианту, но таковых умений ей конкретно тут будет явно недостаточно. И всяко нужен помощник.

Зачем люди вообще занимаются рефспамом?

По двум причинам.

Первое соображение наивное. Если сделать вид, что на какой-то сайт поступает трафик с другого сайта, может быть, этот факт отобразится где-то в статистике, доступной через web. И может быть, она публичная, не закрыта от поискового бота. И чем чёрт не шутит, вдруг ссылка на источник трафика полноценная? А это бэк. Авось, как-нибудь зачтётся.

Естественно, такое давно уже не работает. Кто эти люди, восставшие из летаргического сна, местный автор не знает. Но знает точно, что подобный онанизм широко практикуется с айпишников АО "ЭР-Телеком Холдинг" и АО "Киевстар", которых смело можно банить прямо по всему диапазону. Сами ОА на абузы не реагируют, так что и поделом им.

Может быть и другой рефспам, рекламный. Когда вебмастер видит, что ему на сайт за сутки вылили десять тысяч хитов якобы с какого-то конкретного сайта, он же туда всяко сходит, просто полюбопытствовать. Ну а там ему нарисуют рекламу про какой-нибудь сервис для вебмастеров, притаранят куку этого сервиса в ифрейме, примутся сношать мозг маркетингом. Или попытаются подсунуть эксплойт, выкрасть авторизационную куку от сайта. Или ещё что учудят - есть много вариантов.

Само собой, бывалый вебмастер всё это уже сто раз видел, и заново наблюдать больше не хочет. Ему бы сделать так, чтоб все эти рефспамеры сгинули из его статистики, и больше не отсвечивали.

Антипопингуйный полицай.

Давайте не будем изобретать велосипед, а просто любой хит извне, но с рефером на борту, будем приземлять на страницу-прокладку. На которой можно написать любой текст, который не важен абсолютно. Из важного там одна кнопка, которая пускает на наш сайт, к документу назначения. С занесением всех данных об этом хите куда надо. В данном случае в статистику.

Кнопку перехода сделаем хитрой, привязанной к адресу конкретного внешнего документа, адресу документа назначения, и ко времени. Чтобы её нельзя было тупо захэшировать, либо использовать шаблонно.

Если хит поступает с какого-то нового, и пока неведомого нам внешнего документа, предъявляем «прокладку». Живой человек сквозь неё при желании пройдёт, а фиктивный хит потеряется по дороге. Ведь формально никакой разницы между страницей назначения и «прокладкой» нет (кроме контента) - и URL тот же, и редирект по пути отсутствует. Поэтому спамерский софт не поймёт, что он имеет дело с презервативом.

Ну а если хоть один живой человек при визите на наш сайт с данного внешнего документа кнопку входа уже когда-то нажимал, то будем считать, что ссылка с этого внешнего документа действительно стоит, и «прокладку» больше предъявлять не нужно. Человек попадает прямиком туда, куда должен.

Правда, в профилактических целях стоит раз в год делать перепроверку ссылок с таких внешних документов. Проще всего повторным предъявлением «прокладки». Штатно так оно и будет.

Ну и естественно, во избежание всякого рода «ДжеНаха» и прочих вариантов пионерского XSS, на странице-прокладке мы не будем писать никаких ссылок, от слова «совсем». Почему, понятно.

Если такое Вам тоже надо.

Тогда ходите на оффсайт «Любопытствующей Наны», смотрите там в новостях про антипопингуйного полицая, и читайте, как он активируется.

Тот, кто «прокладки» боится, либо пока не сталкивался лично с рефспамом, и не был до крайности озадачен им, антипопингуйного полицая не включает, только и всего.

Бдительным.

Может быть, кому-то покажется странноватой концепция заселения в одинаковый адрес и документа, и какой-то служебной страницы в случае визита на документ с внешнего URL-а в первый раз. Вроде как клоакинг, да?

Учитывая, что любые боты, а также визитёры с поисковых систем с этим эффектом не сталкиваются, и только ссылки между сайтами эффект вызывают (причём только в первый раз, при знакомстве), мало кому до такого клоакинга будет дело.

В конце концов, осторожные и аккуратные люди давно уже ставят «прокладки» на исходящие ссылки. Ну вот а у нас такая же «прокладка» будет стоять на входящие ссылки, причём та «прокладка» вообще одноразовая. Никто так никогда ещё не делал, это у нас чубайсовская нанотехнологичная инновация. Имеем полное право на необходимую самооборону.

Другие статьи категории «Вебмастеру на заметку»

SSL для бедных: авторизация плавающим кодом.

SSL для бедных: авторизация плавающим кодом. Многие, вероятно, заметили, что по поводу шифрования трафика в последнее время мы наблюдаем самый настоящий холивар. Причём, что интересно, технологию продавливают крупные Сервисы, типа поисковых систем и почтовиков (если ограничиться тем, чем мы пользуемся каждый день). И вот уже слышны победные реляции, что больше половины всего трафика в Сети теперь под криптографией.

О схеме окупаемости хоббийных сайтов.

О схеме окупаемости хоббийных сайтов. Внезапно узрел чудесное. Когда его совсем не ждал. Некий сеньор Экслер, отметив скромненько в скобочках, что его сайту исполнилось ровно 18 лет, вместо того, чтобы по этому поводу радоваться жизни любым из четырёх дозволенных религией способов, вдруг затеял панихиду. Мол, не приносит тот сайт доходов, достаточных для безмятежной жизни в Испании всей семьёй.

Нужен ли сайту SSL сертификат?

Нужен ли сайту SSL сертификат? Довольно давно, ещё в 2014 году, в блоге Гугла для вебмастеров проскочила публикация о благостности HTTPS. Заметка небольшая, и базового английского вполне достаточно, чтобы понять две важных вещи: Использование SSL сертификата Вашим сайтом (HTTPS протокол) отныне учитывается поисковым алгоритмом Гугла. Пока этот фактор ранжирования является слабым, и влияет «менее чем на 1% глобальных запросов».
Все заметки категории «Вебмастеру на заметку»