Как всем нам (теперь уже) хорошо известно, вебмастер делает сайт вовсе не для того, чтобы на нём завёлся целевой посетитель, и выполнил какое-то полезное вебмастеру действие, потребив предлагаемую сайтом услугу. Это было бы слишком просто. Нет, конечно. Сайт делается с иной целью.Откуда все знают про кристалл Сваровски в Вашей заднице.
Самые популярные товары с Али по лучшей цене:
Поляризационные очки-хамелеоны в машину 1300 руб.
Мужской кошелёк с RFID-блокировкой 427 руб.
Автомобильный диагностический сканер 640 руб.
Откуда все знают про кристалл Сваровски в Вашей заднице.
Думаешь, хитрый?
Вся твоя жизнь на ладони.
Её видит каждый.
Исторически так повелось, что местный автор слегка интересуется вопросами SEO и прочего юзабилити, и потому иногда развлечения ради сочиняет опусы на эту тему, кому-то даже интересные. Категория «Три весёлых буквы» как раз для них, и, как уже стало понятно уважаемому читателю, сегодня мы в очередной раз приступим к увеселению трёх заветных букв. А то чего-то они заскучали.
Вообще, SEO-шники весьма неровно дышат ко всякого рода поисковикам. И все поголовно дивятся, насколько трудно иной раз скормить искалке нормальный сайт, дабы он встал в индекс. И вместе с тем уму непостижимо, как легко и просто попадает в индекс всевозможная хрень, которую никто и не думал даже пытаться индексировать.
Ну к примеру.
Вот совсем недавно случилось очередное бурление говн, когда вдруг внезапно обнаружилось, что SMS-ки, отправляемые с сайта Мегафона, весьма просто изыскиваются Яндексом, причём любой любопытствующий может читать не только отправленный текст, но и видеть номера телефонов. А как же прайверси и всё такое?
Понятно, что в результате скандала и замелькавшего на горизонте судебного иска дырку экстренно закрыли, но сам-то эффект устойчивый и стабильный. Заинтересовавшиеся люди могут пойти в их любимый поисковик, и исследования для сотворить нехитрый запрос:
Яндекс: inurl:0 inurl:1 inurl:c статус заказа
Гугл: inurl:ukey=order_status IP покупателя
Для этих случаев можете наслаждаться наблюдением покупок, ФИО и адресов-телефонов реальных людей (особо интересны варианты с разными там сексшопами), но немного другие запросы дадут доступ и к действительно критической информации — дразнить гусей мы, естественно, не будем (могут и привлечь), и ограничимся этой элементарной демонстрашкой крайне неприглядной ситуёвины.
Но даже и тут возникает много вопросов.
Да, владельцы сайтов, конечно, феерические идиоты, использовавшие для поднятия в сайтах магазинов движки, написанные другими феерическими идиотами. Ничего не слышавшими про метод передачи данных POST, и тупо малюющих хэш прямо в урле страниц.
Но мы не об этом. Думка совсем про другое.
Задайте-ка себе вопрос, станет ли человек мужского пола, купивший в сексшопе костюм монахини и украшение для ануса с кристаллами Сваровски (очень будем надеяться, что не для себя), и заказавший доставку всего этого добра через EMS (исключительно чтоб не ходить на почту и не заполнять бумажки про кто когда чего откуда получил), публиковать где-то прямой урл странички с результатами обработки своего заказа?
Очень в этом сомневаюсь.
Будет такой URL публиковать у себя чуть ли не на главной странице сам сексшоп?
Сомневаюсь в этом ещё сильнее.
Тогда как такая внутренняя страница попала в индекс Яндекса?
Естественно, у Яндекса такое спрашивали. В ответ получили бред про файл роботса, который обязан существовать, в нём должна быть запись про закрытые разделы, и тому подобную чушь для умственно отсталых. Потому как мы-то не клинические дебилы, и прекрасно понимаем, что это никак не снимает вопрос проникновения нигде не опубликованного URL-а в индекс, да ещё и знаем в точности: файл роботса носит всего лишь рекомендательный характер, и роботы того же Яндекса толпами ходят и по страницам закрытых от индексации (файлом роботса) разделов.
С этого момента будьте внимательны, ибо, если Вы вебмастер, и владеете хоть одним магазинчиком, но не осилите суть саги, то легко можете получить иск по моральному ущербу и вреду репутации своего клиента.
-
Самое первое, что необходимо сделать, так это выкинуть нафиг движок, написанный феерическими идиотами. Ни в админке, ни в логинке партнёра, ни в зоне юзера (покупателя), ни где-либо ещё в адресной строке браузера не должно быть никаких хэшей, уникализирующих страницу и её контент. Иначе URL этого места обязательно покажет все интимные секреты любому желающему.
Если не выкинуть нафиг движок от феерических идиотов, то далее ситуацию контролировать Вы не сможете. Абсолютно точно.
-
Также на сайтах с интимными секретами не стоит ставить код Яндекс-метрики и прочих аналогичных сервисов. Ибо, как Вы уже догадываетесь, URL-ы всех документов с таким кодом скармливаются индексирующему боту, а сами документы попадают в индекс. Где и могут быть найдены по разным хитрым запросам абсолютно без проблем.
-
Если Вы думаете, что неиспользование Яндекс-метрики и прочих аналогичных сервисов хоть как-то Вас защитит, то очень зря думаете так. Потому что идиотизм многогранен, и может проявляться не только у разработчиков движков и владельцев сайтов, но и на стороне юзеров.
Только полный недоумок способен повесить на свой браузер SpyWare в лице Яндекс-бара (или любого другого бара), который и станет (вот ведь сюрприз) делать ровно то же самое, что и Яндекс-метрика на сайте. Отправлять URL-ы просматриваемых серфером страниц прямиком в Яндекс или иную контору, произведшую на свет этот Bar.
Но, судя по количеству пользователей всякого рода Баров, поток недоумков не иссякнет никогда.
-
Также не стоит себя тешить мыслью, что Вы никак не относитесь к племени блаженных, если не используете вообще никаких нахлобучек на браузер. Сам браузер может сливать все посещаемые URL-ы вообще без всяких дополнительных плагинов — Гугл Хром тому примером. Если шибко нравится его функционал, используйте заместо него Iron – визуально и по сути то же самое, но без встроенных SpyWare.
Ну а пока владельцы сайтов не взялись за ум, всевозможные «утечки» конфиденциальной информации будут постоянно. Потому что слово «утечки» взято в кавычки неспроста — никаких утечек и сложного хакинга тут нет и в помине. Создатели движков (те самые феерические идиоты) вообще не предусмотрели никакой защиты изначально.
Про вменяемость же пользователей (не юзать метрики, не пользовать Яндекс-бары) вообще речи не идет. Никто никакой вменяемости их поведения даже не ожидает.
Когда будете создавать какой-нибудь сервис с юзерзоной или поднимать магазинчик, вспомните про этот пост. Он реально полезный.
Другие статьи категории «SEO - три весёлых буквы»
Оценка траста сайта на глаз.
Хотя местный автор зарекался писать на темы, близкие к SEO, поскольку само направление по сути есть сплошное шаманство, тем не менее читатели этого блога по привычке задают вопросы, на которые благовоспитанному самураю положено давать ответы. Ибо таково традиционное воспитание. Оно, конечно, можно было бы прибегнуть к популярной у многих блоггеров концепции «Ask Questions…№ 2Респект!
№ 3Надежда рухнула.
№ 4Это живет недолго.
Правда, в сохраненной копии все прекрасно видно. И фамилия там тоже есть :)
Но вопрос не про то.
Мастер, а как такое странное поведение Я-бара можно использовать?
Использовать можно по-разному, но вряд ли нужно.
Хотя ход мысли русского человека понятен :)
И он, этот путь, может быть, например, таким:
Вряд ли получится по юзерагенту определить, есть в браузере посетителя Яндекс-бар, или нет. Бары Гугла, Рамблера, Майла ру детектируются по юзерагенту совершенно запросто. Но Яндекс-бар проявляется в юзерагенте только тогда, когда посетитель окажется на серверах самого Яндекса :)
Сделайте сайт с доменом Яндекса на денвере, и убедитесь, что Яндекс-бар изощрен непомерно. А потому от него можно ждать чего угодно.
Поэтому, раз наличие Яндекс-бара детектировать на своем сайте не получится (а жаль), придется действовать наобум.
Убедившись, что на сайт зашёл не бот (например, с помощью тестовой куки), ссылку на туда, куда обязательно пойдет дальше посетитель, подменить с обычной на сылку с реферами.
Ну или ЧПУ какое привлечь.
На открывшейся затем странице (в УРЛе которой наблюдаются реферы или признаки работы ЧПУ) сделать небольшую модификацию контента, однозначно соответствующую реферу. Чтоб страничка с этим рефером была далее статична.
Пусть таких реферов будет тысяча штук.
Естественно, Яндекс-бар, если он у посетителя установлен, стукнет куда надо, что найдена ранее неизвестная страница сайта. То, что такие страницы без всяких внешних ссылок попадают в индекс без всяких проблем, мы уже знаем на рассмотренных в посте примерах.
Так со временем в индексе поисковика скопится много версий документа, и, если модификация контента виртуальных страниц делалась с головой, на совершенно кошерный сайт, без всяких видимых хитростей, будет падать все возрастающий трафик.
Потому что трафик прямо пропорционален числу проиндексированных страниц. Контент которых люди активно ищут.
Говорить про то, что URL-ы, отловленные Яндексом через свой Яндекс-бар, попадают в серп максимально прямым путём, видимо, нет нужды.
Как-то вот так.
№ 5Ну это уже что-то
№ 6Кажется этот ЖЖЖЖ неспроста
Даже когда Степашина спросили про них, то он ответил невозмутимо : "Ну утекло, бывает".
Лично мне кажется что подобного рода незначительные утечки делаются специально, чтобы приучить нас обывателей к тому что СИСТЕМАТИЧЕСКИ утекает ДОСТОВЕРНАЯ информация, прокладывая мостик в головы людей для нужного различным структурам ЯКОБЫ "случайного слива".
Или это у меня опять паранойя разыгралась?
Три мощных вброса за неделю или около того.
Причём скоординированных.
И с подачи СМИ.
А ничто не светится в СМИ без причины.
Значит, так надо.
Кому и зачем, думайте далее сами.
№ 8Без темы
Любой нормально работающий мозг наизобретает сходу еще столько же...
№ 9Без темы
№ 10Хрень
Правильно ув. автор говорит: понатыкали всяких счетчиков-кнопок, а из авторизации только какая-то хрень в get-запросе. Кнопка шлет урлу яндех-счетчику вместе со всеми гетами, яндех-бот получает эту урлу также со всеми гетами, идет по ней, и не встречая никаких роботсов-тхт и проч. честно урлу индексирует и выплевывает в индекс. И наверняка таких "закрытых для просмотра" страниц еще до хренищи в индексе.

Смешно, но он еще и платный к тому же...