Яндексовый кролик и гугловый крокодил.
Из серии «кто про что, а Чапай про тачанку».
Иногда нам, проживающим внутри восьмого чуда света по имени одна шестая часть суши, вдруг взбредает в голову подло и коварно изменить великому и могучему, и забацать сайтец на вражеском. На языке тоже нефигово великого Шекспира. Благо, финансово это вообще не ощутимо, а экспириенс несёт богатый.
Но сайтец сам по себе ничего не значит, будь он хоть трижды замечательным и неимоверной колонковой пушистости. Как говорится, сила, брат, совсем не в том. Сила только в пересечении сайтеца с целевым трафиком. Который в реальности может черпаться только из бездонных закромов родины по имени Гугл.
Почему именно Гугл? Из реалий. Так, на одного серфера из msn приходится пяток ходоков из yahoo. А на каждого визитёра с Яхи человек 20-25 с Гугла. Посему тупое ориентирование на флагмана, вероятно, вполне уместно. По крайней мере, оправдано. Стрелять в самого толстого зайца- это по-нашему.
Однако повадки у зайца совсем не те, что у домашнего кролика. Если какой-нибудь нашенский Яндекс схрумкает Ваш сайт в течение суток, с превеликим аппетитом, прямо как сочную морковку, и практически тут же начнёт испражняться в своём серпе ссылками на Ваши странички по всяким разным запросам, то при попытках добиться ровно того же самого от гуглового жирного зайца Вас постигнет обломинго.
Нет, вроде бы сначала всё нормально- Вы изыскали жирную морду, согласную на прилинковку к Вашему сайту, нацарапали на жирной морде ссылку на свой новорожденный ресурс (субмитом его по поисковикам занимаются только бегиннеры), обнулили статистику лога, и наблюдаете.
Ага, вот пожаловал гуглбот, прошерстил все странички, и через сутки-другие морда Вашего сайта уже видна в серпе при поиске по имени домена (иначе не сыщете). Через недельку- другую обозначились еще с пару десятков документиков. Вроде все окейно.
А потом трах-тибидох, и нету в серпе ничего. Даже следов домена, даже с присказкой site: в строке запроса. Ни морды сайта не видно, ни любого из документов, видимых ранее. Бан?
Хождение до соответствующей тулзы говорит, что нет, не бан. А скорее всего, «песок». SandBox. Песочница. То призрачно, мифологично и эфемерно. Тут давайте поподробнее, ибо зело интересно.
Не знаю, как Вам, а мне интуитивно понятна политика Гугла. Назовём её политикой нильского крокодила. Или подходом физрука старших классов с его принципом «я, блин, сейчас из тебя сделаю или человека, или урода». Но второе как-то сугубо по-рашенски и не политкорректно. Давайте остановимся на крокодиловом варианте.
Будете падать под стул, но и нильский крокодил тоже время от времени исступленно занимается творчеством, и порождает нехилый креатив. Но поскольку сразу после порождения этот креатив совершенно не готов к немедленному юзанию, и вообще мало смахивает на родителя, а покоится в желеобразном состоянии внутри яичной скорлупы, то мудрый нильский крокодил зарывает всю эту радость в песочек. А там как Бог даст- что-то проклюнется и выберется наружу, что-то так в песочке и останется- не судьба.
Теперь возьмите этого нильского крокодила за хвост, зажмите ему пасть струбциной, и намалюйте жёлтой краской на чемоданной спине со всей дури «Google». А потом амнистируйте божье создание, и посмотрите на его повадки. Они останутся теми же самыми до копейки. А именно:
Суть и смысл песочницы Гугла.
Вот крокодайл по ссылке обнаружил новый англоязычный сайт. И первым делом зарыл его в песочек. То есть сделал так, чтобы ни по одному конкурентоспособному (коммерческому) запросу никто в серпе этот сайт не нашёл. Почему так? Зачем?
Крокодил считает, что сайт должен элементарно созреть. Обрасти внешними ссылками, чтобы их можно было проанализировать и понять, что же это за сайт такой и чего же от него можно вообще ждать (контент на веру не принимается). Залинкован ли он со всякими придурками (терминология корифеев Гугла, претензии не ко мне), либо же с уважаемыми и тематически однородными ресурсами.
Понятное дело, что реакция на то и другое со стороны Гугла будет совершенно различной. В первом случае придурочный сайт зароют в песочек поглубже, чтоб ненароком не пророс наружу, во втором позволят сайту благополучно вылупиться из яйца на свет божий, и получить подобающий ему респект. Если же респект положен великий, то крокодайл даже сам раскопает явку в песке, и поможет запесоченному бедолаге обрести свободу досрочно.
Не нужно быть семи пядей во лбу, чтобы понять, зачем Гуглу понадобилась концепция «песочницы», а фактически- превентивной пессимизации новых сайтов. А всего лишь для наведения порядка в серпе. Когда англоязычных сайтов до хренищи, не помешает введение испытательного срока для новичков- пусть докажут, что они этого достойны, получать поисковый трафик.
Как мне кажется, Гугл со своей «песочницей» преследует и другую, коммерческую цель. Ну в самом деле- до 2004 ничего ж подобного не было. А потом появился AdWords, и началось... Владельцев новых англоязычных сайтов, лишая поискового трафика, элементарно разводят на рекламные компании. Это очень по-русски: сначала создать проблему там, где её быть не должно, а потом за деньги предложить обходной путь.
Учитывая, что сайты вылазят из «песка» как-то хаотично и непредсказуемо, могу предположить, на каком основании фильтры «SandBox» отпускают бедолагу из своих сыпучих объятий. Видимо, это случается в тот самый момент, когда Гуглу становится отчётливо понятно: этот сайт в AdWords участвовать не будет, дальше его мурыжить бесполезно. Пригришений за ним тоже не наблюдается- может откапываться, хрен с ним.
Вот такие они, повадки нильских крокодилов :)
Как быстрее повзрослеть, и покинуть песочницу?
Так как любой англоязычный проект при своём становлении обречён изображать Абдулу из «белого солнца пустыни», суть и смысл чего интерпретированы выше, возникает каверзный вопрос: а что со всем этим делать?
Поскольку ничто не берётся из ничего, и «вначале было слово», а сотворению сайта предшествуют думки о нём, то возьмите себе за правило: решились на проект- сразу же зарегистрируйте домен под него. Поместите туда десяток страниц с соответствующим случаю контентом, и минимально пролинкуйтесь снаружи. Чтобы Гугл узнал, что есть такой домен, и тут же бы пропесочил его.
К тому времени, когда от раздумий Вы перейдёте к практическим действиям (а у нас любят долго запрягать), сайт выйдет из песка, либо будет уже близок к этому. На что понадобится от трёх месяцев до чуть ли не года, что и вовсе тоскливо. Потому смысла тянуть с регистрацией домена нет никакого.
Ещё интереснее вопрос: как выбраться из «песочницы» пораньше?
Лучший совет состоит в том, чтобы как можно точнее соответствовать модели среднестатистического сайта. Постепенно наращивать контент и ссылочную структуру. Немножко менять уже существующие документы. И не допускать никаких серьёзных проявлений придурковатости, чтобы у Гугла не возникало желания дополнительно пессимизировать сайт, зарыв его в песок поглубже.
Советы типа регистрации более дорогого домена и на больший срок тоже не противоречат цели- чем больше в проект инвестировано денег, тем благосклоннее к сайту фильтры «TrustRank». Хотя совет не настолько очевиден, чтобы принимать его на веру и безоглядно.
Ну и напишу специально для тех, кто шибко умный. И решил прикупить старый домен, подменив на нём контент. Англоязычный на англоязычный, или русскоязычный на англоязычный. Иногда это может и сработать, но...
В Гугле тоже не дурни сидят, пальцем деланные, и предусмотрели такой вариант в своих фильтрах. Смена контента (процентов на 15-20), коренной редизайн сайта, и особо смена языка и ссылочной структуры- это то, что всяко отслеживается, и попахивает неотвратимой песочницей на повторный президентский срок.
Вот имею сайт на много тысяч страниц- дизайн поменять бы, да боязно. Пессимизируется ведь всё нафиг, резко и надолго...
А что же наш домашний ручной кролик?
В смысле- грозит ли «песочница» сайтам с русскоязычным контентом?
Вряд ли. Удельный вес русскоязычных сайтов мизерный, никакой особой коммерческой ценности для Гугла вся эта диаспора не представляет совершенно (в плане раскрутки на компании в AdWords), и «песочницы» для шедевров на великом и могучем нет, и вряд ли она нарисуется в обозримой перспективе. Любой мало-мальски грамотно написанный сайт спустя месяц после регистрации домена начинает получать поисковый трафик с Гугла, и проблем в этом плане никто никогда не видел.
Другое дело, что сама идея «песочницы» абсолютно здравая, и вполне может приглянуться тому же Яндексу. С рейтингованием сайтов у него сейчас явные проблемы. У Вас может быть ноль прегрешений, но бан непонятно за что. И в то же время серп сей искалки переполнен столь очевидными дорами и порнухой, которых там быть не должно вовсе. Регулируется всё это безобразие только стуком и ручками, что есть тупиковая ветвь эволюции, и ведёт в никуда. Десяток Платонов Щукиных вместо одного- это не решение проблемы.
С другой стороны, самодурство Яндекса настолько достало вебмастеров, что они даже и не рассматривают эту искалку как приоритетную- целевая аудитория уже приходит главным образом с Гугла. А если Яндекс начнёт нормализовать свой серп посредством концепции «песочницы», то он тут же потеряет тех немногих, что остались ему верны. То есть отвратительное качество выдачи в Яндексе- это навсегда. Волноваться не о чем.
Надеюсь, с пониманием сути и смысла гугловой «песочницы» у Вас наступило просветление. Если что не так, пользуйте комменты, и отзывчивые читатели блога восполнят возможный пробел в скупых, но ёмких словах. Спрашиваем. И делимся, ибо Господь... Ну да сами знаете.
Хомячковый рай. Уйти и потеряться:
Затычка от ванны как ночной кошмар всякой курицы.
При основательной работе с серьёзными искалками любой вебмастер руководствуется принципом эскулапа типа «не навреди». Понятно, почему- путь к вершине серпа долог и тернист, а сыграть в дауна можно легко и просто.
Именно страшась дауна, вебмастер блюдёт самым строгим образом совершеннейше неочевидные правила, такие, как постепенное изменение контента сайта. К примеру говоря. Когда на сайт не выкладывается сразу тысяча страниц, но добавляется по сотне еженедельно.
Понятно, почему- очень немногие ресурсы обзаводятся тысчонкой- другой документов за промежуток времени между двумя визитами поискового бота. Это для сайтов, вообще-то говоря, не типично. И подозрительный поисковик, заслушав доклад своего бота-разведчика, может решить, что тут он сталкивается с генератором дорвеев, или ещё чем-то подобным. С вытекающими- либо сайт на время из серпа исчезнет, либо бот приползёт только через месяц, либо ещё какая закавыка на горизонте нарисуется. А вебмастеру всё это ни к чему.
Точно по той же самой причине никто и никогда не меняет контент всего сайта одним махом. Естественно, имеется ввиду ситуация, когда сайт реально большой, и документов в нём много (тысячи страниц). Соображения ровно те же самые до копейки.
И уж совсем крайнюю осторожность вебмастер проявляет при манипуляциях с документами, интенсивно получающими поисковый трафик. Ибо вполне может так получиться, что, образно говоря, человек своими же руками засунет затыкашку от ванны в то самое место, которым курица, несущая золотые яйца, эти самые яйца ранее усердно и добросовестно производила на свет.
Можете себе представить обалделое недоумение курицы и горечь вебмастера, таки осознавшего свой поступок. Но затычка от ванны страшна своей фатальностью. После её применения иной раз курицу остаётся только в суп- нестись она больше не будет...
Наваристый куриный бульон- слабое тому утешение. Птичку жалко.
Так мы теряем свои сайты...
Прониклись всей крутизной засады, приготовленной искалками на нерадивого вебмастера? Ну и ладненько.
Если до сего момента всё понятно, обозначенная опасность осознана, а затычка от ванны, пробка от термоса, и прочие кукумберы с пупырышками уже соотносятся в Вашей голове с курицей, несущей золотые яйца, как непримиримые антагонисты- антиподы, то Вам должна быть интересна нижеследующая информация про манипуляцию над контентом страниц, получающих нехилый объём поискового трафика.
Я долго воздерживался от такой манипуляции, так как масштабы засады чётко себе представлял. Но иногда и шашкой помахать надо - адреналин штука полезная.
Итак.
Так получилось, что главную ценность всего этого блога искалки уровня Гугла видят в страничке его статистики. Где протоколируются реальные поисковые запросы серферов, и из многих разных слов, стоящих рядом, любой бот любой искалки при желании легко накомбинирует множество других низкочастотников. А то, глядишь, и высокочастотники тут затешутся.
От того факта, что любой поисковый запрос завязан на белый дор, и через него- на реальный контент, мы пока абстрагируемся. Это важно, но разговор пока не про то.
Интерес в другом- а что случится, если вся эта страница статистики с тысячами кейвордов, материализовавшихся в сотнях кило HTML кода страницы, с третьим пиаром и хорошим положением в серпе по многим ключевикам ВДРУГ станет пустой и непривлекательной для ботов. По идее, поисковый трафик должен тут же кончиться, пропасть. А страница- пессимизироваться.
Понятно, что интерес возник не на почве мазохизма. Ресурсы хостера не безграничные, статистика по 50 тысячам хитов и нескольким дюжинам искалок уже еле ворочалась. Поневоле пришлось отчёт о поисковом трафике структурировать и дробить на кучку более мелких страничек.
Наблюдение за реакцией Гугла в ответ на такую реструктуризацию «шпионского досье» дало три наблюдения:
- Несмотря на мгновенное обновление страницы статистики в гугловом кэше, её положение в серпе по традиционным для неё кейвордам несколько дней оставалось без изменений. Несмотря на полное несоответствие страницы этим самым кейвордам, что Гугл не мог не видеть. Удивительно. Похоже, тут мы имеем какую-то инертность- читать про неё не доводилось.
- Возможно, инертность обусловлена тем, что боты в это время усердно продалбливались по ссылкам, ведущим с обновлённой страницы- все кейворды перекочевали туда. Возможно, документ, напрямую залинкованный на релевантные запросам страницы, не пессимизируется столь уж катастрофично. Ведь серфер таки попадает, куда ему нужно. Пусть и не напрямую.
- Судя по анализу популярности страниц, поисковые запросы были тупо перенаправлены строго на те новоявленные странички, контента в которых больше (под контентом тут понимаются уникальные кейворды в численном выражении). В шпионском досье видно совершенно отчётливо, что число переходов с поисковика на новорожденные странички хорошо коррелирует с числом ключевиков на них. Зависимость не очень линейная, но однозначная.
Последнее немного озадачивает.
В самом деле, вебмастер, привыкший мыслить традиционными категориями, волен предполагать, что страничка с контентом про покемонов, с линками на документы про покемонов, должна быть более релевантна запросу про покемонов же, чем точно такая же страничка, но с примесью всего того же про пепетунов. И вроде как две разные странички (про покемонов и пепетунов) должны получать каждая свой целевой трафик.
Однако в реальности трафик падает иначе- на страницу, где вперемешку покемоны с пепетунами. По запросам и про покемонов, и про пепетунов. Что несколько противоречит устоявшимся догмам, однако.
Отсюда не очень воодушевляют пожелания оптимизироваться под поиск ручками или с помощью софта, соблюдая на странице плотность ключевых слов. И заверения о необходимости строгать страницы под разные запросы, но по тому же принципу, также не внушают доверия. Очевидно, что все эти кейворды и плотности тех самых кейвордов сегодня играют очень незначительную роль. Настолько незначительную, что о плотности ключевых слов можно даже и не думать. Помнить, конечно, но не доходить до фанатизма.
А в целом разруливание поискового трафика (90% его падало и продолжает падать внутрь «шпионского досье») показало гибкость алгоритмов Гугла- плотность трафика просела процентов на 20-30, да и то не надолго.
Курица избежала ужасов общения с затыкашкой от ванны, и продолжает исправно нести золотые яйца :)
Но вот вывод про плотность ключевиков (вернее, игнорирование Гуглом оной) малость озадачивает.
Хомячковый рай. Уйти и потеряться:
Любят тех, кому доверяют.
Пост длинный. Ахтунг.
Да простят меня читатели этого блога за излишнюю любовь к искалкам вообще и Гуглу в частности, а также писанину на эту тему. Но так уж человек устроен- столкнувшись в жизни с очередным «чёрным ящиком», и понимая, что это судьба, и от неё никак не уйти, подсознательно принимается тестировать «чёрный ящик» сигналами по входу, наблюдая результат на выходе.
И без разницы совершенно, что это за «чёрный ящик»- начальник ли со всеми его прибабахами, женщина ли как предмет интереса, или Гугл собственной персоной. Подставьте нужное по вкусу. Если это «нужное» действительно Вам важно и необходимо, то даже совершенно не представляя, как оно устроено и что о себе думает, Вы всё равно в состоянии добиться от этого «чёрного ящика» нужного Вам результата.
Чем всякий вебмастер и занимается. С тем или иным результатом. Иногда совершая такие странные обряды и соблюдая столь нелепые ритуалы, что люди вне вебмастеринга только диву даются.
Давайте я Вас по этому поводу повеселю.
Недавно я попросил своего регистратора пролонгировать домен lasto.com на максимально возможный срок. Для указанной доменной зоны он составляет 10 лет. В связи с чем регистратор сильно подивился, и начал строить догадки, нафига это вдруг потребовалось. Регистратор очень тактичный, но стопудово, что в его голове пронёсся ворох примерно таких предположений:
- Ласто где-то заработал кучу бабок, и их ему просто девать некуда.
- Возможно, будет наценка на домены. Прознал про то и суетится.
- Никак огребся траблами, и ему присудили десятку. Скоро закроют.
- Причуда такая. Выпендривается.
- Просто собрался жить вечно.
Всё мимо. А теперь правильный ответ.
Нет, вообще-то цена продления домена на 10 лет в аккурат эквивалентна бутельменту с хорошим коньяком, который уже можно пить, наслаждаясь вкусом. Что регулярно и проделывается. Вроде как и говорить не о чем, не та сумма.
Но мы ж недаром в начале заметки заводили разговор про чёрные ящики, понимая, что из всех доступных наблюдению Гугл- самый что ни на есть чёрный, и к тому же чертовски загадочный. И уж совсем никак не сказать, что нам нет до него никакого дела.
И что самое обидное, позиция документов в серпе лишь на двадцать процентов зависит от личных заслуг документов (имеется ввиду контент и всякие внешние ссылки, материализованные в PageRank’е и прочих мифологических сущностях). А на четыре пятых диктуется соображениями доверия к сайту.
Да, да. Вы можете извращаться как угодно, ставя и убирая теги (в том числе и метатеги), рисовать заголовки типа
Почему?
А потому что степень доверия к сайту никак не зависит от всех этих вебмастерских изощрений. Вы с удивлением будете наблюдать на первом месте в серпе сайты без каких бы то ни было изощрений. У иных и тега титла-то нет... Что никак им не мешает вставать на первое место при ЕДИНСТВЕННОМ упоминании нужного кейворда в контенте страницы.
Суть подобных чудес проста. Толкуем дальше за гугловый фильтр доверия «Trustbox» и пытаемся понять, нафига Мастер Ласто продлял свой домен на 10 лет.
Если Вы поюзаете кейворд «Trustbox» по назначению, и почитаете доступную информацию (желательно на языке оригинала- там домыслов меньше), то постигните, что Гугл шибко уважает сайты, которые среди прочего:
- Зарегистрированы и проиндексированы давно.
- Обязательно включены в ссылочную структуру.
Особо приветствуется солидный возраст входящих ссылок и их тематическая однородность. - PageRank – про него мы тут говорить не будем, но он должен быть достойным.
Понятно, что каждый из критериев имеет как количественную, так и качественную составляющую. Но под возрастом понимается не только время, протикавшее с даты регистрации домена. В возраст включено и время, которое сайту осталось жить. То есть дата, до которой домен зарегистрирован, тоже имеет вес. Естественно, с умножением на какой-то серьёзный коэффициент.
Если думать дальше, поминая и такой фильтр Гугла, как «Sandbox» (песочница), то становится понятным, что срок жизни сайта как фактор качества его контента- не плод измышлений автора публикации. Гугловцы, судя по всему, весьма уважают сей параметр. Пришли они к нему не сразу, и вряд ли теперь от него откажутся. До тех пор, пока речь будет заводиться про степень доверия и прочие подобные характеристики сайта, время жизни ресурса будет над всем этим довлеть.
Вы можете со мной не согласиться, но давайте посмотрим на модель Гугла в миниатюре, где всё гипертрофировано. На какого-нибудь яндекса, формирующего свой серп на основе х*ИЦев (это не то, про что Вы подумали. Ха есть икс, замещающий термины наподобие «взвешенный», «тематический», а про ИЦ все и так в курсе. Звёздочка- всего лишь символ присоединения одного к другому).
Как только всякие х*ИЦы родились, так вебмастерская публика начала ими вовсю манипулировать. Результат мы знаем- яндексовцы настолько одурели от бардака в серпе, что тупо банят всё, что хоть отдалённо похоже на обмен ссылками, коварно предпринятый с целью обмана их бота (в чём обман, не знаю). 10% страниц индекса ежемесячно банится. Если Вы имеете сайт, то в течение года он попадёт в бан по меньшей мере один раз. Кого это не коснулось, встаньте в очередь. Уже скоро.
В Гугле всё примерно то же самое- там до бана сайта целиком дело не доходит, но страницы из серпа пропадают со свистом- предыдущие заметки этого блога донесут до Вас тонкости и причины. Гуглу стало ясно, что ПиАр- не панацея (ссылки продаются и покупаются, сейчас этому возводится заслон в виде умного фильтра). Отсюда проистекает и необходимость параметров типа степени доверия к сайту, важность ссылочной структуры, и прочие малопонятные вещи. На всё на это и приходится 4/5 (а то и больше- называются цифры до 85%) «веса» при позиционировании документа в серпе. Ссылка http://lasto.com/blog/post_1154702393.html как иллюстрация, как оно всё запущено.
А теперь спросите себя, как человека разумного, что проще и быстрее для получения соизмеримого результата: делать громадный объём работы, идущий в зачёт с коэффициентом ноль целых хрен десятых, или приложить малые усилия, но оказаться в выигрыше за счёт пятикратного коэффициента? Затрудняетесь ответить? Спросите о том человека с домкратом. Он Вам физику объяснит.
Но пора закругляться.
В общем и целом, искалки сегодня совершают качественный рывок вперёд. Уже не очень важно, какие такие слова вы применяете в документе, сколько раз и каким кеглем. Как там расставлены теги, и каким таким раком. Можете всё сделать правильно, залинковаться снаружи в усмерть, а потом тихо обалдевать, как совершенно не оптимизированная страница гордо реет выше Вашей. И намного выше.
А всё потому, что она сильна в другом. Её домен старше и уважаемее. Этого достаточно.
Думаете, баян?
Тупо открываю оглавление данного блога, выделяю начальные слова заголовков уже проиндексированных заметок, и луплю запросом в Гугла. Результат в виде запрос – место в серпе – всего страниц по этому запросу будет такой:
|
Враги сожгли родную хату Предосудительные связи Сила страницы Сим-сим, откройся Начав скалить зубы Плыть к истоку |
4 1 1 2 1 1 |
78 100 12 400 45 700 000 12 500 14 100 68 900 |
Памятуя, что заглавие поста у меня за редким исключением обычно никак не соотносится с самим постом, то есть «левое» по отношению к контенту, такого в большинстве случаев быть не должно. Это- всего лишь результат уважения к домену. И ничего больше. Ибо простой набор случайных слов ну никак не должен систематически подкидывать документ в данном домене на верхушку серпа только лишь при факте включённости этих слов в контент документов. Однако...
Фактически сайты с высоким уровнем доверия при наличии желания могут оккупировать верхушку серпа по любому нужному им запросу. Сайт, доверия пока лишённый, ни в жизнь не проберётся в эту тусню. Ну разве что за счёт титанических усилий- см. выше. Да и то не сразу.
Хорошо это или плохо?
Не знаю. Но факт, что весьма скоро одержимость идеей наращивания ПиАра будет наблюдаться уже не в такой хронической форме. За неимением особого смысла. И вебмастера не будут метаться на манер курицы с яйцом (у всех, кто это видел, в душе родился крик), суетясь по поводу обмена ссылками. Каждый линк будет обоснован и не лукав. Сказка...
Ужель наступит этот день ?
