Про любовь: пейсатели и основной индекс Гугла.

Самые популярные товары с Али по лучшей цене:

Мужской кошелёк с RFID-блокировкой 427 руб.
Цифровой тестер качества воды 590 руб.
Оригинальный RTL-SDR v3 c TCXO 2908 руб.

31 октября 2012, 12:00

Про любовь: пейсатели и основной индекс Гугла.

Про любовь: пейсатели и основной индекс Гугла.

Иероглиф малюю.
Сверху вниз на заборе -
Гейши читают...

Любой владелец сайта любит хотеть, чтоб на его ресурсе не переводился поисковый трафик. Чаще всего это желание из области иррационального, ведь на самом деле немногие умеют зарабатывать на трафике. Но иногда сайт действительно монетизируется именно через трафик, так что хотелка вполне кошерна и в тему.

Однако всякий носитель умной головы, «повёрнутый» на SEO, уже знает из предшествующего опыта, что далеко не каждый документ способен сгенерировать (привлечь) поисковый трафик. Если речь идёт про какую-нибудь умную искалку уровня Гугла, то документу надо сперва попасть в её основной индекс. То, что проиндексировано, но в основной индекс не попало, в плане генерирования поискового трафика фактически совершенно бесполезно.

Потому основная думка вебмастера — про то, как писать «правильные» документы.

Тут, казалось бы, проблемы-то и нет. Создал документ, посмотрел на реакцию искалки. Не получилось — сделал иначе. И так по кругу. Выход из цикла по факту наступления счастья.

На практике всё чуть сложнее.

Любой новоявленный документ сперва индексируется. Более или менее оперативно. Потом непременно попадает в основной индекс. После чего и спустя ощутимое время обычно уходит в сапплементал. И вот это самое «ощутимое время» как раз и не даёт оперативно постичь Дао. Ибо, будучи конкретизировано по сроку, может составлять от месяца до чуть ли не года.

Посему имеет смысл думать про «идеальный документ» на примере давно существующего сайта. Возрастом от пяти лет. В котором давно всё утряслось, и что-то уже можно понять.

Местный автор тоже интересуется такими вещами. А потому далее последуют некоторые рассуждения, даже и не адресованные неопределённому кругу лиц. Просто зарубочка на память. Дабы потом к ней вернуться, и покумекать ещё.

Типичная картина расфасовки сайта по двум индексам Гугла.

У местного автора базовый сайт немного не типичный, ибо всякие лоты и мануалы к ним — вообще не пойми про что. А вот раздел с блогом наполнен правильной русской речью, и материалами примерно соотносимого размера. Причём раздел достаточно древний, с «устоявшимся» контентом.

Местный автор не страдает всякими детскими болезнями про недублирование контента, и прочей чепухе. Потому любой пост у него порождает анонс, дублируется в скролле, а также творит комментарии в том числе и на отдельных URL-ах (как списком по 10 штук, так и персональные, для каждого коммента). Не говоря про «белые доры» чуть ли не к каждому устойчивому словосочетанию, фигурирующему в любом посте.

В итоге пара сотен постов порождает под семь тысяч документов — если точнее, Гугл видит в блоге 6670 страничек (на момент написания сего, естественно). Из которых в основном индексе всего-то 112. Это именно та база, которая создаёт поисковый трафик блога.

Чего там только нет :)

Но, как ни странно, в основной базе Гугла совсем мало собственно постов. Всего 23 штуки, из которых три совсем недавних, готовящихся уйти в сапплементал по истечении «бонусного» срока. Из дальнейшего рассмотрения эти три поста мы выкинем сами, чтоб не дурить ими себе голову.

Итого окажется, что собственно URL-ы постов в основной индекс Гугла попадают по принципу «каждый десятый». Запомните эту пропорцию — она достаточно типична.

Что любит Гугл?

Мы можем сперва смело предположить, а затем на полном серьёзе умозаключить, что выдача документов домена в основном индексе поисковика как-то упорядочена. По аналогии с серпом. Поэтому, глядя на список постов, изысканных в этой самой основной выдаче, мы тем самым заодно получаем рейтинг любви искалки к опусам местного автора.

Правилен ли выбор Гугла?

Скажем так — полной чешуи (каковой на блоге местного автора, естественно, в избытке) в основном индексе не оказалось. Все заслужившие гуглового респекта посты про важное и полезное.

Конечно, живой человек бы кое-что из того списка вычеркнул, и добавил сюда другие материалы. Но это, скажем так, в режиме «я и мои тексты». А вот если оценивать ситуацию снаружи, с позиций полезности тутошних хаек для типичного юзера, и исходя из его интересов, то подбор материалов, возможно, не так и плох.

В общем, коррелирует.

Анализ выбора Гугла.

Сразу можно заметить, что нет никакой связи между формальными параметрами документа, и его причисленностью к лику святых.

Документ может иметь любой объём (в пределах разумного), и любую внимательность со стороны комментаторов. На документ может стоять тьма ссылок с разных мест, а может их и не быть вовсе. И, в общем-то, генеральная тематика документа, и её совпадение с профилем сайта, тоже не так важны.

Это всё вторично.

Местный автор склонен полагать, что гораздо сильнее влияет то, что в народе звучит как «тема сисек раскрыта». Или не раскрыта.

То есть ставим какую-то практически значимую задачу (или оговариваем насущную проблему), а далее либо пошагово её решаем, либо хотя бы обозначаем действенные пути решения. Но так, чтоб понятно было.

То есть адреса, пароли, явки.
Графики, схемы, товарные чеки и накладные.
Те самые пресловутые инструкции по применению «how to use».

Второй момент.

Местный автор умеет изъясняться в широком диапазоне стилей — от «триста полезных слов» в духе Французского Иностранного легиона до изысканной словесной вязи, постижимой разве что толкиенистами ранга не ниже Старшего Магистра ордена, да и то в минуты душевного просветления.

Однако посты, целиком вошедшие в основной индекс Гугла, написаны на нормальном человеческом языке, почти без изысков. Всё, что с изысками, не удостоилось.

Про самоанализ.

Естественно, каждый вебмастер не прочь проанализировать вхождение документов своего сайта в основной индекс Гугла. Сходным образом. Тут надо иметь ввиду два момента:

  1. Не стоит обращать внимание на недавние документы.
    Пройдёт время, и они из основного индекса массово уйдут.
    Не нужно обманывать себя неравновесной ситуацией.

  2. Признаком равновесности является ситуация, когда в основном индексе находится приблизительно десятая часть от всех проиндексированных контентообразующих документов.

Так, в случае блога, контентообразующим документом будет пост.
И ни что более.

Понаписали сто постов, и видите в основном индексе около десятка из них (все возрастом от полугода или около того) — всё, уже можно анализировать, что именно нравится Гуглу в этой тематике на этом домене.

Исходя из ощущений, далее можно делать выводы.

Кстати, про оригинальность контента.

Про неё ещё не было ни слова, верно?
Неспроста.

Ничто не мешает сидеть в основном индексе документу, контент которого не просто скопипащен, а ещё и растиражирован в десятках и сотнях экземплярах, причём в неизменном виде.

И не очень важно, Ваш контент растиражирован вовне, или это Вы разместили у себя столь же растиражированный контент.

Звучит дико, и вызовет протест в душе почитателей Яндекса, привыкших к иному. Но c'est la vie.

Оговорочка специально для тех, кто сдуру молится на уникальность, и чего-то там постоянно проверяет по «антиплагиату».

Это глупое и никчёмное занятие.

P.S.

И таки да, катэ в статье добавляет посту +30% к рейтингу :)

Котэ одобряет.

Другие статьи категории «Вебмастеру на заметку»

Грани эволюции: избавляемся от мигунов.

Грани эволюции: избавляемся от мигунов. Как-то тихо и незаметно прошёл очередной ап ПейджРанка (что случилось ещё 2 августа). Следом нагрянул ап ТИЦ-а, так что на повестке дня у нас, как обычно в таких случаях, подразумевается ритуал простановки новых цен в Хитрой Конторе. В ходе исполнения означенных ритуальных действий местный автор вдруг вспомнил, что ещё по весне на нескольких своих сайтах внедрил инновацию, а рассказать про то забыл.

Актуализация знаний про 301 редирект.

Актуализация знаний про 301 редирект. Есть у местного автора в его зоопарке одна очень полезная зверушка, периодически вызывающая одни и те же вопросы. И поскольку хождение по кругу вдохновляет только рецидивных заключённых детского сада и юных питомцев пеницитарных учреждений, сейчас мы будем самозабвенно растекаться мыслью по древу.

Почившие страницы и траст Гугла.

Почившие страницы и траст Гугла. Всякий раз, когда разговор заходит о чём-то малопонятном, высокие договаривающиеся стороны просто обязаны сперва обсудить термины. Чтобы не получилось так, что под вроде понятным словом каждый подразумевает что-то своё, и на этой почве совсем не разумеет собеседника. В данном случае под трастом Гугла мы понимаем волшебство, позволяющее документам нашего сайта не просто находиться в поиске, а ещё и забираться на первую страницу выдачи.
31 октября 2012, 12:47

№ 1Хау то юз

И как же гугл вычисляет тексто с пошаговыми инструкциями?

Может правильнее говорить про документ с какой-то явно выраженной сердцевиной и цепляющий смежные темы.
Алексей
31 октября 2012, 12:50

№ 2А вот интересно

Было бы интересно узнать спустя некоторое время судьбу этого поста.
Алексей
31 октября 2012, 16:10

№ 3Без темы

а по моему тут перепутана причина со следствием.
то есть НЕ документы попавшие в суплиментал - не имеют трафика. а наоборот. сначала страницу закидывают в основной индекс. и вот потом - если она не имеет трафика - уже перегоняют в "сопли". посмотрите точки входа из поиска на блог. среди новых документов которые ещё в "основном". есть ли на них переходы из поиска за тот период когда они были в нём?
то есть я думаю что алгоритм гугла примерно такой:
нашёл новый документ.
поставил в основной индекс.
дальше смотрит - нужен он людям? сколько на него переходят? какой процент отказов, сколько времени проводят и тд.- тут туева хуча всяких параметров может учитываться.
и на выходе вердикт - если видит, что документ нужный, люди читают, переходят, запрашивают - оставляем в основном. ну а если нет то)))
вот гдето так)))
В идеале так и должно быть - тут полное принципиальное согласие.
Но по факту этого нет даже близко.
Openixxx
31 октября 2012, 17:26

№ 6Удобно...

Смотрел "основной индекс". Понравилось что в снипете поста всегда стоит дата его написания. Очень правильный шаблон сайта (или не знаю чего там еще шаблон)))
Вэлкамщик
01 ноября 2012, 21:23

№ 7Волшебная пропорция 1:2 ?

"обратите внимание на «волшебную» пропорцию 1:10 "

Есть сайт с волшебной пропорцией 1:2.
Всего 1400 страниц. Пропорция появилась на 6й месяц жизни сайта.
Весь контент копипаст, кроме пары страниц. Анонс в категориях - часть основной статьи.
Мне просто повезло?
Пытаюсь повторить с другими сайтами - не получается. В основном 1:20 .. 1:10
Заочно сказать что-либо трудно, надо на сам сайт смотреть.
Как минимум на его трафик.
Но пропорция 1:2 чудна, и вряд ли сохранится.
Александр
13 ноября 2012, 16:15

№ 9Успокоили - я не один такой

Как владельца пятка бизнес-сайтов, заточенных под российский оффлайн бизнес, выкрутасы Гугла с саплементалом меня мало волнуют. Всё-таки, львиная доля клиентов идёт с яши. Но, всё-же, и гугл вносит лепту. И мне было непонятно, почему уникальный контент, представлен в основном индексе, как сказал Вадим - каждой десятой страницей. Может, чего делаю не то? Ан нет - оказывается не один я озадачился подобным вопросом. Поломав немного голову, по зрелому размышлению, забил на эту несуразицу. Благо, сайты регулярно кушают трафф по целевым запросам, ибо имеют неплохие позиции по ним же. Что в конечном счёте, вознаграждается ежемесячным гешефтом. А что мне ещё надо? ;))
Алекс
Все заметки категории «Вебмастеру на заметку»