Мануал по поисковой оптимизации Гугла.


Золотую Рыбку
Незатейливо дрючит
Старче у моря…


Мануал по поисковой оптимизации Гугла

Как всем нам хорошо известно, самая нужная и полезная работа обычно делается силами наименее профессионально подготовленной части коллектива. Потому как истинный мастер всякой фигнёй заниматься не станет, а вот деятельность в рамках «всякой фигни», доверенная ламеру, и будет в итоге наиболее востребованной самыми широкими массами.


Такая вот ухмылка обыденности над здравым смыслом.


Вот и Гугл, обретя под сводами крыши вчерашних студиозусов, не долго думая, взял, да и засадил их за написание всякой ненужной ерунды, типа Google Search Engine Optimization Starter Guide 2010, ибо пока что больше ничего им доверить нельзя. Книжка получилась славной - ещё немножко, и до классических комиксов дойдёт.


Кто знает инглиш, почитайте. Хуже не будет.


Всем же остальным прочим, вражеского языка не разумеющим, рекомендуется зачитать этот пост Мастера Ласто, дабы умудриться, и примкнуть к сонму постигших все тонкости вебмастеринга.


Только давайте договоримся, что ни о каком подстрочнике тут речи не идёт. Тупой копипаст с одного лэнгвича на другой Мастеру Ласто абсолютно не интересен. Просто конспективно выделим то, что в действительности имеет ввиду Гугл, желательно предварительно тщательно позабыв всякие домыслы, почерпнутые у толпы гур.


И, уж простите, сделаем это на сложившемся вебмастерском жаргоне, ибо смею предположить, что он всеми понимается. Только вчера бросивших сосать мамкину титьку тут быть по определению не должно.


О построении сниппетов:


Не очень важно, на какой именно позиции первой страницы серпа очутился Ваш сайт. Это пусть маркетологи одурачивают заказчиков SEO-шных контор сказками про то, что первая позиция лучше второй, но стоит вдесятеро дороже. Мы-то знаем, что изыскатель всё равно пройдётся по всем первым позициям, а иногда и по нескольким первым страницам серпа, если он ищет что-то особенно важное. Либо ткнётся в тот сниппет, из которого с очевидностью следует, что, собственно, в других местах уже можно и не искать.


Поэтому не стоит с настырностью идиота фаршировать тег тайтла и метатег дискрипшена ключевиками. Изыскатель прекрасно помнит, что он вбил в строку поиска, и заклинать его множеством повторов этих же слов не надо. Потому что такой заикастый сниппет ему не интересен (он, скорее всего, ведёт на дор), не информативен, и вряд ли будет выбран.


А вот чтобы получился правильный сниппет, гугл даёт ряд прямых рекомендаций:


  • Тег тайтла обычно участвует в построении сниппета, и в силу своей неимоверной важности обязан чётко и ёмко описывать суть и смысл своего документа. Причём по возможности лаконично, ибо сниппет совершенно точно не резиновый, и если Вы забудете, кто такая сестра таланта, содержимое тайтла будет представлено в сниппете фрагментарно. Что в ряде случаев лишает его смысла.

  • Метатег дискрипшена может (но не обязан) участвовать в построении сниппета. Гугл чётко в своём мануале оговаривает тот случай, когда это происходит: тогда, когда в теле страницы не найдены более релевантные запросу фрагменты текста. В этом случае предполагается, что вебмастер всё-таки чем-то подумал, а потому с ответственностью сформулировал дискрепшен, ввиду чего из дискрепшена можно позаимствовать некоторые кусочки для сниппета, или вообще сделать их эквивалентными.

В этом месте каждый, конечно же, представил, чего ушлые мастера в эти тег с метатегом станут писать. Гугл тоже в курсе местных традиций, поэтому организовал целую череду тщательно спланированных засад:


  • Тег тайтла и метатег дискрипшена обязаны быть релевантны самому документу.
    Будете в них писать чего попало не по теме документа- сам документ оштрафуют.

  • Формулируйте мысль там и там максимально коротко.

  • При этом для каждого документа мысль должна быть сформулирована уникальным образом, особенно для тега тайтла. Уж постарайтесь, ибо повтор тайтлов у большого числа документов сайта обернётся ёжиком под попою.

  • Гугл предупреждает о недопустимости ключевиков, нерелевантных контенту, в обоих рассматриваемых тегах, а также большой тошнотности ключевых слов. Тут Вам не Яндекс, баловаться таким образом не нужно.

Ну и два специальных правила для метатега дискрипшена:


  • Не является хорошей идеей перечислять тут ключевики хоть через запятую, хоть малосвязанным текстом. Переведите с инглиша, как по-русски будет «description», и помедитируйте над смыслом этого слова.

  • Так же не стоит вдаваться в другую крайность, и просто копировать в метатег какой-то удачный фрагмент документа, якобы целиком отражающий его смысл и суть.

    Гугл и без Вас распрекрасно увидит этот фрагмент.

Не хватает мозгов сделать нормальный тег описания- лучше вообще обойдитесь без него. Большинство движковых сайтов именно так и поступают- не генерируют автоматом метатег дискрипшена, а вообще его не создают.


О ЧПУ:


Много мифов ходит про ключевики в урлах. Естественно, речь про те из них, что на языке запроса (изыскатель в строку поиска вводит именно их), а не какие-нибудь русские слова, транслитерированные и засунутые в адрес. Вполне возможно, что ключевики в транслитерации тоже кто-нибудь когда-нибудь ищет, но это не широко распространённый обычай.


Понятно, что изощрённые вебмастера умеют кодировать ключевики так, что получившееся одновременно и разрешено в составе URL-а, и предстаёт потом в сниппете на русском языке в адресе страницы, ибо сниппет-то в UTF, и такое с ним проделать можно. Но вот в чём вопрос: а оно помогает продвижению?


Гугл своим мануалом оговаривает, что он много чего повидал в этой жизни, и поймёт абсолютно любую систему адресации к документам сайта. Можно извращаться в этом как угодно. Но нигде нет ни намёка на то, что ключевики в урлах хоть в малейшей степени помогают лезть сайту в топ серпа.


Отъявленно начинающие вебмастера тут начнут ругаться, ссылаясь на выделение ключевиков в сниппете поисковика. Однако Гугл ещё раз и особо терпеливо подчёркивает, что все выделения жирнилкой сделаны строго для удобства изыскателя, дабы тот сразу узрел то, чего искал.


И, ежели он искал сиськи, то, наверное, сайт сиськи.ком про то, что ему требуется для счастья. Человек это сразу увидит и поймёт. И именно для этого сиськи в домене (и других частях сниппета) и выделяются стронгом, а не потому, что так высока их значимость именно тут, и только поэтому сам сайт в серпе.


Это вовсе не означает, что данный сайт при прочих равных условиях обойдёт в серпе тот, у которого нету сисек в домене. А есть они, скажем, в имени директории.


Да, конечно, логика нам подсказывает, что целый домен про сиськи- это всё-таки круче, чем один раздел сайта. Впечатлите этой логикой Гугла, и вот когда он плюнет на релевантность и траст, а начнёт истово молиться только на ключевики в урлах, тогда и будете спамиться в адресе документов.


А пока за обилие кейвордов в урлах полагается штраф. И это постулировано.


Плюс упомянуто, что эти кейворды всё-таки еще и должны быть релевантны контенту. Насколько кусочек урла «stranica» родной поисковому запросу «страница», я не знаю. То, что вот такая ахинея:


25D1%2581%25D1%2582%25D1%2580%25D0%25B0%25D0%25BD%25D0%25B8%25D1%2586%25D0%25B0


родная, это совершенно точно. Но значит ли это, что теперь все адреса документов стоит строить именно так?


Нет, наверное.


Потому что Гугл говорит открытым текстом: «мне совершенно всё равно, как именно вы делаете адресацию. Старайтесь, чтобы пользователю она была понятна и удобна. А я за это никаких плюшек не выдаю».


Рассматривая вопросы ЧПУ, мануал по SEO-оптимизации от Гугла также намекает, что продуманная система построения сайта (структура директорий, наблюдаемая в адресе) и имена документов могут послужить добрую службу при простановке ссылок. Ибо очень часто никто не утруждает себя выдумыванием якоря ссылки, и анкором становится сам УРЛ. И чем он страшнее, тем меньше шансов визита по нему интересующихся.


Правда, местный автор с этим не очень согласен. Наоборот, чем ужаснее URL, тем с большей вероятностью у ссылающегося возникнет желание написать что-то осмысленное якорем ссылки, и эти слова скажут о прилинкованном документе на порядок больше, чем самый продуманный URL.


В целом же по данному разделу можно сформулировать список табу:


  • Выгоните из урлов необязательные параметры и идентификаторы сессий.

    Попутешествовав по поиску Гугла достаточно долго, Вы увидите в адресной строке браузера массу накопившихся там параметров- с какой страницы Вы перешли на данную, какие у Вас браузер и дефолтовый язык, и тьму прочей ахинеи.

    Так вот на Вашем сайте ничего такого быть не должно.

  • Будет лучше, если имя документа (в урле) как-то характеризует этот документ.
    Гугл табуировал вещи типа page1.html и тому подобную глупость.
    Вместе с тем он табуировал и излишнюю тошнотность ключевиков.
    Вот таких: key1-key2-key3-superkey.htm
    Грозится наказать.

  • Гугл однозначно высказался против глубокой вложенности директорий в урлах документов, а также насыщенность их ключевиками. Знаете, есть такие любители строить ЧПУ, из недр которых выползают URL вида …/key1/key2/key3/superkey.htm

    Вместе с тем запрещается давать директориям имена, никак не связанные с содержащимся в них контентом.

    Как одно совместить с другим, я не знаю.
    Видимо, не фигачить десять директорий вглубь.

  • Да, ещё настоятельно не рекомендуется забивать урлы капслоком.
    То, что карается банном на форумах, не вызывает радости и здесь.

  • И совершенно недозволительна ситуация, когда документы домена или субдомена доступны в составе сайта, в папке которого физически это всё и лежит на сервере.

    Ибо возникает такое вопиющее дублирование контента, что оба сайта выпадут с серпа на счёт раз.

    К примеру, если у Мастера Ласто сайт "Наны" лежит внутри "Сайта Провинциального Самурая", то обратиться к первому можно было бы так:

    lasto.com/nanocms.name/

    Если движки правильные, то должно произойти что угодно, приключиться любой редирект, или быть послан хедер любой ошибки, но только не случиться открытие морды Наны.

    Если же у Вас получается открыть документ одного домена в урле другого, то Вы нарушаете одно из табу Гугла. Какой-нибудь засранец обязательно сделает страничку на «Народе» с несколькими ссылками, после чего и приключится необратимая шйтан-байда.

Вы уже поняли, как велико влияние ЧПУ на индекс всеобщего счастья. Не творите с ЧПУ что попало, поначитавшись всякой дряни, но только не мануала Гугла. Не доверяйте управлять политикой ЧПУ своего сайта школоте. Блюдите табу Гугла. И да пребудет с нами ништяк.


Карта сайта:


Местный автор с большим пессимизмом смотрит на необходимость построения .xml карты сайта, целесообразной только тогда, когда отдельные фрагменты сайта вообще никак между собой не связаны, и не могут быть обнаружены при переходе по ссылкам.


Если Ваши руки и попу не совместили территориально ещё в далёком детстве, то как же может получиться такой сайт?


Другой случай уместности .xml карты сайта ограничен вариантом действительно большого ресурса, с сотнями тысяч страниц. Как только Вы решите проблему перехода бота с одной карты сайта на другую (ибо одной тут не обойтись), так сразу создадутся условия для скорейшей индексации всех документов этого монстра. Хотя сама по себе карта ничего не гарантирует.


Во всех остальных случаях (непрерывная навигация между всеми документами сайта, число страниц, не исчисляемых сотнями тысяч) ничего эта карта не даст. Будет у поисковой системы желание проиндексировать данный сайт- проиндексирует. А заставить насильно Вы её не сможете.


Именно поэтому Гугл своим мануалом постулирует, что карта сайта, оказывается, в первую очередь должна служить интересу посетителя, и быть представлена в html формате, примерно как-то так: все документы хрена.ру А версия для бота, в традиционном .xml формате, опциональна. И служит лишь для оповещения бота о появлении новых страниц (для индексации ему вполне достаточно как карты сайта для посетителя, так и обычной структуры сайта, с её взаимными ссылками документов друг на друга).


Ну и поскольку вебмастера по-прежнему думают про карту сайта всякую глупость, и шибко надеются на её магию, Гугл в своём текущем мануале маленько упорядочивает их мысли про структуру сайта в целом, в виде очередной порции табу:


  • Не нужно стараться все документы сайта связать с другими сквозными ссылками. Структурируйте разделы по смыслу.

    Так, если на Вашем сайте есть директория с шопом, а рядышком директория с блогом, то самой дурной идеей будет дать им общее оформление, и намертво прилинковать посредством сайдбара документы шопа к документам блога.

    Гораздо правильнее будет сослаться на шоп и на блог с морды сайта, ну и может быть, через дизайн магазина и блога на морды друг друга.

    А вот творить две боковых панели, через левую из которых с любого места сайта доступны все лоты шопа, а через правую- посты блога, Гугл считает плохой идеей.

    Он вообще на такую излишнюю перелинковку плохо смотрит.

  • Другая крайность, когда переход от одной смысловой части к другой занимает слишком уж много шагов, объявлена ещё большей глупостью.

    Это неудобно посетителю, а потому огребётся порицанием.

  • Любителям флаша, DHTML, джавы и прочего Аякса предлагается вспомнить: сначала Бог создал текстовую ссылку. И увидел, что это хорошо. И сказал: да будет так…

В целом Гугл не обязывает вебмастера непременно сотворять .xml карту сайта. Если вебмастер внимательно читал табуированные положения по структуре сайта, правильно их понял, и не нагородил такое переплетение связей, что бот пошёл на сайт, да и заблудился там, то и страдать не о чем.


В любом другом случае извращенцу положено предъявить боту карту сайта.


Определитесь со своей ориентацией.


Требования к контенту:


Очень странно, что речь вообще об этом зашла. Ибо прочесть-то мы прочтём, да только кто же когда будет соблюдать?


Но, тем не менее, очередная порция ай-яй-яй:


  • Не надо писать про всякую хрень и безграмотно.

  • Не пишите текст на картинках, которые затем размещаются на сайте.
    Пишите на сайте текст сразу текстом.

    Я тоже никогда не понимал людей, присылающих сто слов письма в Ворде по емайлу. Тем паче, что у меня и Ворда-то нет- я это как читать буду?

    Может, проще действительно писать письмо всё-таки сразу как письмо?

  • Форматируйте текст.
    Нет деления на заголовки и абзацы- люди не станут это читать.
    Бот вскорости тоже перестанет.

  • Копипаст и дублирование контента (пусть даже частичное и неявное) не то чтобы как-то карается, но вполне внятно табуируется.

  • Весь спектр методов насыщения текста ключевыми словами, с любыми изобретениями по приданию безобразию оттенка уместности этого безобразия («нашу страницу находят по запросам…», «Вам будет любопытно знать, какие опечатки люди допускают, когда ищут это…») повлечёт наказание.

  • Прочие методы поискового спама, сто лет как известные, в очередной раз объявлены по-прежнему не забытыми, и всё так же наказуемыми. К чему добавлено известие о чтении Гуглом .css файла и анализа его на предмет того, что у Вас на странице какого цвета и какого размера.

    Так что не задавайтесь проблематикой поиска самого умного- Гугл в анализе любимого цвета и любимого размера весьма искушён.

Ну и поскольку оформлять контент как-то нужно, в этом месте мануала есть абсолютно ожидаемые пожелания по применению тегов заголовков, которых по штату положено шесть размеров.


  • Они применяются в порядке очередности, начиная с первого, сообразно структуре документа. Правда, местный автор очень сомневается, что за рамками очень специфических документов, носящих, как правило, силу инструкции, мы действительно способны воспользоваться всей магией иерархии заголовков.

  • А поскольку это далеко не так, то у юзера может возникнуть мысль употребления заголовков там, где ему требуется разный размер букв.

    Так вот Гугл особо предупреждает: это структурирующий элемент, и он применяется только в определённых случаях и по определённым правилам. Все пионэры, этого не понимающие, будут слиты с серпа.

  • То же касается случаев, когда достаточно сил тегов B, EM, STRONG, но чего-то ради использованы заголовки.

  • Переизбыток заголовков в документе, либо включение в них непомерно и несуразно больших фрагментов текста, опять-таки не приведёт ни к чему хорошему.

Наши любимые упражнения со ссылками:


О, как мы любим спорить друг с другом об уместности нофаллова и особенностях формирования ссылочной массы…


Однако далее только факты, как это понимает Гугл:


  • Если Вы не сами размещаете на своём сайте ссылку, и не можете поручиться за её качество, повелите движку в этом месте добавить к ссылке атрибут rel="nofollow".

  • Если весь раздел сайта автонаполняется пользовательским контентом, либо закрывайте все ссылки пользователей атрибутом нофаллова, либо вообще на данной странице примените метатег аналогичного назначения, действующий на всю страницу целиком:

    <meta name="robots" content="nofollow">

  • Помните, что и в любом другом случае, кроме оговоренных, как только возникает опасность сослаться на некачественный сайт, пользуйте волшебный атрибут нопасарана. Потому что ссылка на некачественный сайт может повредить Вашему. И сильно.

    Как говорит местный автор, нефиг ссылаться на всяких придурков.
    Ибо чревато.

Гугл однозначно даёт понять, что атрибут нопасарана служит для указания поисковому боту, куда не надо передавать вес, и какие сайты не стоит рассматривать как полноценные.


Никаких слов про то, что бот не видит эту ссылку, не учитывает её, или не ходит по ней, в документации нет.


Воспринимайте атрибут нофаллова в качестве маркера «там, за ссылкой, фигня какая-то». И используйте его именно в этом качестве.


При этом Мастер Ласто уверен, что существует некая критическая масса сайтов, по достижении которой некоторого значения (или, как вариант, совокупного ПиАра её ссылающихся страниц) тот сайт, на который вся эта масса ссылается ссылками в нофаллове, запросто может рухнуть в поиске.


Этакий траст наоборот.


Не любите такую мысль? Ваше право.


О пейджранке:


Практически о нём ничего не говорится, что заставляет предполагать очень слабую нуждаемость механизма поиска в подобном параметре.


Об отмене пейджранка речи нет, и, возможно, какие-то формальные размеры пиписек по-прежнему будут периодически рассчитываться, однако это вещь манипулятивная и оттого никому не интересная. В первую очередь самому Гуглу.


Используется практически только для того, чтобы предупредить вебмастера о его занятии какой-то хренью. Обычно в такой момент ПейджРанк его сайта ведёт себя так же, как флаг поверженного сёгуна- падает на землю. Иногда бесповоротно, а иногда (если вебмастер всё-таки одумался за приемлемо короткий срок) восстанавливает свои значения после похорон хрени за забором.


В подавляющем большинстве случаев к занятию хренью приравнивается торговля ссылками.


В общем и целом, концепцию пейджранка давно пора заменить концепцией траста. Только никакой цифровой пиписькомерки трастовости у нас, к сожалению, нет.


Заключение.


Несмотря на объёмность документа «Google Search Engine Optimization Starter Guide 2010» и многие буквы, никаких особых откровений он не содержит. Книжка, прочитанная папой ребёнку пятилетнего возраста про «что такое хорошо и что такое плохо», несёт примерно ту же воспитательную и познавательную ценность.


Но.


Если рядовому вебмастеру Раши, так и мечтающему что-то где-то накрутить хрен знает зачем и для чего, читать всё это гидство абсолютно бесполезно, ибо так и будет хренью заниматься разнообразной до самой пенсии, то вдумчивый вебмастер теперь сможет заниматься той же самой хренью правильно.


Точно зная, за что именно и каким образом он будет наказан.


Знать, где притаилась задница- это уже пол-дела.

Хомячковый рай. Уйти и потеряться:

Комментариев: 10

Инновации в массовом сайтостроении.


Рыбалка скучна...
Что развлечёт самурая?
Динамитная шашка!


Инновации в массовом сайтостроении

Периодически, примерно эдак пару раз в год, по весне и по осени, у манимейкерствующих юзеров вошло в привычку садиться попой на табуретку, и добросовестнейшим образом медитировать про то, что же их кормит. Чтобы прекратить заниматься разной (пусть и очень интересной) фигнёй, и сконцентрировать все усилия на деньгоприносящих сущностях.


Никто не против?


Кто виноват?


Вообще, грядущая осень обещает быть на редкость весёлой. Всё-таки кризисные явления, они довлеют. Сдуваются пузыри, отмирает всё не шибко нужное. А с ним и шибко нужное за компашку- например, давеча грохнулся е-пасспорт, и вскорости загнётся ещё куча разных сущностей. Казалось бы, железобетонных и в принципе не убиваемых даже выстрелом в упор из самой могучей рогатки.


Но это вполне закономерно. Стоит осознать, что время халявных денег практически исчерпано, и привычные килобаксы будут даваться всё более тяжким трудом. Тут одно из двух- или пахать больше, или забодяжить научно-техническую революцию, без которой нас ждёт деградация и коллапс (кто живёт в Раше, это уже может начать наблюдать во всей красе).


Но вернёмся к вебмастерингу.


Чего ждать?


Если абстрагироваться от сиюминутных и лукавых ништяков, а также «тем», которые долго не проживут, то не очень-то и перспективной ниша вебмастеринга покажется. Тот самый кризис, про который автор ругался выше, откинул вебмастеров практически к самым истокам. К работе с трафиком и его монетизации посредством тематических сайтов, либо торговле рекламными местами на более-менее трастовых ресурсах.


И всё, ничего более практически и нету по факту.


Как только вебмастер это наконец осознает, он поимеет перед собой нехилую дилемму.


С одной стороны, ситуация момента требует от него создания хороших, интересных, качественных сайтов, из числа тех, что живут долго. Что довольно трудозатратно, и окупается очень нескоро. Если окупается вообще. Тут засада.


С другой стороны, нет никакой гарантии, что это чудо чудное вообще будет проиндексировано, и сможет претендовать хотя бы на рекламные деньги от монетизации через прозаическую линкоторговлю, не говоря уж о большем. Вы сами знаете, кто такой Яндекс, и какие корки он периодически отмачивает. Не мне Вам об этом рассказывать. Тут засада тоже.


Что делать?


Поэтому вебмастер вынужден встать нараскоряку- из соображений конкурентоспособности производство готового сайта нормального качества должно у него занимать не более часа (так вот и делают говносайты), но вместе с тем исходный контент при этом обязан по возможности отвечать самым высоким критериям. Где этот контент берётся и как добывается- то обычно ноу-хау, и джедаев не волнует.


Если «технология раскоряки» вебмастеру таки доступна, и он способен:


  1. Взять в руки однажды добытый уникальный контент.
  2. Немного его уникализировать по машинным алгоритмам.
  3. Минимально трудоёмким способом расставить теги, если надо.
  4. Насытить текст картинками для пущей красоты.
  5. А также ссылками, если требуется.
  6. Заюзать технологию отсроченного постинга.
  7. Экспортировать в формат, понятный основным популярным движкам.

то производство добротного сайта никакой проблемы не создаст, а происки Яндекса станут и вовсе не страшны. Потому что поиграться структурой ресурса, а то и вовсе выпустить его ремейк, никакого труда не составит.


Как делать?


Прекрасно понимая цели, которые придётся решать в ближайшие годы каждый божий эври дэй, Мастер Ласто надумал для расширения кругозора попользовать одну такую тулзу, сильно помогающую в рутинных процедурах, перечисленных в виде листинга выше, а также в корректной синонимизации исходных текстов, если оная требуется (и что для местного автора представляет особый интерес). О собственно тулзе чуть позднее, сперва о впечатлениях.


К сожалению, Мастер Ласто не оказался на острие технического прогресса, ибо он понятия не имеет, кто такой ВордПресс, и как выглядят данные в его XML формате, потребные для импорта в тулзу. Показалось, что деньги потрачены зря, но потом пришла мысль поюзать импорт контента в виде каталога txt-файлов – такое тоже можно.


Это довольно просто, и конвертор постов из ЛастоБлога (ага, в основном всё строится на нём) написался в пять минут. Вы можете его забрать тут (настоятельно рекомендуется) – в один клик на хосте рождается zip-архив, в который кладутся директории с именами категорий, а в них посты в виде простых txt-файлов, именами которых являются заголовки этих самых постов. Ещё одним кликом Вы скачиваете этот архив со своего сайта на локальный компьютер, и получаете исходные данные в нужном формате.


Всё это скармливается тулзе, и начинается работа.


Впечатления:


Мне показалось, что сама тулза довольно шустрая. По крайней мере, я примерно представляю себе объём вычислений по синонимизации немаленьких текстов по немаленькой же базе, с учётом стоп-слов, и прочими ритуальными действиями. Но тут ожидаемых тормозов не возникло, что уже гуд (ноут стандартный, 4 ядра, 4 гига оперативки, 3гига процессора), и даже завелось под 64-разрядной Виндой-семёркой (у которой с самописными тулзами и ботами обычно бывают проблемы- с этой стороны всё, считайте, уже протестировано).


О синонимизации:


Профессиональный интерес у всякого словоплёта, конечно же, в первую очередь вызывает ход синонимизации. Стилистика местного автора не очень для этого подходит из-за некоторой лексической вычурности, но всё же, ритуальная тестовая фраза до и после:


Исходный текст:


«Столкнувшись с необходимостью наполнения сайта уникальными текстами, вебмастер обычно сильно пугается своих школьных опытов по написанию изложений (это рерайт в чистом виде), и начинает гуглить разные скрипты по синонимизации текстов, которые бы согласились работать у него на компе, прямо на локальной машине (это максимально удобно).


Да, имеются всякие варианты. Результат работы различных скриптов также может быть различным- всё зависит от того, насколько глубоко автор скрипта проработал алгоритмы, и пользовался ли своим детищем длительное время для генерации большого количества сайтов лично. Потому как для себя всё делается на совесть.»


Синонимизированный:


«Столкнувшись с потребностью наполнения веб-сайта уникальными словами, вебмастер обычно крепко пугается собственных школьных опытов по написанию изложений (это рерайт в чистом облике), и начинает гуглить различные скрипты по синонимизации слов, коие бы согласились действовать у него на компе, по прямой на локальной автомашине (это максимально комфортно).


Да, наличествуют всякие варианты. Итог работы разных скриптов также имеет возможность быть различным- всё находится в зависимости от такого, как глубоко автор скрипта работал алгоритмы, и использовал ли собственным детищем длительное пора для генерации большого числа сайтов самим. Что как для себя всё делается добросовестно


Вполне читабельно, почти не коряво. Результирующий текст каждый раз получается немного другим, замена синонимов не однозначная, есть элемент случайности. Перегенерировав сайт, получите чуток другой контент.


О тегах:


Тулза содержит автогенератор меток на основе анализа лемм, однако результат его работы не особо вдохновил.


Очевидно, тут лучше пользовать руки, толковее получится.


Работа с текстом:


А вот тут все здраво – можно вырезать все теги, но оставить только некоторые, причём у оставленных тегов сохранить отдельные атрибуты, а все остальные похерить. То же проделать с заголовками, усекая их до нужного размера, и приляпав на конце при усечении то, что Вы укажите.


Можно повелеть формировать вступительный текст при сотворении блогообразного сайта, указав объём этого текста, а также то, лишать его HTML форматирования, или нет. Тут есть недоработка- вступительный текст может оборваться на полуфразе, а не так, как привыкли пользователи ЛастоБлога- только по факту окончания предложения.


Всё-таки вроде как сделанный руками сайт подразумевает, что каждый элемент публикации не с Луны свалился, а тщательно проработан.


Также имейте ввиду, что при импорте контента из текстовых файлов, когда в них нет никаких метатегов, а один лишь голимый текст, как в моём случае, при несущественном объёме этого самого текста автоопределение кодировки не срабатывает, и она считается равной UTF-8. И если на самом деле это не так (а у меня не так), то от данной конкретной публикации остаются рожки да ножки. Поэтому контролируйте, что там наимпортировалось.


Автонарезка (разбивка на несколько статей).


Так понимаю, для истинных любителей копипаста мегабайтами :)


Довольно универсальные настройки- можно разрезать одну статью на несколько по кусочкам, ориентируясь на их результирующий объём в знаках, можно задать какое-то регулярное выражение (для отъявленных гурманов) для разбивки. Опять-таки есть опции формирования заголовков для каждого из кусочков, чтобы они смотрелись органично.


Отсроченный постинг:


Он обязательно есть, и состоит в указании даты выхода публикации. Дата может проставляться рандомно в указанных пределах.


Подразумевается, что искалки любят постепенно растущие сайты, и будут писать кипятком, когда наткнутся на такой.


Нет проблем- если движок поддерживает такие штуки, они будут.


Экспорт.


Тут поддерживается довольно много движков и блог-платформ, ни один из которых я не пользую, и не имею ни малейшего желания начинать становиться поклонником Джумлы или ВордПресса какого-нибудь. Вариант со статичным сайтом также не особо прикалывает, а вот CMS на текстовых файлах явно в тему. Самая простая зовётся Зебрум Лайт – ну и нехай будет она.


Никаких проблем с втыканием этого самого Зебрума в хост, а потом и заливкой файла контента в Зебрума не возникло. Вообще установка тулзы на комп, понимание, что в ней и как, написание конвертора контента из ЛастоБлога или ЛастоСплога в формат, понятный тулзе, генерирование ею сайта в формате Зебрума, поднятие этого сайта на Зебруме- на всё про всё ушло около часа.


Получилось что-то вот такое: хрена.ру (Упс. Читайте P.S)


А учитывая, что проект сохраняется на диск во внутреннем формате тулзы, сайт может быть перегенерирован в любой формат в любое время, сразу же, как только это понадобится.


Хотелки.


Если бы Мастер Ласто баловался дорами, или уж как-то особенно сильно прикалывался по Хитрым Конторам, то, вообще-то говоря, не представляет вообще никакой сложности научить Нану, оффсайт которой живёт в NanoCMS.name, и сконструированную рациональнее, а потому и более скорострельную, понимать формат файла данных того же Зебрума или XML формат ВордПресса (сейчас в РНР есть очень мощные функции парсинга XML документов, и это просто).


А уж для Наны-то есть куча разных штучек, позволяющих видеть трафик сайта, коллекционировать реальные поисковые запросы, может быть, как-то завязывать на них трафик, постепенно умножая его в разы, цеплять комменты через модуль Общительной Наны, организовать поиск по всему контенту (раз уж он сидит в виде одного текстового файла), творить прочие выкрутасы…


Однако что-то в душе намекает, что такое доростроительство осталось далеко в прошлом, и эти хотелки вряд ли будут реализованы. Что имейте ввиду при написании комментов в стиле «А вот хочется, чтобы…»


Ваша польза.


Однако определённый потенциал у тулзы есть, и надо с неё извлекать весь возможный профит.


Автор сильно намудрил с названием, нареча тулзу «CM-II TreeEdit». Не очень понятно, но пусть будет так. Весёлое кино про неё уже сняли, можете кликнуть и посмотреть- Ваш браузер или RSS ридер  при поддержке соответствующих кодеков и плагинов покажет фильму прямо отсюда:



К сожалению, на момент моего ознакомления с тулзой такой фильмы не было, и некоторые вещи озадачивали своей непонятностью неискушённого в таких изысках самурая :( Но Вам будет проще.


Как водится, при появлении в природе хорошей и нужной штуки знатоки и ценители находят друг друга, вступают в неформальные отношения, и пытаются взаимовыгодно сотрудничать. Этакие желания непременно возникли и в данном случае, в результате чего родились сразу две полезные кнопки.


Смысл этих кнопок - в экономии средств. Тулза у производителя оценена в 85 баксов, что, хотя и полностью адекватно функционалу (который непременно будет развиваться, совершенствоваться и апгрейдиться), но тем не менее уже начинает порождать мысли о путях уменьшения прайса.


Мастер Ласто может Вам предложить тулзу за сумму, близкую к $70 (по действующему на момент написания статьи курсу это равно 2100 рублей – Шоп патриотично оперирует только рублями в качестве основной валюты, долларовые цены могут колебаться в зависимости от сиюминутного курса уя, и не обязаны в точности равняться указанной выше цифре. Ну а при значительном изменении Центробанком курса уя и рублёвая цена будет откорректирована). Для чего есть первая кнопочка:



Также не обойдены вниманием почитатели тулзы по изготовлению сайта за 600 секунд примерно того же назначения, которые вместо $35 в качестве платы за переход с одной софтинки на другую могут это сделать баксов за 25 (в рублях это будет 700, соображения в скобках те же, что и выше). По поводу чего имеет место быть вторая кнопка:



Там и там шопом Мастера Ласто Вам выдаётся инвайт, которых, кстати говоря, ограниченное количество (сотня в первом случае и в точности равное числу состоявшихся клиентов во втором), так что через некоторое время предложения этого поста утратят силу. Если Вы читаете этот материал сильно позже, то за кнопками ничего обещанного уже не будет. По инвайту Вы получаете тулзу последней версии прямо на сайте производителя. Что и как, постигайте в документе, доступном по соответствующей кнопочке.


Что хочется слышать.


В комментариях обычно много пишется в стиле «вай, как хорошо- жить стало лучше, жить стало веселее» или «да вы тут все ®удаки».


У автора уже есть сложившееся мнение по тулзе, и ценность подобных комментариев для него невысока.


Поэтому сконцентрируйтесь на предложениях автору тулзы (чего не хватает, может быть, им упущен какой-то популярный движок для экспорта, например), на рассказе про возможные аналоги, и прочие интересные общественности высказывания с места.


Будем взаимно полезны.



P.S. от 11 сентября 2010


К сожалению, структура сайта на Зебруме в его стандартной компоновке включает много дублированного контента. Искалки воспринимают этот движок строго как сателлитный, и с индексацией у него есть некоторые проблемы, сводящие на нет безусловное удобство самого движка.


По этой причине, а также в силу привязанности Мастера Ласто к своим любимым модулям под Нану, без которых жить как-то некомфортно, по линку в заметке доступен демосайт не на Зебруме, а на этой самой Нане, оснащённой конвертором XML ВордПресса прямо в файловую структуру Наны.


Просьба не запрашивать у местного автора "необычную сборку Зебрума" - изначальный текст статьи чуток не соответствует истине, и никакой такой хитрой сборки Зебрума у местного автора нет.


Хомячковый рай. Уйти и потеряться:

Комментариев: 13

О вкусе устриц из Сирахамы.


Не знаю, что сказать.
К чему слова, когда
На небе звёзды?


О вкусе устриц из Сирахамы

Довольно странно видеть тут эпиграфом пелевенскую хайку из «Чапаевской Пустоты». Но так тому и быть, спляшем сегодня от неё.


Жителю мегаполиса весьма непросто оказаться в ситуации, подразумеваемой хайкой. Когда на десять вёрст вокруг нет больше ни единого сапиенса (с их неизменной водкой и орущими благим матом магнитофонами про что-то предельно дебильное), а с заходом светила пропадают и последние видимые признаки цивилизации.


И наступает волшебное время. Время чудес.


Но только пусть посреди бескрайних просторов, подернутых ласковым уютным туманом, под раскидистой клюквой перезрелых звёзд, гроздья которых можно чуть ли не собирать руками, всего лишь встав на носочки, будет рядом и ещё кто-то.


Достаточно умная вумен, чтобы не щебетать о всяких пустяках в тот момент, когда самурай созерцает мир в её карих глазах. Яркие всполохи первобытного пламени, отражение вечных таинственных звёзд,  мерцание наивных светлячков, запутавшихся в длинных волосах.


Много лет спустя придёт осознание, что это и были мгновения счастья, которых не Бог уж весть сколько ещё впереди.


И теперь мы понимаем, что Пелевин прав: именно в такие мгновения и не нужны никакие слова.


Достаточно взгляда любимого человека.


Но жизнь наполнена не только такими мгновениями. Но и иным содержанием.


В этом мире нас мало кто любит. И ещё меньше кто понимает.


Каждый свой шаг эври дэй мы обосновываем, оправдываем, согласуем, аргументируем и координируем с кучей народа. Ибо иерархия, общество, кланы, производственные отношения, ритуалы, обычаи, и поверх всего этого незыблемый, неотвратимый и безжалостный третий закон Чизхолма. Который может похерить всё и сразу.


Поровну на этот закон может быть лишь человеку, уже достигшему сатори. Но у таких нету сайта, и мы их просто не знаем. Они не с нами.


А всем остальным прочим, пока своего сатори не достигшим, в тщетных попытках донести свой размытый и редко когда сформулированный мессидж до аудитории, интересы и вожделения которой вообще мало кто себе представляет, приходится делать массу итераций, чтобы вообще стать хотя бы понятыми.


Именно на этой почве мы видим тягу народа к блогам. Там есть комменты. И как-то можно договориться о вкусе устриц с теми, кто их ел…


Чтоб переговоры об органолептических свойствах устриц сводились к общему знаменателю и в других случаях тоже, давайте для заинтересованных в том лиц, имеющих ассоциацию на женское имя «Нана» хотя бы второго порядка, нарисуем традиционную кнопочку для удовлетворения их любопытства:



Хомячковый рай. Уйти и потеряться:

Комментариев: 27

страницы: 06 07 08 09 10 11 12 13 14 15 16
десятки: 10 20 30 40 50 60
  • февраль, 2012
  • пн вт ср чт пт сб вс
    1 2 3 4 5
    6 7 8 9 10 11 12
    13 14 15 16 17 18 19
    20 21 22 23 24 25 26
    27 28 29