В комменте к предыдущему посту разговор как-то внезапно повернул в неожиданную плоскость, и затронул проблему хостинга. Всякого вебмастера сия проблематика касается вплотную, и в очень интимных местах, так что давайте специально заведём разговор о том, что заведомо не является нетленкой, но оттого превносит ничуть не меньше треволнений в мятежную душу.
Особо волнуются пользователи хостинга Гудзонхост, который до последнего времени являлся наиболее привлекательным как по ценам, так и по качеству услуг. К сожалению, он не справился с наплывом юзеров, и перед владельцем встал вопрос- либо палить большие деньги на дооснащение хардом, либо что-то делать с ценами, дабы юзеры естественным образом численно сократились до количества, адекватного наличествующемуся харду :)
Мы не станем практиковаться в своих измышлениях, и давать советы текущему владельцу Гудзонхоста, как да чего- он в этих советах совершенно не нуждается. Просто примем как данность, что хостинг агонизирует, и в его сегодняшнем состоянии воленс-неволенс, но прекратит свою жизнедеятельность. Ибо не пошел ни по одному из очевидных путей решения своей проблемы. Возможно, имеет быть место что-то ещё, о чём мы не в курсе, а потому эти "очевидные пути" неприемлемы.
Непосредственно от владельца Гудзонхоста Петра Афонина (support[dog]gudzonhost.ru) я получил официальное подтверждение продажи хостинга другому юридическому лицу, причём в самое ближайшее время. Естественно, продаже подлежат не столько железяки, сколько клиентская база- живые люди, приносящие деньги. Только они и интересны, ежели по большому счёту.
Имею также и сведения, кому именно может отойти сервис. В качестве приемника с большой долей вероятности выступает ru-web.net. Наблюдаю у себя также письмо от представителя службы поддержки этого хостера Алексея Гейнера, имеющего заявить, что сразу же после передачи нас с вами им в собственность :) ситуация с даунами будет устранена, ибо с хардом у нового владельца никаких проблем нет.
По достигнутой на данный момент договорённости, никакого пересмотра тарифных планов Гудзонхоста по отношению к состоявшимся клиентам пока не планируется. Просто меняется собственник хостинга и всех его сопутствующих сервисов. Хотя, если посмотреть на тарифы потенциального нового владельца, условия (по крайней мере по трафику и дисковому пространству) для той же ценовой категории похуже будут - мне не хватит. Но, ежели клиентов насильственно двигать по тарифам не будут, сиё несущественно. Если таки будут, другой расклад. Тут я Вам ничего гарантировать не могу.
В целях экспириенса, максимально приближённого к боевому, сайт lasto.com я пока оставил на Гудзоне, предварительно скопировав его на флэшку :) Остальные домены перенёс в другие места, в том числе и на хостинг dipco-host.net, ссылку на который нажимать не торопитесь- в комментах шеф хостинга предлагает особые условия для "Lasto Group" - грех ими не воспользоваться. Да и по ресурсам хостера (а особенно оперативке- тут её 20 мегов на приложение) всё шикарно, субъективно полная благость.
Данная информация призвана ввести Вас в курс дела, а то хоститесь и ничего не знаете :)
Иногда случается так, что наши сайты, верой и правдой служившие нам годами, вдруг по какому-то непонятному стечению обстоятельств пропадают нахрен из серпа той или иной искалки. Причём сайты-то белые, а вовсе не являющиеся страшным ночным кошмаром мифического Платона Щукина, который, несмотря на всю свою виртуальность и мифологичность, в отместку пользует вебмастера в мозг почище великого и ужасного Ктулху, буде он помянут не на ночь глядя.
Как правило, сайт после исчезновения из серпа в 90% случаев туда больше не возвращается. И если ресурс строгался исключительно под «хитрую контору», то его можно смело хоронить. Либо столь же смело потрошить, вынимая из него душу, и перенося в новый домен. Хотя не факт, что тот послушно встанет в серп. В случае Яндекса процентов пять сайтов вообще не встают в серп ни в какую, причём совершенно непонятно, что тому причиной. Видимо, причины нет- яндексоидам хочется, чтобы их боялись и уважали, сказывали о них притчи, сказы и легенды. Типа, не всё так просто.
Случается и иначе- вебмастер сам по невнимательности сотворяет кучку жизненных тщет себе же в карман, но осознаёт это слишком поздно. Расскажу реальный и зело поучительный пример.
Апгрейдя как-то движки сразу на кучке доменов (что является заурядной процедурой и не нуждается в задействовании головного мозга), я поленился подумать хотя бы спинным мозгом, чего такого сдуру натворил. Тупо перелил дистрибутив с флэшки на сервер, оставив там нетронутыми папки с контентом, прописал в сеттинги урлы морд сайтов, ткнулся браузером для проверки, получил на экран то, что полагается, и успокоился.
Однако спустя пару недель, нанося визит вежливости в аккаунт Хитрой Конторы с целью вбития в формочку суммы, желательной к получению, был несказанно удивлён падением доходности ряда сайтов со стандартных трёх уёв в сутки до уя, а то и того меньше.
Инспекция самих сайтов показала, что поисковый трафик с Яндекса сдулся в разы, кое-где до полного нуля. В серпе этой искалки осталось кот наплакал страниц, а по ряду доменов и вовсе только морда, причём объёмом документа в районе четырёхсот байт.
Умудрённый неумолимой клизмой жизни бывалый вебмастер, конечно, по одной только последней фразе безошибочно поставит диагноз, чего же это такое случилось. Да, так оно и есть- свежезалитый движок самостоятельно борется с двуличностью домена, а вот в настройках ему, не подумавши, был сказан неверный домен (который может быть с www или без).
Понятно, что серферу это без разницы, как без разницы и любому поисковику абсолютно- тот самостоятельно проделает склейку доменов. Любой, кроме Яндекса. Яндекс тупо, игнорируя все перманентли редиректы движка, выкидывает ненайденные страницы нахрен.
Самое смешное, что матюгание в свой адрес непереводимыми идиоматическими выражениями шибко высотной застройки, а также спешное внесение в сеттинги правильной версии домена в понимании Яндекса, не возымели никакого отклика. Сайт не индексируется, хоть ты тресни.
Не индексируется неделю, две, месяц. Видимо, отстойник, долгий ящик, песочница, или что-то подобное, что непременно случается, когда сайт падает и не отзывается (а стало быть, незачем на него расходовать ресурсы). Хотя, с другой стороны, бот на сайты ходит, и довольно интенсивно. Не только на морду, но и на внутренние страницы. А только без толку.
Лекарство нашлось совершенно случайно. Будьте внимательны, переходим к сути.
Поскольку текущий хостер в лице гудзонхоста частенько роняет сайты в даун, и нифига не делает для нормализации ситуации, только вежливо извиняясь каждый раз по предъявлении очередной абузы от сайтовладельца, я начал перенос оттуда своих ресурсов на другие хостинги. В том числе и вот эти проблемные домены, с которыми трабла вышла. Потому как они достаточно компактные по объёму (мегов по двадцать), и сам бог велел начать с того, что поменьше.
Да и, с другой стороны, ежели новый, неизведанный пока с интимной стороны хостер, вдруг чего учудит, то этих полупогибших доменов не жалко будет- всё равно в серпе Яндекса их фактически и нет. Внемля совету классиков, в пору тренироваться на кошках :)
Понятно также, что после переноса у сайта как минимум меняется айпишник. Не берусь утверждать, что смена айпишника сайта является необходимым и достаточным действом сакрального толка, но после переноса проблемного сайта на другой домен буквально на вторые же сутки на сайт нападает индексирующий бот Яндекса, выкачивает сайт целиком, делая ровно столько хитов, сколько там имеется страниц, и эти документы дружно встают в серп пачками от нескольких сот до нескольких тысяч страничек в сутки. Фактически за недельку все ранее проблемные домены таковыми быть перестали.
Из соображений здравого смысла данный эффект вполне допустим. Домены покупаются-продаются, перерегистрируются, и главный признак такого шевеления- смена айпишника. Вполне логично ожидать, что именно изменение айпишника сайта что-то в недрах искалки (по крайней мере Яндекса) таки инициирует. Бот получает команду прошерстить сайт и обновить индекс. Чего и хотелось.
Правда, не берусь настаивать на том, что выдавание сайту выделенного айпишника (у хостера должна быть такая услуга, за один уй в месяц) возымеет тот же эффект. Всё-таки айпишник в той же самой сетке и в совсем-совсем другой- это, по идее, чуток разные вещи.
Ну и, как обычно, комменты открыты для Ваших рецептов реинкарнации выпавших из серпа сайтов.
Сегодня у нас на повестке дня очень прикольная и познавательная тема. Кто-то на этой теме конкретно заторчит, сиё торжественно обещаю. Ибо сам уже...
Но сперва, как повелось, один печатный листик изящной словесности, предвосхищающий рождение полезной мысли. Сразу апосля этого обещаю коварно надругаться над Вашим мозгом. Прямо в соответствии со стилем эпиграфа.
Итак.
Если Вы засунете в дырку запроса Гугла что-нибудь про SEO блоги, то Гугл, не долго думая, выдаст тьму ссылок на всяких дядек, увлечённо продающих друг дружке разнообразный софт по как минимум двести уёв, заточенный под автоматическое исполнение различных телодвижений, обычно выполняемых силами вебмастера в стиле «взял и сделал, ибо больше некому, а надо».
Оно и понятно- все хотят заниматься творчеством, рутина никого не вставляет. А чтобы заработать в Сети свои несколько тысяч уёв за традиционно- календарный месяц, рутинных движений надо выполнить ой как много. Да, можно на этой почве стать папой карлой, но это стезя не нашего человека :) Наш человек жизнь свою положит, но работать не будет. Ни в поте лица своего, ни как-либо ещё- тут утритесь.
Но не будем отвлекаться.
Рецепт богатства прост и незамысловат, не надо его выискивать в творчестве всяких гуру. Всё тривиально: если один рядовой сайт при понимании вебмастером, чего ему от сайта надо, стандартно приносит сотку уёв, то элементарно плодя сайты без меры, мы умножаем свой доход. И проблема может быть всего лишь одна- наполнение сайтов тематическим контентом, а также простановка их в категорию «сделано для людей». При этом предполагается, что технологиями монетизации сайта и конверсии трафика вебмастер владеет.
Тут всякому приходит в ум мысля о саморастущих сайтах. Давайте покажем на пальцах, что в реальности с ними не всё так просто.
Самое элементарное решение- натаскать RSS лент, надёргать прямо с них фрагментов текстов про что-то, и залудить текстопомойку. Отвергаем такую мысль сразу и решительно, ибо это тупиковое направление- организовать подобную текстопомойку ничего не стоит, это доступно буквально всякому, текстопомоечных сайтов дофига и больше, и перспектив у них никаких. А посему и нехрен такой ерундой страдать, сразу плюньте на то, что неминуемо умрёт само собой или по принуждению.
Более разумным поступком станет учреждение тематического сайта, с подсосом контента с ресурсов, не имеющих RSS лент, а потому не растащенных по текстопомойкам. Тут возникает проблема парсинга сайта, написания к нему сигнатур, корректировки их при смене дизайна донорского ресурса, и так далее. Стахановский Портатор. Работает, но трудоёмко.
Славной идеей была бы комбинация двух этих методов, с выводом технологии на качественно новый уровень. Когда мы, путешествуя по вебу, натыкаемся на толковый ресурс, сильно ему радуемся, а потом берём адрес его RSS ленты, и сообщаем нашему хитрому сайту. Хитрому сайту не нужно от этой ленты ничего, кроме списка УРЛов новостей. Он сам посещает эти УРЛы, самостоятельно определяет, где там на странице полезный контент, извлекает этот контент, творчески над ним работает, и в вольном пересказе публикует у себя. Со ссылкой на источник или без, тут уж как захочется.
И чтоб процесс проистекал без всяких сигнатур – понятно, что сигнатура позволит взять контент с точностью до байта, не трогая лишнее, а Искусственный Интеллект на 50 строк РНР кода всяко будет те ещё корки отмачивать. Но мы на это соглашаемся, так как больше нам ничего не остаётся.
Что у нас получилось? Концепция хитрой технологии по имени сплог вышла, вот что. Фактически тот же самый блог, которому админ задал перечень сайтов для изучения, и по поводу которых эта серверная софтина совершенно самостоятельно пишет изложение. Как в школе.
Дабы не было абстрактно, просто представьте себе правильного чукчу, который что видит, то и поёт. Посадите его перед экраном с порнухой, и пусть заводит свои песнопения. Послушать это соберётся тьма народу, да ещё и получит несказанное удовольствие, однако. Очень хорошая и наглядная модель- сплог занимается в точности тем же, чем и чукча :) Только смотрит не на порнуху- тут чукче здорово повезло :)
Сразу возникает вопрос- столь ли уж это сложно в реализации?
Забегая вперёд, скажу сразу, что написание работающей версии (которую потом можно всяко-разно подкручивать, наращивая мозги 50-строчному Искусственному Интеллекту) у меня ушёл световой день. От заката до рассвета наоборот. Что говорит о принципиальной решаемости задачи разными способами, особенно когда есть прототип (я для чистоты эксперимента его не брал, чтобы строить все алгоритмы по наитию, как бог на душу положит, а не зашориваться чужими решениями).
Существуют ли другие готовые сплоговые решения? Да тьма. Но, как правило, они все сдёрнуты с Запада, где очень любят громоздить одну затейливость на другую. Например, объединяя ленты «Яховыми трубками», и публикуя результат вообще через Гмайловый аккаунт на каком-нибудь его же блог- сервисе, юзая тем самым инструменты для домохозяек. Попутно приделывая ко всему к этому и собственный сервер с Кроном для пингования сплога. Ужас.
Понятно, что такая технологическая казуистика есть не что иное, как вариации на тему рашевого «народа», и не заслуживает серьёзного к себе отношения. Хотя бы просто потому, что у некоторых блог-сервисов есть ощутимые проблемы с индексацией их Яндексом, к примеру говоря (ежели хочется сотворить русскоязычного сплога и поставить под Хитрую Контору).
Позвольте мне изложить, как мог бы выглядеть реальный сплог- проект при взгляде с моей колокольни.
Давайте возьмём для конкретности вот этот самый, читаемый Вами прямо сейчас блог, и договоримся, что абсолютно без всякой переделки, но дополнив его несколькими файликами, мы научим тем самым блога быть сплогом, не утрачивая всех его изначальных блоговых функций.
Раз уж в данном движке есть много тем (разделов), давайте договоримся, что каждому такому разделу мы можем сопоставить сколько угодно RSS лент (но чтоб всё строго в тему), указать периодичность появления заметок в каждом из разделов независимо от других разделов (с рандомизацией, ясное дело), а также общую интенсивность постинга для всего сплога. Ну и изобразить человеконаполняемость- ночью админ должен спать, а в выходные трудиться менее интенсивно. Или вообще отдыхать- несоблюдение этих простых правил охраны труда палит автонаполняемые ресурсы только так.
Ещё очень не хочется задействовать всяческие кроны- давайте обойдёмся вообще без них.
Если Вы маленько смыслите в РНР, то легко поймёте, что задача не бог весть какая сложная, и укладывается в тысячу строк кода, или даже того меньше. Единственное, что может озадачить- это написание Искусственного Интеллекта для детектирования на произвольной странице произвольного же сайта фрагмента с полезным контентом, и изобретение на его основе уникального теста, который в итоге в сплог и помещается.
Собственно говоря, только эти два момента по-настоящему и интересны.
Про Искусственный Интеллект каждый автор движка сплога молчит рыбой об лёд, даже не заикаясь о принципах его работы. Понятно, что в основе должна лежать математика, строиться адаптивная динамическая модель структуры страницы, смотреться корреляция реального документа с этой моделью, и с какой-то вероятностью предполагаться, что вот отсель досель этот самый контент и расположен- его и берём. Хотя как там на самом деле, хрен его знает.
Также не менее понятно, что математика- это скучно и неинтересно, поэтому далее мы про сплайны и алгоритмы градиентного спуска говорить не станем, а воспримем как данность простую истину: Искусственных Интеллектов можно наизобретать сколько угодно, каждый из них будет притаскивать в клювике некий полезный контент, а уж насколько этот контент будет соответствовать действительным представлениям полезности, это вопрос десятый. Но надо быть готовым, что теста Тьюринга ему не пройти.
Однако построить сплога- невелика заслуга. Теперь нужно убедить искалки в самоценности этого ресурса. А значит, придать уникальность контенту всех его документов.
Делать это опять-таки можно по-разному. Например, перевести на другой язык и обратно. В случае исходного русского в итоге получится удивительная фигня- я это проделал, похохотал и убил переводочный модуль об стену.
Кстати говоря, сайт с однонаправленным переводом можно посетить тут- Сам себе сочинитель – ясно видно, что даже перевод в одну сторону лишает текст всяческого смысла. Если только он не был изначально написан на Раше и переведён машинно на инглиш.
Ещё есть такая штука, как синонимическая рандомизация. Это когда невинная фраза «Ритуальные песнопения чукчи о порнухе и Ваша Выгода с того» превращается во что-то страшное типа «Церемониальные песнопения чукчанка о непотребности и ваш убыток с этого» или «Ритуал песнопения чукотский о скабрезности и по-вашему невыгода с того» - например, какой-нибудь «Ворд» или «Опен Офис» предложит именно такие синонимы к словам.
Видимо, если не шибко увлекаться, и менять не более двух слов в каждом предложении, да ещё как-нибудь рандомно, одновременно переструктурируя текст, то относительно простыми средствами можно придать ему признаки уникальности. Тут можно провести большое научное исследование, и нашарить границу, за которой начинается уникальный текст.
Ну или двинуть в массы идеи товарища Маркова- как видим, вариантов и тут много.
Блин, сдаётся мне, что после этой лекции Вы стали знать о сплогах если не всё, то большую часть от «всего». Теперь бы ещё посмотреть на это безобразие, да?
Никакой уважающий себя вебмастер никому не расскажет про домены своих сплогов, доров, а также прочих не особо белых сайтов. Отчего-то после рассказа про них их жизнь коротка. Поэтому могу предъявить невеликую кучку линков на документики, порождённые сплогом при лицезрении куска вот этого самого поста. Сплог увидел кусок три раза, и породил три текста- веселитесь:
Возможно также, что идея сплога, который можно посещать изредка, чтобы убить десяток заметок, не шибко попавших в тему, из доброй сотни там нарисовавшихся, покажется кому-то здравой, и ему тоже, побачив, захочется иметь такую же вещь. Тогда намечается хадж вот в такую сторону: splog.name
Ну и, как обычно, предоставляем слово апологетам сплог- движения, как, впрочем, и их рьяным оппонентам- у нас демократия, и, чего-то поругав, для компенсации требуется то же самое и похвалить. Чтоб читатель в итоге нифига не понял, и обессиленный, с утомлённым мозгом и грязно выругавшись, ушёл смотреть релаксационную порнуху. На сайты, являющиеся по иронии судьбы нашими же сплогами, ага :) И напичканные по самое нихочу нашей же рекламой, ага ещё раз.
| март, 2010 | ||||||
| пн | вт | ср | чт | пт | сб | вс |
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 | ||||