Ритуальные песнопения чукчи о порнухе и Ваша Выгода с того.


Сколь самураю катаной махать ?
Ниндзя - он тоже воитель.
Наделаем тысячу ниндзей.


Сегодня у нас на повестке дня очень прикольная и познавательная тема. Кто-то на этой теме конкретно заторчит, сиё торжественно обещаю. Ибо сам уже...


Но сперва, как повелось, один печатный листик изящной словесности, предвосхищающий рождение полезной мысли. Сразу апосля этого обещаю коварно надругаться над Вашим мозгом. Прямо в соответствии со стилем эпиграфа.


Итак.


Если Вы засунете в дырку запроса Гугла что-нибудь про SEO блоги, то Гугл, не долго думая, выдаст тьму ссылок на всяких дядек, увлечённо продающих друг дружке разнообразный софт по как минимум двести уёв, заточенный под автоматическое исполнение различных телодвижений, обычно выполняемых силами вебмастера в стиле «взял и сделал, ибо больше некому, а надо».


Оно и понятно- все хотят заниматься творчеством, рутина никого не вставляет. А чтобы заработать в Сети свои несколько тысяч уёв за традиционно- календарный месяц, рутинных движений надо выполнить ой как много. Да, можно на этой почве стать папой карлой, но это стезя не нашего человека :) Наш человек жизнь свою положит, но работать не будет. Ни в поте лица своего, ни как-либо ещё- тут утритесь.


Но не будем отвлекаться.


Рецепт богатства прост и незамысловат, не надо его выискивать в творчестве всяких гуру. Всё тривиально: если один рядовой сайт при понимании вебмастером, чего ему от сайта надо, стандартно приносит сотку уёв, то элементарно плодя сайты без меры, мы умножаем свой доход. И проблема может быть всего лишь одна- наполнение сайтов тематическим контентом, а также простановка их в категорию «сделано для людей». При этом предполагается, что технологиями монетизации сайта и конверсии трафика вебмастер владеет.


Тут всякому приходит в ум мысля о саморастущих сайтах. Давайте покажем на пальцах, что в реальности с ними не всё так просто.


Самое элементарное решение- натаскать RSS лент, надёргать прямо с них фрагментов текстов про что-то, и залудить текстопомойку. Отвергаем такую мысль сразу и решительно, ибо это тупиковое направление- организовать подобную текстопомойку ничего не стоит, это доступно буквально всякому, текстопомоечных сайтов дофига и больше, и перспектив у них никаких. А посему и нехрен такой ерундой страдать, сразу плюньте на то, что неминуемо умрёт само собой или по принуждению.


Более разумным поступком станет учреждение тематического сайта, с подсосом контента с ресурсов, не имеющих RSS лент, а потому не растащенных по текстопомойкам. Тут возникает проблема парсинга сайта, написания к нему сигнатур, корректировки их при смене дизайна донорского ресурса, и так далее. Стахановский Портатор. Работает, но трудоёмко.


Славной идеей была бы комбинация двух этих методов, с выводом технологии на качественно новый уровень. Когда мы, путешествуя по вебу, натыкаемся на толковый ресурс, сильно ему радуемся, а потом берём адрес его RSS ленты, и сообщаем нашему хитрому сайту. Хитрому сайту не нужно от этой ленты ничего, кроме списка УРЛов новостей. Он сам посещает эти УРЛы, самостоятельно определяет, где там на странице полезный контент, извлекает этот контент, творчески над ним работает, и в вольном пересказе публикует у себя. Со ссылкой на источник или без, тут уж как захочется.


И чтоб процесс проистекал без всяких сигнатур – понятно, что сигнатура позволит взять контент с точностью до байта, не трогая лишнее, а Искусственный Интеллект на 50 строк РНР кода всяко будет те ещё корки отмачивать. Но мы на это соглашаемся, так как больше нам ничего не остаётся.


Что у нас получилось? Концепция хитрой технологии по имени сплог вышла, вот что. Фактически тот же самый блог, которому админ задал перечень сайтов для изучения, и по поводу которых эта серверная софтина совершенно самостоятельно пишет изложение. Как в школе.


Дабы не было абстрактно, просто представьте себе правильного чукчу, который что видит, то и поёт. Посадите его перед экраном с порнухой, и пусть заводит свои песнопения. Послушать это соберётся тьма народу, да ещё и получит несказанное удовольствие, однако. Очень хорошая и наглядная модель- сплог занимается в точности тем же, чем и чукча :) Только смотрит не на порнуху- тут чукче здорово повезло :)


Сразу возникает вопрос- столь ли уж это сложно в реализации?


Забегая вперёд, скажу сразу, что написание работающей версии (которую потом можно всяко-разно подкручивать, наращивая мозги 50-строчному Искусственному Интеллекту) у меня ушёл световой день. От заката до рассвета наоборот. Что говорит о принципиальной решаемости задачи разными способами, особенно когда есть прототип (я для чистоты эксперимента его не брал, чтобы строить все алгоритмы по наитию, как бог на душу положит, а не зашориваться чужими решениями).


Существуют ли другие готовые сплоговые решения? Да тьма. Но, как правило, они все сдёрнуты с Запада, где очень любят громоздить одну затейливость на другую. Например, объединяя ленты «Яховыми трубками», и публикуя результат вообще через Гмайловый аккаунт на каком-нибудь его же блог- сервисе, юзая тем самым инструменты для домохозяек. Попутно приделывая ко всему к этому и собственный сервер с Кроном для пингования сплога. Ужас.


Понятно, что такая технологическая казуистика есть не что иное, как вариации на тему рашевого «народа», и не заслуживает серьёзного к себе отношения. Хотя бы просто потому, что у некоторых блог-сервисов есть ощутимые проблемы с индексацией их Яндексом, к примеру говоря (ежели хочется сотворить русскоязычного сплога и поставить под Хитрую Контору).


Позвольте мне изложить, как мог бы выглядеть реальный сплог- проект при взгляде с моей колокольни.


Давайте возьмём для конкретности вот этот самый, читаемый Вами прямо сейчас блог, и договоримся, что абсолютно без всякой переделки, но дополнив его несколькими файликами, мы научим тем самым блога быть сплогом, не утрачивая всех его изначальных блоговых функций.


Раз уж в данном движке есть много тем (разделов), давайте договоримся, что каждому такому разделу мы можем сопоставить сколько угодно RSS лент (но чтоб всё строго в тему), указать периодичность появления заметок в каждом из разделов независимо от других разделов (с рандомизацией, ясное дело), а также общую интенсивность постинга для всего сплога. Ну и изобразить человеконаполняемость- ночью админ должен спать, а в выходные трудиться менее интенсивно. Или вообще отдыхать- несоблюдение этих простых правил охраны труда палит автонаполняемые ресурсы только так.


Ещё очень не хочется задействовать всяческие кроны- давайте обойдёмся вообще без них.


Если Вы маленько смыслите в РНР, то легко поймёте, что задача не бог весть какая сложная, и укладывается в тысячу строк кода, или даже того меньше. Единственное, что может озадачить- это написание Искусственного Интеллекта для детектирования на произвольной странице произвольного же сайта фрагмента с полезным контентом, и изобретение на его основе уникального теста, который в итоге в сплог и помещается.


Собственно говоря, только эти два момента по-настоящему и интересны.


Про Искусственный Интеллект каждый автор движка сплога молчит рыбой об лёд, даже не заикаясь о принципах его работы. Понятно, что в основе должна лежать математика, строиться адаптивная динамическая модель структуры страницы, смотреться корреляция реального документа с этой моделью, и с какой-то вероятностью предполагаться, что вот отсель досель этот самый контент и расположен- его и берём. Хотя как там на самом деле, хрен его знает.


Также не менее понятно, что математика- это скучно и неинтересно, поэтому далее мы про сплайны и алгоритмы градиентного спуска говорить не станем, а воспримем как данность простую истину: Искусственных Интеллектов можно наизобретать сколько угодно, каждый из них будет притаскивать в клювике некий полезный контент, а уж насколько этот контент будет соответствовать действительным представлениям полезности, это вопрос десятый. Но надо быть готовым, что теста Тьюринга ему не пройти.


Однако построить сплога- невелика заслуга. Теперь нужно убедить искалки в самоценности этого ресурса. А значит, придать уникальность контенту всех его документов.


Делать это опять-таки можно по-разному. Например, перевести на другой язык и обратно. В случае исходного русского в итоге получится удивительная фигня- я это проделал, похохотал и убил переводочный модуль об стену.


Кстати говоря, сайт с однонаправленным переводом можно посетить тут- Сам себе сочинитель – ясно видно, что даже перевод в одну сторону лишает текст всяческого смысла. Если только он не был изначально написан на Раше и переведён машинно на инглиш.


Ещё есть такая штука, как синонимическая рандомизация. Это когда невинная фраза «Ритуальные песнопения чукчи о порнухе и Ваша Выгода с того» превращается во что-то страшное типа «Церемониальные песнопения чукчанка о непотребности и ваш убыток с этого» или «Ритуал песнопения чукотский о скабрезности и по-вашему невыгода с того» - например, какой-нибудь «Ворд» или «Опен Офис» предложит именно такие синонимы к словам.


Видимо, если не шибко увлекаться, и менять не более двух слов в каждом предложении, да ещё как-нибудь рандомно, одновременно переструктурируя текст, то относительно простыми средствами можно придать ему признаки уникальности. Тут можно провести большое научное исследование, и нашарить границу, за которой начинается уникальный текст.


Ну или двинуть в массы идеи товарища Маркова- как видим, вариантов и тут много.


Блин, сдаётся мне, что после этой лекции Вы стали знать о сплогах если не всё, то большую часть от «всего». Теперь бы ещё посмотреть на это безобразие, да?


Никакой уважающий себя вебмастер никому не расскажет про домены своих сплогов, доров, а также прочих не особо белых сайтов. Отчего-то после рассказа про них их жизнь коротка. Поэтому могу предъявить невеликую кучку линков на документики, порождённые сплогом при лицезрении куска вот этого самого поста. Сплог увидел кусок три раза, и породил три текста- веселитесь:



Возможно также, что идея сплога, который можно посещать изредка, чтобы убить десяток заметок, не шибко попавших в тему, из доброй сотни там нарисовавшихся, покажется кому-то здравой, и ему тоже, побачив, захочется иметь такую же вещь. Тогда намечается хадж вот в такую сторону: splog.name


Ну и, как обычно, предоставляем слово апологетам сплог- движения, как, впрочем, и их рьяным оппонентам- у нас демократия, и, чего-то поругав, для компенсации требуется то же самое и похвалить. Чтоб читатель в итоге нифига не понял, и обессиленный, с утомлённым мозгом и грязно выругавшись, ушёл смотреть релаксационную порнуху. На сайты, являющиеся по иронии судьбы нашими же сплогами, ага :) И напичканные по самое нихочу нашей же рекламой, ага ещё раз.





Прыг: 06 07 08 09 10 11 12 13 14 15 16
Скок: 10 20 30 40
сентябрь, 2007
пн вт ср чт пт сб вс
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30