Вам по этомy мостy до сеpедины, и сpазy напpаво...

Феномен отличной индексируемости блогов общеизвестен. Ни один сайт- статичный ли, движковый, портальный или ещё какой- не идёт в плане индексируемости с блогом ни в какое сравнение. Об этом можно много говорить, копаться в причинах и следствиях, строить догадки на пустом или непустом месте. Но воспримем сей факт как данность, как аксиому, как высочайшую благость, явлённую нам свыше. Гуглом, естественно, не Яндексом каким.


Понятно, что это не может остаться незамеченным. Куча народа перевела свои ресурсы на блоговую основу, узрев такое откровенное лоббирование Гуглом сей относительно новой технологии. И, естественно, кучка народа ничем не прогадала- то, что легко отыщется в формате блога, хрен найдётся в виде обычного сайта. А целевой трафик всегда важнее формы представления материала.


Ясен пень трухлявый, что человеки, кровно заинтересованные в целевом трафике, тут же пустились во все тяжкие, начав навешивать на бедные несчастные странички со сквозной ссылочной структурой невообразимые навороты, мобилизованные на автоматическое наполнение этих псевдоблогов контентом. Дабы всё это индексировалось, приводило серферов (в больших, естественно, количествах), показывало серферам контекстную рекламу от того же Гугла (так вот всё непросто в этом мире), и зарабатывало шуршавчики, колобашки и прочие уетые титульные знаки.


Сия причуда очень популярна за бугром (у нас не очень), но, тем не менее, паразитирует на наших, рашевских, открытиях. Ничего нового- всё наиболее достойное изобретено и открыто именно в Раше. Посему далее вам должно быть интересно. Из патриотических соображений и побуждений. Да и просто из любопытства.


Проблема наполнения контентом решается двояко: утягиванием уникального содержимого с других ресурсов, либо синтезом его на месте.


Первый путь суть плагиат- умные скрипты узнают у онлайновых сервисов наиболее популярные в данный момент запросы, тут же проводят поиск по Гуглу, и дёргают чужой контент, размещая его в формате блога на хосте. Опытный серфер без труда отличит автоматически наполняемый блог от создаваемого человеком.


Второй путь затейливее. На основе теории цепей Маркова из мегабайта хорошего качественного текста довольно несложно синтезировать новый текст того же стиля. Что на ура и делается- цепь 4-5 порядка даёт хороший слог и видимость здравого смысла. Ресурсов только кушает много.


Самое смешное, что Гугл, наблюдая этот текст, и не находя в своей базе ресурсов, откуда это стянуто, считает его уникальным и ценным. Ещё смешнее, что если исходный текст, юзаемый для синтеза контента, был тематически и терминологически заточен под какую-то конкретную тему, да разбавлен нужными кейвордами, то и результат синтеза очень Гуглу нравится. Контекстная реклама от Гугла легко накладывается на эту тематику без зазора, а трафик с поисковика оказывается целевым. Живой серфер, правда, недоволен, ну да кого же это волнует? Есть трафик, есть клики, есть доход. Остальное пофигу.


Просто счастье, что Рашу это не коснётся никогда. Потому как русский язык вельми богат и крайне сложен. Цепи Маркова можно применять только на "падонковских" сайтах- там используются 300 слов типа "НИАСИЛИЛ. МНОГА БУКАВ. УБЕЙСЯ АПСТЕНУ". Но это нам не интересно.


Хотя… Экспириенса ради, дав 200 кило постов вот этого самого блога скрипту цепей Маркова первого-пятого порядка, я получил синтезатор вот такой вот ахинеи:

http://lasto.com/blog/selfwriter.html


Если бы писал на инглише, можно было бы даже читать. Сказал бы только, что цитата из Харуки Мураками, и никто б не расколол :)


Процесс нагибания это неудобно и неэффективно с точки зрения закона.
Знакомую тебе женщину ты можешь вероятнее.
Настойчивость будет воспета паразитированием.
Когда-то придет время и из нее прийти.
Добровольно взятая на поймёт всеобщую любовь по нескольким причинам.
Попадая при этом ненароком на серьёзе.
Пальца левой ноги на это хватило.

А иногда и вовсе осмысленное проскакивает: "Расскажу про форекс отчего-то сегодня согласен. Понаблюдаем за динамикой поисковых запросов в доллар. Читайте сносочки мелким шрифтом оно среди прочего попадаются крайне толковые линки-то".


Однако мы отвлеклись.


Понятно, что машинный синтез контента с целью поднятия колабашек на поисковом трафике никогда уже нас не покинет. Однако вскоре прозаические цепи Маркова (которые можно отфильтровать на стороне того же Гугла, но зело сиё затратно по ресурсам, а посему в перспективе не ожидается) уступят место новому софту, нарисовавшемуся на горизонте:


Ученые приняли белиберду за чистую монету

Трое американцев создали программу, способную производить на свет "научные работы", состоящие из случайно набранного текста, таблиц и диаграмм. Два таких "документа" были переданы организаторам июльской Всемирной конференции по систематике, кибернетике и информатике (город Орландо во Флориде).
И один из них был принят.

"Мы подумали, что будет несправедливо отвергнуть документ, который не получил негативных оценок ни от одного из трех рецензентов", - сказал сказал председатель оргкомитета "отличившейся" конференции Наджиб Каллаос и добавил, что теперь оргкомитет уже пересматривает процедуру принятия документов.

Заголовок этой бумаги не имеет никакого смысла:
"Рутер: методология типичной унификации точек доступа и избыточности".

Как сказал один из авторов "документа", Джереми Стриблинг, выпускник Массачусетского технологического института в Бостоне, смысл затеи был в том, чтобы продемонстрировать отсутствие сколько-нибудь системного подхода к проведению академических форумов.

По словам Стриблинга, флоридская конференция стала целью шутников потому, что ее устроители рассылают огромное количество электронных писем с просьбами о финансовой помощи форуму.

"Нам надоел этот спам", - сказал Стриблинг в интервью агентству Рейтер. Трио программистов намерено поехать на конференцию и выступить со случайно сгенерированными речами, написанию которых они тоже просят помочь деньгами - на собственном веб-сайте. Пока эта просьба принесла им чуть больше 2 тысяч долларов.


Так что готовьтесь, ребятки из Гугла- скоро вас ждёт много работы. Дайте только дорвейщикам добраться до технологии :)


22 февраля 2006, 02:03
1Очень неплохая статья
Спасибо Вадим, хорошая статья. Не хватает примеров, а именно - отдачи от трафика полученного таким путем и совсем мало о цепях Маркова.
О них многие знают, некоторые даже пишут скрипты, которые генерят эти цепи, НО: на самом деле очень редко, кто понимает из продающих, как реально правильно написать такой генератор. Обычно это какая-то ерунда, на которую ведутся лохи, слабо представляющие логику работы генератора. В этой теме вообще все, кто в лес, кто по дрова...
Хотелось бы пример реального скрипта на php поразбирать...

R
23 февраля 2006, 04:24
2Дорвей
Статья даже очень актуальная на сегоднешний день,
кто хочет поднимать с пола инета зелённые бумашки,
нужно разбираться и в технологии под названием цепи Маркова.Вадим,а ты не собираешься сделать,что то новое из своего эмулятора сайта,используя эти цепи Маркова?Кстати эмулятор рулет.
Ладно,я пока встану в очередь на твои новшества.

Андрей
23 февраля 2006, 15:33
3Без темы
Sudovoljstvijem bi kupil takoj script :)

Vahtang
24 февраля 2006, 12:33
4эмулятор
В эмуляторе сайта ставлю вместо содержания файла "b" вставляю ключевые слова файла "links". От того предложения тоже генерятся забавные, а главное ключевухи в тему. Попробуйте, кто эмулятором пользуется.

Алексей
11 декабря 2006, 09:28
5Пример
 Спасибо Вадим, хорошая статья. Не хватает примеров, а именно - отдачи от трафика полученного таким путем и совсем мало о цепях Маркова.
О них многие знают, некоторые даже пишут скрипты, которые генерят эти цепи, НО: на самом деле очень редко, кто понимает из продающих, как реально правильно написать такой генератор. Обычно это какая-то ерунда, на которую ведутся лохи, слабо представляющие логику работы генератора. В этой теме вообще все, кто в лес, кто по дрова...
Хотелось бы пример реального скрипта на php поразбирать...


Иван

Трекбэки:

28 августа 2008, 06:38
Но воспримем сей факт как данность, как аксиому, как высочайшую благость, явлённую нам свыше. Гуглом, естественно, не Яндексом каким. читать полностью http://lasto.com/blog/post_1140573973.html там и автоматический формирователь текста найдете http: lasto.com blog selfwriter.

Комментарии к этой заметке больше не принимаются.


февраль, 2006
пн вт ср чт пт сб вс
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28