Эффект сотой обезьяны, или вновь об импорте контента.
Как Вы могли уже заметить, авторствующий тут Мастер Ласто немного неравнодушен к ВебДваНольнутым технологиям. Но в отличие от коллег, усвоивших только одну довольно простую процедуру- найти подходящую RSS ленту и тупо красть с неё всё подряд на свой сайт, настоящий Мастер должен сразу наложить вето на такой незамысловатый подход.
По идее.
Причину вето можно и не называть- и так понятно, что многократно и всеми подряд растиражированные новости держать ещё и на своём сайте не имеет никакого смысла. Контент должен быть по возможности эксклюзивным, и уж если что-то откуда-то и тащить, то статьи целиком и прямо с сайта. Процедура парсинга сайта не всем покоряется, и пока не является массовой. А потому на этом поле ещё можно успешно играть довольно длительное время.
Баловство же с новостями и RSS лентами приводит к тому, что все ВебДваНольнутые сайты тематически повторяют друг друга. Ткните пальцем в любую так называемую социальную сеть, и там будет примерно то же самое, что и на соседней социалке.
Но. Иногда сайту ну никак не обойтись без новостийной ленты. Причин может быть много, от надуманных до совершенно объективных, не о них разговор. Просто воспримем как данность- вебмастер должен породить некую новостийную ленту (построить дом, посадить дерево, ага). А как?
Мы уже высказали хулу сграбленными с RSS новостям. Мы прекрасно понимаем, что и куча сервисов класса «наши новости на вашем сайте» тоже непригодны к использованию, так как, во-первых, базируются главным образом на JavaScript, который абсолютно не индексируется искалкой и далеко не всегда поддерживается браузером серфера, а во-вторых, Вы никак не можете влиять на импортируемый в ленту новостей контент. Всё, что делают эти дармовые ленты новостей, так это тянут Ваших посетителей на сайт поставщика услуги. Ну так такая у них работа, такая уж в них идея изначально и закладывалась.
Возможно, читая эти строки, Вы уже готовы задать себе вопрос- а КАК тогда формировать ленту новостей?
Задайте лучше этот вопрос мне. А я сформулирую ряд постулатов:
- Из соображений SEO Ваша лента новостей должна присутствовать на странице сайта в виде статичного HTML кода. Никакого Джава Скрипта, никакого Аякса и прочих высоких технологий- это, как указывалось выше, не индексируется в поиске вообще никак, и не обязано поддерживаться браузером посетителя. А старый дедовский HTML – то, что доктор прописал.
- Вы должны легко и просто определять вид любого элемента ленты новостей, сохраняя стиль своей страницы. Это очень важно. Иначе нарисуется картина маслом про корову и седло. И кто из них будет сверху, даже не понятно- возможна та ещё порнуха.
- В ленте не должно быть левых линков- только текст и ссылка на источник.
- Картинки приветствуются- с ними веселее жить.
- Как это ни покажется странным, но и тематика ленты новостей на каждой конкретной странице Вашего сайта должна регулироваться отдельно. В соответствии с темой этого раздельчика сайта. И регулироваться в широчайших пределах- от материалов про Дану Борисову до рассказа про спортзалы для нудистов. А ну-ка попробуйте сходу найти что-то готовое про то и другое.
- Количество таких эксклюзивных лент новостей в пределах сайта не должно ограничиваться ничем.
- Язык и подборка источников информации Вам тоже должны покоряться. Как минимум на русском и английском, с выдачей контента в соответствующей кодировке, в том числе и UTF-8. С подстройкой под сайт.
- Всё это должно как-то сопрягаться с движками. Например, Блога, Портатора и CMS от Мастера Ласто. Чисто для примера и пользы дела.
Теперь, когда важнейшие постулаты сформулированы, пусть и утомительным казённым языком, жить сразу стало как-то легче. Потому что мы, глядя на то или иное решение или предложение, сразу можем вынести вердикт, не пойти ли ему тотчас нафиг.
Только вот не удивляйтесь, что нафиг пойдёт абсолютно всё. Ну да сами прикиньте, какая шняжечка с ярлычком «наши новости у вас на сайте» удовлетворяет всем пунктам постулатов. А особенно пятому пункту. Который пресловутый и самый хитрый.
Мне известно только одно место, способное порадовать вебмастера ВебДваНольнутого сайта сбычей всех его мечт- понятно, что это сам Гугл. Коль уж он дерет контент с 400 онлайновых русскоязычных изданий и хрен его знает скольких англоязычных, то пускай сам же и пишет рефераты на заданную тему. С картинками.
Ну а поскольку мы тоже истинные фанаты ВебДваНольнутости, то сами изобретать почти ничего и не будем. Ну так, совсем небольшой разве что парсер. Можно и без него, но тогда не удовлетворятся первые три пункта постулатов. А их лучше держать удовлетворёнными.
Итак.
Вы можете вслед за мной сходить в Гугл, и порыться в нём- много чего сыщется. А можете сразу уйти на рекомендуемый мною сайт simplepie.org и позаимствовать там ихний «A PHP-Based RSS and Atom Feed Framework». Любой путь хорош, а наличие небольшого знания РНР в области регулярных выражений позволит Вам легко сконструировать тулзу по выемке дайджестов новостей прямо с news-серверов Гугла и в почти готовом виде. Так, немножко посолить-поперчить, сбрызнуть соусом, и готово.
Для тех, кому простой путь представляется трудным, спешу облегчить жизнь. В шопе Мастера Ласто в разделе импорта контента имеется лот «Гугловый Референт», прибегать к которому ведающим PHP малость зазорно. Ибо это классическая задача, порешав которую самостоятельно, вебмастеру положено быть счастливым целую неделю. Не лишайте себя вполне заслуженного счастья.
Я тоже веселился минут двадцать, скармливая «Гугловому Референту» различные темы. В том числе про Дану Борисову и нудистов, буде уж они всуе упомянуты в Постулатах. А ежели юзать английский язык, то и вообще шикарно- совершенно реально засунуть в ту же нано-CMS полста страничек с родственными тематиками, и породить шикарнейший многостраничный тематический дор, который, блин, ещё и будет сам обновляться. Всего-то для этого надо измыслить полста кейвордов.
Сходите по ссылочкам, поприкалывайтесь. Потому что вебмастеринг на самом деле- это вовсе не та нудятина, от которой уши сначала вянут, а потом и вовсе в трубочку сворачиваются. Вебмастеринг- это очень весело и полезно. Ежели по науке и под чутким руководством :)
Оборудуйте свой сайт правильной новостийной лентой, порадуйте своих посетителей не тем, что где-то вспыхнуло- упало- разбилось, а тем, что полезно знать, приятно видеть, и в струю. А уж серфер не забудет к Вам дорогу :)
Ну а я укажу на партизанскую тропу: офис Гуглового Референта
Хомячковый рай. Уйти и потеряться:
" Добрый вечер, Александр.
По поводу вашего комментария. Вы говорите что можно использовать скрипт в качестве дора на свой сайт. Возникает вопрос, каким образом? Ведь ссылки ленте идут на главную страницу, а не на статью на сайте? Разве в подобном есть смысл?
Разъясните, если сможете. Спасибо. "
Ссылки с ленты ведут туда, куда в шаблоне RSS указано, ("читать полность") ведёт на статью, да и в авторском блоке уже не сайт той-же Ферры указан, а Ваш портатор, к Ферре (в данном примере) подключенный.
Что имеем: парсим в один портатор сколь угодно рубрик со сколь угодно (ну или сколько есть подходящих сигнатур) статей, новостей.
А уже с этого сайта разбираем на другие узкотематические.
Получается, что ссылки со всех будут вести в туда, где голова, а не прямиком на доноров.
Кто мешает обвешать эту голову по внутренним страницам своими-же линками, чтобы весь Пиар донорам не утекал?
В Референте, в анонсах, стоят прямые ссылки на статьи и ни коим образом
не видно, что статьи спарсены с гуглового сервиса.
Каким образом апрув может указать на то, что эти статьи собраны с их новостных каналов? Что они дубли - это и козе понятно.
Или я не прав?
Хотите взять ответственность за содержание статей на себя или распиарить собственную свалку второсортных артиклей?
Мне сегодня с англоязычного портатора прилетела жалоба и требования убрать одну статью, фрагмент которой был украден ещё до меня. Советовали сделать это быстро, чтобы вдруг моему адсенс-аккаунту не оказаться в числе забаненных за нарушение копирайтинга. Осторожнее надо обращаться с чужим контентом, тем более англоязычным.
Может уважаемый Вадим чего посоветует - как быть в таких ситуациях?
А мы заранее ему спасибо скажем.
И не говорите, что вам на это сначала выхухоль, а потом похухоль.
До поры до времени.
Поэтому если где берёте абзац текста, непременно ставьте линк прямо на ту страницу, откуда взято. На цитирование никто не обидится, а плагиат жутко раздражает и доводит до греха.
Абсолютно любая вебдванольнутая тулза в процессе синдикации контента ОБЯЗАНА линковаться на источник. Без вариантов.
И тогда к тулзе не будет никаких претензий.
К сожалению, в Раше даже совершенно очевидные вещи не понимаются правильно. И долго ещё не будут пониматься. Потому что две беды- ну да про них слышали...
В данном случае процитированную Портатором статью с невалидным авторством надо или удалять, или редактировать автора, как просят.
Тоже без вариантов.
Давайте рассмотрим конкретный пример: /exp/a/exler/
Здесь используется лента feeds.feedburner.com/exler/. Получается что со статьи на нашем сайте имеется одна ссылка "source:feeds.feedburner.com", которая вообще не имеет отношения к конкретной ленте "exler". Как быть с такой несправедливостью? Ведь Экслер обидется, а ведь все мы не любим обижать наших добрых доноров!
И еще... если использовать несколько rss ленты типа news.google.com/news?q=word&output=rss с разным word'ом, то работать будет только одна, т.к. при идентификации ленты отбрасывается все после '?'. Можно ли заставить портатор различать эти ленты?
Так вот пришлось дело поправить,и ответить ему в обратную,что мол всё исправленно.
Рейтинг популярности - на эти заметки чаще всего ссылаются:
- 225 Как проще всего избавиться от ZP-RUR.
- 219 О фотоморде сайта.
- 182 Яндекс и дублирование контента.
- 119 Бразильский Онанизм. Пять лет спустя.
- 105 Ночной Бдун.
- 076 Максимизация прибыли в Хитрой Конторе.
- 075 О достоинстве гостевом, на ассамблеях быть должном.
- 073 Про низкочастотное ссылочное ранжирование.
- 063 Эротические будни экономных бородатых дядек.
- 059 Фатален ли единый айпишник?
- 052 Ценителям тонких извращений. nginx под Виндой.
- 051 Яндексовский Скайнет
- 050 Продвижение методом «двенадцати единиц».
- 048 Жизнь - это игра, в которой нет setup'а.
- 046 Онанизм по бразильской методике. Рецепт от Lasto.
- 042 Про козлёнка, который умел считать до десяти.
- 040 Хомячкам наконец-то повезло.
- 038 Игра ума карается расстрелом.
- 037 Топ секретно.
- 036 Дела самурайские...
