Размер шрифта:

Эффект сотой обезьяны, или вновь об импорте контента.

Как Вы могли уже заметить, авторствующий тут Мастер Ласто немного неравнодушен к ВебДваНольнутым технологиям. Но в отличие от коллег, усвоивших только одну довольно простую процедуру- найти подходящую RSS ленту и тупо красть с неё всё подряд на свой сайт, настоящий Мастер должен сразу наложить вето на такой незамысловатый подход.


По идее.


Причину вето можно и не называть- и так понятно, что многократно и всеми подряд растиражированные новости держать ещё и на своём сайте не имеет никакого смысла. Контент должен быть по возможности эксклюзивным, и уж если что-то откуда-то и тащить, то статьи целиком и прямо с сайта. Процедура парсинга сайта не всем покоряется, и пока не является массовой. А потому на этом поле ещё можно успешно играть довольно длительное время.


Баловство же с новостями и RSS лентами приводит к тому, что все ВебДваНольнутые сайты тематически повторяют друг друга. Ткните пальцем в любую так называемую социальную сеть, и там будет примерно то же самое, что и на соседней социалке.


Но. Иногда сайту ну никак не обойтись без новостийной ленты. Причин может быть много, от надуманных до совершенно объективных, не о них разговор. Просто воспримем как данность- вебмастер должен породить некую новостийную ленту (построить дом, посадить дерево, ага). А как?


Мы уже высказали хулу сграбленными с RSS новостям. Мы прекрасно понимаем, что и куча сервисов класса «наши новости на вашем сайте» тоже непригодны к использованию, так как, во-первых, базируются главным образом на JavaScript, который абсолютно не индексируется искалкой и далеко не всегда поддерживается браузером серфера, а во-вторых, Вы никак не можете влиять на импортируемый в ленту новостей контент. Всё, что делают эти дармовые ленты новостей, так это тянут Ваших посетителей на сайт поставщика услуги. Ну так такая у них работа, такая уж в них идея изначально и закладывалась.


Возможно, читая эти строки, Вы уже готовы задать себе вопрос- а КАК тогда формировать ленту новостей?


Задайте лучше этот вопрос мне. А я сформулирую ряд постулатов:


    1. Из соображений SEO Ваша лента новостей должна присутствовать на странице сайта в виде статичного HTML кода. Никакого Джава Скрипта, никакого Аякса и прочих высоких технологий- это, как указывалось выше, не индексируется в поиске вообще никак, и не обязано поддерживаться браузером посетителя. А старый дедовский HTML – то, что доктор прописал.

    2. Вы должны легко и просто определять вид любого элемента ленты новостей, сохраняя стиль своей страницы. Это очень важно. Иначе нарисуется картина маслом про корову и седло. И кто из них будет сверху, даже не понятно- возможна та ещё порнуха.

    3. В ленте не должно быть левых линков- только текст и ссылка на источник.

    4. Картинки приветствуются- с ними веселее жить.

    5. Как это ни покажется странным, но и тематика ленты новостей на каждой конкретной странице Вашего сайта должна регулироваться отдельно. В соответствии с темой этого раздельчика сайта. И регулироваться в широчайших пределах- от материалов про Дану Борисову до рассказа про спортзалы для нудистов. А ну-ка попробуйте сходу найти что-то готовое про то и другое.

    6. Количество таких эксклюзивных лент новостей в пределах сайта не должно ограничиваться ничем.

    7. Язык и подборка источников информации Вам тоже должны покоряться. Как минимум на русском и английском, с выдачей контента в соответствующей кодировке, в том числе и UTF-8. С подстройкой под сайт.

    8. Всё это должно как-то сопрягаться с движками. Например, Блога, Портатора и CMS от Мастера Ласто. Чисто для примера и пользы дела.

Теперь, когда важнейшие постулаты сформулированы, пусть и утомительным казённым языком, жить сразу стало как-то легче. Потому что мы, глядя на то или иное решение или предложение, сразу можем вынести вердикт, не пойти ли ему тотчас нафиг.


Только вот не удивляйтесь, что нафиг пойдёт абсолютно всё. Ну да сами прикиньте, какая шняжечка с ярлычком «наши новости у вас на сайте» удовлетворяет всем пунктам постулатов. А особенно пятому пункту. Который пресловутый и самый хитрый.


Мне известно только одно место, способное порадовать вебмастера ВебДваНольнутого сайта сбычей всех его мечт- понятно, что это сам Гугл. Коль уж он дерет контент с 400 онлайновых русскоязычных изданий и хрен его знает скольких англоязычных, то пускай сам же и пишет рефераты на заданную тему. С картинками.


Ну а поскольку мы тоже истинные фанаты ВебДваНольнутости, то сами изобретать почти ничего и не будем. Ну так, совсем небольшой разве что парсер. Можно и без него, но тогда не удовлетворятся первые три пункта постулатов. А их лучше держать удовлетворёнными.


Итак.


Вы можете вслед за мной сходить в Гугл, и порыться в нём- много чего сыщется. А можете сразу уйти на рекомендуемый мною сайт simplepie.org и позаимствовать там ихний «A PHP-Based RSS and Atom Feed Framework». Любой путь хорош, а наличие небольшого знания РНР в области регулярных выражений позволит Вам легко сконструировать тулзу по выемке дайджестов новостей прямо с news-серверов Гугла и в почти готовом виде. Так, немножко посолить-поперчить, сбрызнуть соусом, и готово.


Для тех, кому простой путь представляется трудным, спешу облегчить жизнь. В шопе Мастера Ласто в разделе импорта контента имеется лот «Гугловый Референт», прибегать к которому ведающим PHP малость зазорно. Ибо это классическая задача, порешав которую самостоятельно, вебмастеру положено быть счастливым целую неделю. Не лишайте себя вполне заслуженного счастья.


Я тоже веселился минут двадцать, скармливая «Гугловому Референту» различные темы. В том числе про Дану Борисову и нудистов, буде уж они всуе упомянуты в Постулатах. А ежели юзать английский язык, то и вообще шикарно- совершенно реально засунуть в ту же нано-CMS полста страничек с родственными тематиками, и породить шикарнейший многостраничный тематический дор, который, блин, ещё и будет сам обновляться. Всего-то для этого надо измыслить полста кейвордов.


Сходите по ссылочкам, поприкалывайтесь. Потому что вебмастеринг на самом деле- это вовсе не та нудятина, от которой уши сначала вянут, а потом и вовсе в трубочку сворачиваются. Вебмастеринг- это очень весело и полезно. Ежели по науке и под чутким руководством :)


Оборудуйте свой сайт правильной новостийной лентой, порадуйте своих посетителей не тем, что где-то вспыхнуло- упало- разбилось, а тем, что полезно знать, приятно видеть, и в струю. А уж серфер не забудет к Вам дорогу :)


Ну а я укажу на партизанскую тропу: офис Гуглового Референта

Хомячковый рай. Уйти и потеряться:

Адрес заметки: http://lasto.com/blog/post_1174818962.html

страницы: 01 02 03
05 апреля 2007, 01:45
Странно, но моё короткое сообщение вызвало довольно большой интерес. Я получил уже несколько писем с вопросами, вот одно из них- наиболее интересное:
" Добрый вечер, Александр.
По поводу вашего комментария. Вы говорите что можно использовать скрипт в качестве дора на свой сайт. Возникает вопрос, каким образом? Ведь ссылки ленте идут на главную страницу, а не на статью на сайте? Разве в подобном есть смысл?
Разъясните, если сможете. Спасибо. "
Ссылки с ленты ведут туда, куда в шаблоне RSS указано, ("читать полность") ведёт на статью, да и в авторском блоке уже не сайт той-же Ферры указан, а Ваш портатор, к Ферре (в данном примере) подключенный.
Что имеем: парсим в один портатор сколь угодно рубрик со сколь угодно (ну или сколько есть подходящих сигнатур) статей, новостей.
А уже с этого сайта разбираем на другие узкотематические.
Получается, что ссылки со всех будут вести в туда, где голова, а не прямиком на доноров.
Кто мешает обвешать эту голову по внутренним страницам своими-же линками, чтобы весь Пиар донорам не утекал?
05 апреля 2007, 22:10
Не понимаю вашей озабоченности - господа!
В Референте, в анонсах, стоят прямые ссылки на статьи и ни коим образом
не видно, что статьи спарсены с гуглового сервиса.
Каким образом апрув может указать на то, что эти статьи собраны с их новостных каналов? Что они дубли - это и козе понятно.
Или я не прав?
07 апреля 2007, 17:15
"Кто мешает обвешать эту голову по внутренним страницам своими-же линками, чтобы весь Пиар донорам не утекал?"
Хотите взять ответственность за содержание статей на себя или распиарить собственную свалку второсортных артиклей?
Мне сегодня с англоязычного портатора прилетела жалоба и требования убрать одну статью, фрагмент которой был украден ещё до меня. Советовали сделать это быстро, чтобы вдруг моему адсенс-аккаунту не оказаться в числе забаненных за нарушение копирайтинга. Осторожнее надо обращаться с чужим контентом, тем более англоязычным.
Может уважаемый Вадим чего посоветует - как быть в таких ситуациях?
А мы заранее ему спасибо скажем.
07 апреля 2007, 23:39
Начинаем привыкать к мысли, что уворовывание результатов труда написателя буковок есть такое же нарушения прав на интеллектуальную собственность, как юзание пиратской винды. И за то и за другое легко штаны спустят и будут долго и трепетно делать ататат.
И не говорите, что вам на это сначала выхухоль, а потом похухоль.
До поры до времени.
Поэтому если где берёте абзац текста, непременно ставьте линк прямо на ту страницу, откуда взято. На цитирование никто не обидится, а плагиат жутко раздражает и доводит до греха.
Абсолютно любая вебдванольнутая тулза в процессе синдикации контента ОБЯЗАНА линковаться на источник. Без вариантов.
И тогда к тулзе не будет никаких претензий.
К сожалению, в Раше даже совершенно очевидные вещи не понимаются правильно. И долго ещё не будут пониматься. Потому что две беды- ну да про них слышали...
В данном случае процитированную Портатором статью с невалидным авторством надо или удалять, или редактировать автора, как просят.
Тоже без вариантов.
Ласто
08 апреля 2007, 00:31
Всё же ссылки на первоисточник нужно ставить, тогда никаких претензий не будет. И что значит пиар донарам не утекал? Чтобы совсем не утекал, нужно свои статьи писать. А как по другому? А так, на чужом горбу, да за бесплатно видимо не получится.
denis
10 апреля 2007, 19:42
Поэтому если где берёте абзац текста, непременно ставьте линк прямо на ту страницу, откуда взято."
Давайте рассмотрим конкретный пример: /exp/a/exler/
Здесь используется лента feeds.feedburner.com/exler/. Получается что со статьи на нашем сайте имеется одна ссылка "source:feeds.feedburner.com", которая вообще не имеет отношения к конкретной ленте "exler". Как быть с такой несправедливостью? Ведь Экслер обидется, а ведь все мы не любим обижать наших добрых доноров!
mouseower to comment Вообще-то стандартно в структуре ленты положено иметь специальный перманент-линк, конкретно указывающий на источник (не урл самой ленты, а сайт поддержки). Но, к сожалению, в Раше почему-то перманентно на мерманент-линк забивают. Посему, не мудрствуя лукаво, ставится бэк на домен сайта. Это побуждает держать RSS ленты на собственном сайте, а не на непонятном сервисе.
Хорошо, если в тексте статьи встречается ссылка на непосредственно источник, иначе - нужно иметь ссылку на саму статью либо не использовать этот ресурс вообще.
mouseower to comment Верно. Наблюдая, как растаскиваются статьи этого блога в разные помойки текстов, чаще всего в автоматическом режиме, а изредка и руками, тоже пришёл к мысли а необходимости тупо линковаться на другие посты блога. Ясное дело, что при ручном дралове все эти линки выдираются, но это уж фатальный случай- присвоение чужого контента. Когда-нибудь Гугл за это будет опускать конкретно.
"И тогда к тулзе не будет никаких претензий" :)
И еще... если использовать несколько rss ленты типа news.google.com/news?q=word&output=rss с разным word'ом, то работать будет только одна, т.к. при идентификации ленты отбрасывается все после '?'. Можно ли заставить портатор различать эти ленты?
mouseower to comment Над тем надо подумать. Но, глядя в /exp/a/guglovoe-world/news_2007-04-10-10-31-36-610 .html, решительно не понимаю, какой с того прок. Куча левых ссылок и предложение текста. Ладно, Гугловый Референт бы это профессионально почикал, убив ссылки. А в таком-то виде это зачем и кому нужно?
И спасибо за тулзу, Вадим! Ненарадуюсь!
11 апреля 2007, 01:27
У меня получился казус,есть у меня один англоязычный портатор,так вот получил я письмо от владельца одной статьи,где он сказал,что-бы я указал линк на его сайт,хоть он был и указан как автор и ссылочка была указана откуда была взята статья так нет,подавай линк ему на его сайт.
Так вот пришлось дело поправить,и ответить ему в обратную,что мол всё исправленно.
11 апреля 2007, 23:38
Не совсем понял- раздача прекращена совсем? Имеется в виду "присадка" рсс лент для покупателей референта? А то в больнице лежал- почитать блог не было просто возможности...
Link
12 апреля 2007, 18:12
А я в больнице не лежал, но на один день опоздал... Акция по раздаче была окончена :(, о чем мастер конкретно заявил.
18 мая 2007, 12:18
Насчет того, как гугл узнает, что с него сдернуты новости. И почему он может быть против. Ответ - хотя бы из-за картинок, относящихся к этой новости. Вот это не самая удачная идея.
Иван
страницы: 01 02 03
Комментарии к этой заметке больше не принимаются.


Рейтинг популярности - на эти заметки чаще всего ссылаются:

март, 2007
пн вт ср чт пт сб вс
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
  • География читателей: Locations of visitors to this page Прямо сейчас на блоге: