Lasto Splog Engine, что делает:

Сплог получает на входе список RSS и HTTP лент, с определённой периодичностью просматривает их, и находит там ссылки на новые статьи.

Сплогу не интересно содержимое самих RSS/HTTP лент.

Там обычно присутствует только лишь кусочек статьи со ссылкой на полную версию, размещённую на сайте. Поэтому сплог сразу переходит на сайт по пермалинку, где и пытается распознать границы полной версии статьи. И вот её-то и утащить.

Если имеется готовый список адресов статей, можно дать его сплогу вместо лент.
Или в дополнение к ним.
Возможен одновременный импорт всех трёх форматов.

Особенности Сплога, зачастую уникальные:

1. Самостоятельность

Сплог не нуждается в шаблонах или сигнатурах ресурсов.

Поскольку заранее неизвестно, с какого именно ресурса будет импортирован контент для очередного поста, никто и не ставит себе целью задать формальные правила парсинга этого конкретного ресурса.

2. Рандомизация контента.

Импортированный контент может прогоняться по базе синонимов.
База синонимов открытая для внесения изменений.

Качество рандомизации определяется именно базой синонимов.

3. Эмуляция деятельности живого человека.

В сплоге можно задать сколько угодно правил, запрещающих постинг в определённый временной интервал для определённых дней недели. Что разумно использовать в стиле:

  1. ночью админ спит и ничего не пишет,
  2. по выходным админ отдыхает,
  3. в понедельник админу работается хреново, скажем прямо,
  4. в пятницу админ сваливает в паб, прекращая работу пораньше.

Есть данные, что поисковые системы анализируют периодичность постинга.
Неестественность этого параметра ставит сайт под фильтр.

4. Рандомизация всех процессов.

Если что-то делается строго по расписанию (пинг сплога Кроном, к примеру), это "засвечивает" сплог гарантированно- в реальности живой человек никогда не публикует заметки строго по пику часов.

Поэтому в Lasto Splog Engine посты рождаются в непредсказуемое время.

Смысл тот же.
Поставить сайт под как можно меньшее число фильтров поисковых систем.

5. Множественность источников данных.

Для каждого раздела сплога можно задать собственный перечень RSS лент.
А также список HTTP лент или готовую подборку URL-ов документов.
Естественно, они должны принадлежать тематически однородным ресурсам.

Ограничений на число лент и разделов нет.

6. Отсутствие необходимости в Кроне.

Естественно, никто не запрещает использовать Крон на любом внешнем сайте (а не только сайте со сплогом) для пингования сплога без потери работоспособности алгоритмов рандомизации всех процессов. Однако Крон обязательным не является, да, собственно говоря, и не нужен.

7. Работа на движке LastoBlog

Фактически это модуль расширения к LastoBlog

При оборудовании ЛастоБлога модулем сплога ни одна из его исходных функций не теряется и не ограничивается- Вы можете использовать блог двояко, и как блог, и как сплог.

8. Автономность.

Нет никакой необходимости утверждения админом постов. Полная автономка.
Хотя сервис одобрения предназначенных к постингу заметок предусмотрен.

Можете его пользовать, утверждая или отвергая то, что сплог намеревается опубликовать, и копию чего прислал на Ваш админский емайл. Причём функция email-администрирования выполнена максимально удобно.

Ограничения:

1. Машинный алгоритм распознавания границ текста.

Так как мы не знаем, откуда именно сплог возьмётся импортировать очередную статью, мы никак не можем ему подсказать, где на этом конкретном ресурсе начинается и заканчивается контент. Ведь содержимое странички- это не только текст, но и элементы оформления (дизайн), плюс всякая реклама и навигация.

Машинный алгоритм не всегда способен точно определить начало и конец текста, который живой человек и сочтёт контентом. Алгоритм может выпустить пару предложений, либо прирезать к тексту чуток лишнего.

2. Работа строго с текстом.

Сплог не интересуется картинками, и не импортирует их с внешних ресурсов.
Что не мешает добавить картинку на этапе одобрения статьи.
Прямо через форму одобрения, не заходя в ФТП.