|
Настройка фильтров контента :
Если Вы, внимательно почитав
опус
про полезность тематического ресурса, в душе согласились с целесообразностью работы в той или иной нише, а не на помойке текстов, то Вам понадобятся, помимо стандартного функционала портатора, ещё и некоторые тонкие настройки, позволяющие отсеивать нетематические артикли, которые будут не особенно полезны в рамках нишевого ресурса.
С этим нет никаких проблем. Наиболее оптимальная схема эффективной работы с фильтрами контента алгоритмизированно изложена ниже:
- Перво-наперво обзаведитесь Денвером, и
подружите его с Зендом.
- Создайте копию своего сетевого ресурса в Денвере.
Имеется ввиду Портатор.
- Скопируйте содержимое папки data/news/ с сервера в одноимённую папку Денвера, перенеся таким образом весь контент один к одному с сервера на локальный сервер, в качестве которого и выступает Денвер.
- Посетите файл настроек data/settings.php и обратите внимание вот на эту опцию:
# Включен фильтр контента или нет.
# Возможные значения:
# true; - включен
# false; - выключен
# Фильтр актуален ТОЛЬКО при импорте контента.
# К уже закачанным заметкам фильтр НЕ ПРИМЕНЯЕТСЯ.
$_s['keywords_switcher']=false;
# Интереса ради можно вывести общий балл соответствия
# контента артикля фильтрам в подпись к артиклю.
# Возможные значения:
# true; - выводить
# false; - не выводить
$_s['keywords_rating']=false;
Значения переменных, выделенные красным, нужно установить в true;
- Теперь, обратившись под Денвером к локальной копии сайта-Портатора, Вы увидите в подписи к каждому артиклю добавочку
(выделено):
Autor: Dakota Dog
Added: February 16, 2007
Source:
http://articlealley.com/article_129729_17.html
Rank: 0
- Далее в том же файле data/settings.php чуть выше того блока, который мы только что модифицировали, обратите внимание на такую запись:
# Фильтры контента.
# Каждый перечисленный в фильтрах кейворд имеет свой вес.
# Если в импортируемом тексте содержится слов с суммарным весом
# более 100, то эта заметка импортируется в портатор.
# Если слово встречается несколько раз, берётся его суммарный вес.
# Вес кейворда может быть отрицательным- нежелательные
# кейворды уменьшают статус документа.
# Область видимости фильтра- заголовок артикля и его текст.
# Подпись не анализируется.
# Регистр кейвордов в тексте и в правилах фильтра не важен.
$_s['keywords_rank']=array(
"Doctor"=>25,
"medicaid"=>10,
"viagra"=>-50,
);
Совершенно понятно, что Вам надлежит определиться с ключевиками, и наполнить ими данный массив, проставив вес каждого из ключевиков.
- Просматривая артикли локального сайта под Денвером, и корректируя номенклатуру и вес ключевиков в указанном массиве сеттингов, ориентируясь на показания ранга страниц (пункт 5 настоящей инструкции), добейтесь, чтобы целевые (на Ваш взгляд) документы имели ранг выше сотни.
Это означает, что такие документы будут импортированы с доноров.
Не добравшие до ста баллов проигнорируются.
- Теперь приравняйте переменную $_s['keywords_rating']=false;
и загрузите файл сеттингов на вебсервер в data/settings.php, перенеся тем самым правила ранжирования импортированных документов на реальный сайт.
Несмотря на кажущуюся простоту, фильтр контента весьма успешно отсеивает нетематические артикли, попавшие в нужную Вам категорию донора по ошибке (автор ошибся разделом при постинге), а также всевозможный спам. Великий отрицательный вес кейвордов наподобие виагры и фантермина (на них приходится 90% спамовых артиклей в немодерируемых сервисах) избавит Вас от этой напасти.
Понятное дело, что подбором кейвордов придётся таки озаботиться. Никто за Вас этого делать не будет.
|
|