Сайт провинциального самурая

Сайт провинциального самурая

Настройка фильтров контента Портатора.

Настройка фильтров контента :

Если Вы, внимательно почитав опус про полезность тематического ресурса, в душе согласились с целесообразностью работы в той или иной нише, а не на помойке текстов, то Вам понадобятся, помимо стандартного функционала портатора, ещё и некоторые тонкие настройки, позволяющие отсеивать нетематические артикли, которые будут не особенно полезны в рамках нишевого ресурса.

С этим нет никаких проблем. Наиболее оптимальная схема эффективной работы с фильтрами контента алгоритмизированно изложена ниже:

  1. Перво-наперво обзаведитесь Денвером, и подружите его с Зендом.

  2. Создайте копию своего сетевого ресурса в Денвере.
    Имеется ввиду Портатор.

  3. Скопируйте содержимое папки data/news/ с сервера в одноимённую папку Денвера, перенеся таким образом весь контент один к одному с сервера на локальный сервер, в качестве которого и выступает Денвер.

  4. Посетите файл настроек data/settings.php и обратите внимание вот на эту опцию:
    # Включен фильтр контента или нет.
    # Возможные значения: 
    #    true; - включен
    #    false; - выключен
    # Фильтр актуален ТОЛЬКО при импорте контента.
    # К уже закачанным заметкам фильтр НЕ ПРИМЕНЯЕТСЯ.
    
       $_s['keywords_switcher']=false;
    
    # Интереса ради можно вывести общий балл соответствия
    # контента артикля фильтрам в подпись к артиклю.
    # Возможные значения: 
    #    true; - выводить
    #    false; - не выводить
    
       $_s['keywords_rating']=false;
    

    Значения переменных, выделенные красным, нужно установить в true;

  5. Теперь, обратившись под Денвером к локальной копии сайта-Портатора, Вы увидите в подписи к каждому артиклю добавочку (выделено):

    Autor: Dakota Dog
    Added: February 16, 2007
    Source: http://articlealley.com/article_129729_17.html
    Rank: 0

  6. Далее в том же файле data/settings.php чуть выше того блока, который мы только что модифицировали, обратите внимание на такую запись:
    # Фильтры контента.
    # Каждый перечисленный в фильтрах кейворд имеет свой вес.
    # Если в импортируемом тексте содержится слов с суммарным весом 
    # более 100, то эта заметка импортируется в портатор.
    # Если слово встречается несколько раз, берётся его суммарный вес.
    # Вес кейворда может быть отрицательным- нежелательные 
    # кейворды уменьшают статус документа.
    # Область видимости фильтра- заголовок артикля и его текст.
    # Подпись не анализируется.
    # Регистр кейвордов в тексте и в правилах фильтра не важен.
    
       $_s['keywords_rank']=array(
          "Doctor"=>25,
          "medicaid"=>10,
          "viagra"=>-50,
       );
    Совершенно понятно, что Вам надлежит определиться с ключевиками, и наполнить ими данный массив, проставив вес каждого из ключевиков.

  7. Просматривая артикли локального сайта под Денвером, и корректируя номенклатуру и вес ключевиков в указанном массиве сеттингов, ориентируясь на показания ранга страниц (пункт 5 настоящей инструкции), добейтесь, чтобы целевые (на Ваш взгляд) документы имели ранг выше сотни.
    Это означает, что такие документы будут импортированы с доноров.
    Не добравшие до ста баллов проигнорируются.

  8. Теперь приравняйте переменную $_s['keywords_rating']=false; и загрузите файл сеттингов на вебсервер в data/settings.php, перенеся тем самым правила ранжирования импортированных документов на реальный сайт.

Несмотря на кажущуюся простоту, фильтр контента весьма успешно отсеивает нетематические артикли, попавшие в нужную Вам категорию донора по ошибке (автор ошибся разделом при постинге), а также всевозможный спам. Великий отрицательный вес кейвордов наподобие виагры и фантермина (на них приходится 90% спамовых артиклей в немодерируемых сервисах) избавит Вас от этой напасти.

Понятное дело, что подбором кейвордов придётся таки озаботиться. Никто за Вас этого делать не будет.