Как правило, типичный артикль отнюдь не является опусом, которым можно зачитаться от заката до рассвета. Это коротенький фрагментик текста, который поисковик анализирует в основном по плотности ключевиков и содержанию. Если умеет понимать содержание из контекста.
Стало быть, имеет смысл выделить ведущий кейворд (самое часто употребимое слово), и именно по нему произвести усиление этого артикля. Чтобы поисковик понимал, про что в заметке главным образом говорится.
Однако в процессе детектирования ведущего кейворда требуется отсеять слова и части речи, которые не заслуживают чести стать ведущими кейвордами артикля. Ведь понятно, что различных предлогов и местоимений в тексте очень много, и надо дать понять Портатору- хоть они встечаются часто, но смысл-то вовсе не в них.
Самое простое- собрать коллекцию таких слов-исключений, и предъявить их скрипту. Что достигается созданием текстового файла с перечислением слов-исключений, определяемой в сеттингах так:
# Путь до базы слов-исключений, # сервис детектирования ведущего кейворда артикля. # Опять-таки, можете вынести эту базу за пределы папки скрипта, # сделав и базу, и папку общей для множества портаторов: $_s['keywords']['path']="./data/dbs/keywords_ignored.txt";
Архитектура базы элементарна- слова русского и английского языка, разделённые пробелами и (или) переводом строки.
После того, как анализатор текста пробежится по артиклю, сформируется набор из максимально десяти словосочетаний, одним из слов которых непременно будет ведущий кейворд, а вторым- тот термин, с которым ведущий кейворд наиболее часто встретился в тексте (слова-исключения сюда, конечно же, не входят).
Например, если заставить Портатор проанализировать текст этой страницы, то он увидит такие ведущие кейворды:
Наверное, это действительно самое частоупотребимое тут слово.
Что делать с полученным списочком кейвордов- просто воткнуть их в артикль где-нибудь в самом низу странички, многократно усилив тем самым частоту употребления ведущего кейворда, либо сформировать какие-то хитрые ссылки-теги, решайте сами. По кнопке "Дизайн артикля (новости)" варианты оговорены. На конкретных примерах реализации в виде кода.
Важное предупреждение:
Автор технологии уже наполнил соответствующую текстовую базу англоязычными и рашевыми словами-исключениями, и обкатал на своих тематиках по признаку пристойного определения ведущего кейворда. Однако, если Вы видите, что в ведущие кейворды пробивается часть речи, явно этого недостойная, не стесняйтесь пополнить свою базу этим отщепенцем. Точность селекции ведущего кейворда обусловлена только верным отсеиванием того, что кейвордом стать не должно.
Следующая кнопка мануала расскажет Вам, как можно с толком употребить в дело детектированный тут ведущий кейворд, кардинально усилив позиции артикля именно по этому кейворду.