Кластеризация запросов семантического ядра: описание, сервисы и программы


После сбора ключевых фраз, у людей которые впервые работают с семантическим ядром возникает резонный вопрос - что делать с этим дальше и как упорядочить этот “хаос” запросов? Ответом является только одно - сгруппировать их и провести кластеризацию.

Кластеризация запросов - объединение ключевых фраз по их семантическому смыслу для определения основных и дополнительных смыслов статьи. То есть, если у нас есть запрос “как помыть кота”, то в рамках семантического ядра будет понятно, что это тема отдельной статьи с точным посылом. Данный запрос можно разбавить дополнительными смыслами, например запросом “как помыть кота если он боится воды” - необходимо дать ответ на вопрос пользователя, если он является дополнением к основному смыслу.

Постепенно приходит понимание намерений пользователя, например мы знаем, что в 90% случаев при запросе “салат мимоза” мы должны показать рецепт. При запросе “британская кошка” - информацию о породе, но при запросе “британские кошки” - уже ориентация идет на коммерческий запрос и уместны в выдаче будут питомники.

Правильный сбор семантического ядра и его кластеризация - залог успешного продвижения. Поисковые системы на основе текста и его ключевых слов определяют релевантность запросу. Понимание, какой ответ нужен пользователю является фундаментом любого проекта разных направленностей и тематик. Ведь если пользователь вбивая свой запрос не находит то, что он увидел - он уйдет обратно в выдачу, к конкурентам.

Алгоритмы и принципы кластеризации запросов

Принципы кластеризации

Правильная кластеризация требует соблюдения определенных принципов, которые нужно соблюдать для успешной группировки СЯ. Вот основные из них:

  • В группу попадают запросы с одним интентом. Есть ряд запросов, которые нельзя продвинуть на одной странице, как бы не казалось обратное. Например, не выйдет продвинуть запросы “как выбрать домик для кошки” и “как сделать домик для кошки своими руками”. Второй запрос можно объединить с первым по принципу “если вам ничего не нравится, то вы можете сделать домик для кошки своими руками…”, но это будет неверное решение. Первый запрос предполагает обзор и критерии отбора, второй пошаговую инструкцию.

  • Разделение коммерческих и информационных запросов. Не стоит пытаться продвинуть обзор наушников по запросу “купить наушники”. Коммерческий сайт, основная цель которого продажа наушников может добавить обзорную информацию, но если статья носит информационный характер не удовлетворяя запроса посетителя - продажа наушников, то лучше идти “на свою сторону” - к запросам “обзор наушников марки …”.

  • Под каждую семантическую группу выделяется отдельный документ / страница. Данный принцип относится больше к употреблению групп запросов и имеет исключения. Допустим, у нас интернет-аптека и есть препарат различных форм выпуска: таблетки, мазь, капли. Учитывая разную форму выпуска можно подготовить разные документы, ведь пользователь хочет видеть таблетки, а не мазь. Но с другой стороны - препарат ведь один, зачем распыляться и делать несколько страниц под запросы. В этом случае всегда помогает ориентация на выдачу - мы идем в поисковую систему и пробиваем каждый запрос сравнивая - разные ли документы мы получаем на выходе. Если одинаковые - есть смысл объединить, если разные - смотрим на общую частоту групп и совмещаем если она маленькая, разделяем если большая и результаты от поисковой системы различны - разделяем. В некоторых случаях все решается посредством логики, например - вдруг пользователь просто не знает, что есть мазь, а слышал только о таблетках? Тогда правильно будет дать ему полный обзор именно на препарат, а не на форму выпуска которая была в запросе.

При любом раскладе - ориентация на пользователя всегда будет плюсом нам и нашему проекту, так как давая полный ответ на вопрос пользователя мы принесем пользу людям, и, с точки зрения SEO повысим поведенческие факторы, если ответ был хорошим.

Алгоритмы кластеризации

Впервые собрав семантическое ядро необходимо провести подобную кластеризацию и правильно распределить запросы по их смыслам и интентам пользователей. Для осуществления этих рутинных операций давно были придуманы алгоритмы и программы, но прогресс не стоит на месте. 

Грубо подходы можно разделить на:

  • Ручная кластеризация.

  • Автоматическая кластеризация с помощью программ и сервисов.

  • Полуавтоматическая кластеризация - группируем автоматически, проверяем / исправляем руками.

Полуавтоматическая группировка является самым оптимальным вариантом по критериям время-качество, но если группировка для вас нечто новое - лучше попробовать это вручную, для понимания процесса.

Кластеризация по ТОПу

Группировка по ТОПу представляет из себя объединение фраз на основе пересечений выдачи по ним. Например, мы вбиваем уже упомянутый запрос “как помыть кота” и видим определенную выдачу:

После этого мы проверяем другую фразу, которая, по нашему мнению, должно относиться к этой же группе - “как помыть кота если он боится воды”. 

Выдача изменилась и это знак нам, что данные запросы, возможно, требуется разделить и продвигать отдельно в разных материалах.

Автоматическая группировка повторяет этот процесс без участия пользователя. Все что нам остается - добавить свои ключевые слова и предоставить все машине. Но для управления точностью группировки и ее контроля нам необходимо задать уровень пересечений, по которому следует объединять группы. Выделяют Soft и Hard кластеризацию.

Soft кластеризация - в этом случае система проверяет выдачу по одному запросу, и затем сравнивает выдачу остальных запросов. Те запросы, результаты которых совпадают с результатами главного запроса объединяются в группу. Количество совпадений может быть различным. Как правило 3 совпадения при анализе ТОП 10 вполне достаточно, для определения группы в большинстве тематик.

Hard кластеризация - при этом способе, система проверяет не только выдачу на основании одного запроса, но и сравнивает пересечение всех запросов между собой. То есть, если мы имеем запросы “как помыть кота”, “ как помыть кота правильно” и “как помыть кота если он боится воды”, то проверка будет проходить следующим образом: сначала система собирает выдачу по всем запросам, затем идет сравнение, если выдача запроса “как помыть кота” пересекается в ТОП 10 с выдачей “как помыть кота правильно” 3 раза (как пример), то данные запросы объединяются. После идет проверка с запросом “как помыть кота если он боится воды”, но если в Soft методе достаточно было 3-х пересечений с запросом “как помыть кота”, то в этом случае для попадания в группу должно быть также 3 пересечения с запросом “как помыть кота правильно”. 

Hard кластеризация является наиболее правильным способом и на текущий момент дает максимально точное соответствие, которое возможно автоматизировать.

Сама по себе кластеризация по ТОПу эффективный метод, который позволяет ориентироваться на поисковую систему - мы уже видим, какие документы считаются релевантными и на основе их может корректировать свои группы и совершать меньше ошибок. 

В любом случае, даже автоматизируя процесс группировки всегда необходимо проверять результаты вручную, чтобы исключить попадание запросов не в те группы либо объединить их основываясь на логике, а не на документах, которые конкуренты посчитали правильным разделить.

Важно! Даже в случае автоматической группировки проверяйте результат вручную.

Например, если конкуренты плохо проанализировали тему, то могут в выдаче можно увидеть разные результаты по запросам: крассула, толстянка, денежное дерево. Хотя это все названия одного растения. Если выдача по этим результатам будет разная, то сервисы автоматической группировки разнесут их в разные группы, хотя по логике - данные запросы должны продвигаться на одной странице.

Кластеризация по словоформе

Группировка запросов по словоформе предполагает объединение запросов на основе их написания. То есть система обрабатывает слова и за счет однокоренных слов, окончаний и прочих параметров объединяет запросы в группы. Данный способ однозначно проигрывает кластеризации на основе выдачи, так как не учитывает смысл фразы, который может быть заложен, в то время как группировка по SERP’у делает это силами Яндекса.

За счет отсутствия ориентации на смыслы этот метод предполагает большое количество ручной проработки и не совсем правильных группировок.

Кластеризация вопрос / не вопрос

Довольно редкий, но все же существующий способ кластеризации - это разделение запросов по принципу является ли запрос вопросом, или нет. Данный способ группировки может подойти для сервисов Q/A (Quest/Answer) на подобии Ответы.Mail.ru, Большой вопрос и прочих. Либо же подобная группировка подойдет для создания раздела Вопрос - Ответ на любом сайте. Создание такого раздела позволяет закрыть малочастотные или единичные запросы которые появляются в нашем семантическом ядре.

Кластеризация может происходить как при помощи сервисов, так и вручную. В основном используются маркерные вопросные слова для фильтрации основного списка запросов:

  • Как;

  • Почему;

  • Зачем;

  • Что;

  • И т.д.

Выделив таким образом пул фраз мы можем в дальнейшем использовать их для наполнения раздела Вопрос - Ответ, если мы не коммерческий проект, так как в коммерции эти вопросы индивидуальны в большинстве случаев.

Программы для кластеризации поисковых запросов

Прогресс не стоит на месте и вебмастера регулярно ищут оптимальные способы для ускорения кластеризации семантического ядра. Ключевым фактором здесь остается качество кластеризации и безупречно сделать это пока не удается, ввиду замысловатых запросов пользователей и, наверно, за счет богатства русского языка.

Кластеризация запросов в Excel

Ручная группировка наиболее доступна для пользователей во всем известной программе Excel от Microsoft. Но для удобства группировки был создан специальный скрипт / макрос под названием “Ядро” от компании MFC. Для работы с ним необходимо:

  1. Скачать файл, предоставив Имя и E-mail.

  2. Запустить файл, вставить в первую вкладку семантическое ядро для обработки.

  3. Во вкладке “Карта” выбрать необходимые критерии кластеризации.

  4. Нажать кнопку “Обработать”, после чего мы получим вкладки с готовыми группами.

Если есть желание проработки ядра вручную, то можно использовать принцип “Рубрика - статья”. То есть мы загружаем наше СЯ в обычный файл Excel, сортируем его и выносим ключевые фразы на основе словоформы в рубрику. Например, ключевое слово рубрики - беседка, мы сортируем ядро по нему и переносим все фразы с этим словом в отдельную вкладку. После чего, уже на этой вкладке идет группировка по кластерам - “как построить беседку”, “как покрасить беседку” и так далее. Минусом является группировка только по словоформе, но это же является и плюсом - мы сможем научиться определять интент пользователя в ходе такой группировки.

KeyAssort

KeyAssort - десктопная программа, разработанная для кластеризации и структуризации семантического ядра. Основными отличиями является:

  • Возможность автоматического построения структуры на основе сгруппированных кластеров;

  • Добавление Middle группировки, помимо Soft и Hard;

  • Анализ не только ТОП 10, но и Топ 5, 15, 20, 30 и 50 учитывая установленный режим (soft, middle, hard);

  • Режим расширения ядра, в котором мы можем выделить основные фразы, к которым будут подобраны дополнительные.

Сама программа получила немало одобрений со стороны пользователей. Утилита является платной, на текущий момент цена составляет 1900 рублей.

Key Collector

Популярная программа Key Collector не только умеет парсить, но и группировать полученные запросы. Для того, чтобы получить информацию по группировке в КК необходимо собрать данные параметра KEI. В текущей версии Кей Коллектора эта кнопка выглядит следующим образом:

Рассчитываем для приоритетной поисковой системы и нужного региона. После того, как мы рассчитали данный показатель необходимо отправиться в Анализ групп

И выбрать следующие настройки группировки

Сила по SERP в данном случае - количество пересечений по выдаче. Можно протестировать различные силы, чтобы выделить наиболее качественную группировку для себя.

Сама программа Кей Коллектор является платной и текущая цена для физических лиц - 1700 рублей. Однако учитывая весь спектр возможностей, она определенно того стоит.

МегаЛемма

МегаЛемма так же многофункциональная программа, кластеризация в которой является не единственной функцией. Программа платная, цена 2500 рублей, лицензия на 1 год.

Основные особенности:

  • Взаимосвязь и возможность создания кампании в Яндекс.Директ из МегаЛеммы.

  • Ориентация на очистку ядра от мусора.

  • Демо-версия без ограничений.

Программа кластеризует на основе словоформ, не ориентируясь на выдачу поисковых систем и тем самым не учитывает смыслы, которые могут быть заложены во фразу. Отсюда большое количество ручной доработки кластеризации.

TopSite

TopSite - программа с большим функционалом, одним из которых является кластеризация запросов. В этой программе кластеризация идет по SERP’у, то есть по выдаче. Степень пересечений довольно гибкая и её можно легко настроить.

Программа является платной, цена бессрочной лицензии на 1 компьютер составляет 1200 рублей.

MindSerp

MindSerp - комплексная программа, одной из функций которых является автоматическая кластеризация запросов. Группировка происходит по выдаче ТОП 10, но есть возможность настроить более глубокую проработку. Количество пересечений для объединения - 4.

Программа является платной, цена 3 000 рублей или 35 $.

Онлайн сервисы для кластеризации запросов

В интернете представлено большое количество сервисов, которые помогают группировать запросы. 

Kg.ppc.panel - сервис для ручной группировки. Добавляем запросы, после чего распределяем их по группам с последующим экспортом. При выгрузке сервис позволяет нам добавить минус-слова для чистки получившихся групп. Подойдет для работы с небольшими ядрами.

Минусом является то, что сервис не чистит дубли и никак вас об этом не предупреждает. На вход лучше подавать уже чистое ядро.

S:toolz - онлайн сервис для автоматической кластеризации запросов. Даем на вход список запросов, получаем группы. Используется метод Hard кластеризации с возможностью задать количество пересечений по ТОП 10. Сервис является платным:

JustMagic - многофункциональный онлайн сервис, в числе инструментов которого есть и автоматическая кластеризация запросов. Используется Hard кластеризация по ТОП 10, количество пересечений 3 и его нельзя изменить. Сервис является частично бесплатным:

Coolakov - онлайн сервис автоматической кластеризации. Используется метод Hard по ТОП 10. Сервис частично бесплатный - для незарегистрированных пользователей допускается до 500 запросов. Более 500:

Seointellect - сервис для автоматической кластеризации запросов. Имеется 3 уровня группировки по SERP’у: Soft, Balance и Hard. Уточнить количество пересечений нельзя. Сервис является платным, но, к сожалению мануала или тарифов на проверку найти не удалось.

Топвизор - комплексный сервис, одна из функций - автоматическая группировка на основе выдачи. В функционале есть кластеризация по методу Soft, Moderate и Hard по ТОП 10. Количество пересечений можно уточнять от 1 до 10. Сервис является платным, цена кластеризации зависит от количества запросов, 1 запрос = 0,3 рубля. Полный обзор сервиса ТопВизор - в этой статье.

SEMparser - онлайн сервис с функцией автоматической кластеризации запросов. Принцип - группировка по ТОП 10, можно установить количество пересечений вручную от 0 до 10. Сервис является платным, приобретается количество запросов, которое можно обработать в программе.

SE Ranking - сервис, включающий в себя инструмент для автоматической кластеризации помимо других. Группировка идет по выдаче ТОП 10, по методу Hard. Одновременно осуществляется сбор частотности запросов. Сервис имеет 2 вида оплаты: за запрос или по методу подписки, есть демо версия.

Rush Analytics - онлайн сервис с большим количеством инструментов, одним из которых является кластеризация запросов. Группировка идет по методу Soft и Hard, ТОП 10 и с настройкой количества пересечений от 3 до 8. Особенностями сервиса является 

  • Автоматическое определение релевантных страниц на вашем сайте. То есть куда должна пойти та или иная группа.

  • Определение коммерческих и информационных запросов.

Сервис является платным, есть скидки за объём.

Keysa - сервис для автоматической группировки запросов. Минус сервиса - группирует по словоформе и уникальным словам, то есть основная часть работы проводится вручную. Сервис ориентирован на группировку запросов для контекстной рекламы.

MC-Castle - бесплатный онлайн сервис автоматической группировки. Принцип работы схож с Keysa - поиск уникальных слов и группировка на основе их повторений. За счет этого программа проигрывает конкурентам, ориентирующимся на выдачу.

Здесь представлены далеко не все представители, предлагающие подобные услуги. Вывод один - выбирать есть из чего, решение остается в цене, в мелочах и в комплексности программ.

Выводы

Кластеризация запросов семантического ядра - важный этап подготовки, от которого зависит не только количество документов на нашем сайте, но и степень проработки смыслов, а соответственно и интерес для пользователей. Для углубления в понимание кластеризации лучше всего один раз попробовать провести ее вручную, а затем применять различные сервисы и программы. Таким образом мы сможем проверить правильность группировки и исправить ошибки до внедрения ядра на сайт. Если мы допустим ошибку - то запрос который оказался “не в своей группе” не продвинется на данной странице, а если такие запросы раскиданы по разным страницам, то возможно потерять и полноценный документ, что сужает наше ядро.

Подводя итоги - собрать полное ядро по ключевым фразам еще не гарантирует успех, только после правильной группировки полностью собранного ядра можно надеяться на качественный фундамент для сайта.