Составление полного семантического ядра в Key Collector | Кластеризация запросов

Семантика в KeyCollector

Сбор семантического ядра в Кей Коллектор это сплошное удовольствие, я говорю эти слова без преувеличения. Данная программа очень многое умеет по сравнению с упрощенной версией младшего брата СловоЁб, о котором я уже писал в предыдущем посте.

О словоебе я говорил, что это программа только под поисковую систему Яндекс, а вот Коллектор заточен под Google, Yandex, Rambler, Mail и даже в последних версиях парсит запросы с YouTube.

Практические советы перед работой с Key Collector

Практические советы по семантике

Советы, которые я сейчас вам дам, основаны на собственной практике, возможно ваш опыт предполагает другую схему или тактику по сбору семантики с этой программой, вы можете это высказать в комментариях. А я напишу, как это видится мне и данный подход экономит здорово время и упрощает труд.

Определитесь с основными направлениями вашего сайта

Есть два пути кластеризации семантического ядра сайта:

  1. Перед сбором семантики заранее продумываем группы для запросов
  2. Проводим кластеризацию исходя из уже имеющихся спарсеных запросов.

Немного о преимуществах и недостатках каждого из них. Если идти первым путем, этот метод экономит время и упрощает сбор семантики, но здесь определенно нужно знать и понимать для какой цели делается ресурс.

Как пример, я делаю блог о болезни Туберкулез, все, что мне нужно пойти в больницу и просто узнать какие виды обострения есть это будет основа для групп запросов. Второе подумать какими методами можно лечить: народным, в больнице, магически… Это еще дополнительные группы к запросам.

Аналогично можно распределить по товарам, если вы продаете через интернет магазин и товар не расширяется, а вы работаете с определенными группами, так как есть постоянный оптовый поставщик.

Недостаток этого варианта, вы заранее определяете группы и соответственно ключи которые могут косвенно быть вам полезны, но не относятся к вашим группам не попадут в ваш список.

Второй вариант, где мы проводим кластеризацию уже по готовому списку ключей, он хорош тем, что охват мусорной базы может быть как 10 000 запросов, так и несколько миллионов! Но здесь есть беда, сгруппировать и почистить такую базу бывает очень и очень проблемно и долго.

Какой вариант лучше для вас, я не знаю, все рассматривается индивидуально и из личного опыта. Я буду показывать все примеры по первому варианту, когда нам уже известны группы, а в самом конце статьи подскажу, как можно узнать и расширить свое ядро в любой момент, при необходимости.

Основные группы для KeyCollector

Под каждую группу прорабатываем всевозможные синонимы, дабы сделать побольше охват. Я буду приводить пример на запросе «верстка сайта», первое, что нам нужно сделать, это пойти в wordstat.yandex.ua и ввести запрос, а далее смотреть в правой колонке схожие запросы.

Yandex Wordstat

Вот таким простым способом мы получили еще 10 запросов в нашу группу, разве не круто?! Также следует использовать разные синонимайзеры в интернете, но есть одно но, не всегда по вашему слову будут даны адекватные синонимы, но пробовать нужно. Чем шире охват слов перед парсингом в КК, тем лучше будет охват группы.

Если у вас есть аккаунт в serpstat с тарифом Standart или выше, рекомендую воспользоваться вкладкой похожие фразы и выгрузить подходящие предлагаемые фразы.

Похожие фразы

И таким образом мы получаем с одного запроса группы уже 10, а то и 20 запросов, согласитесь это намного круче, чем 2 слова. Следующий шаг, это настройка программы Key Collector таким образом, чтобы спарсить максимально семантику и не болучить бан от поисковых систем, ну и для понимания, что можно, а что нельзя.

Настройка Кей Коллектор

Настройка -> Парсинг -> Общие

Настройка парсинга

Переходим в настройки программы (шестеренка в самом верхнем меню программы), вкладка парсинг и под вкладка общие, я обычно изменяю количество слов для ключевых фраз. По умолчанию стоит 10, я юзаю 8 или 7. Почему? Даже не знаю, вот не нужны мне запросы на 10 слов, реально не нужны )))

Настройка -> Парсинг -> Yandex.Wordstat

Парсинг вордстат

Следующее, что следует настроить, это парсинг через Яндекс Вордстат, указываем какая глубина парсинга будет выполняться, если ставим 0, то будут собраны все ключи по заданному слову, если же зададим 1, то будет собраны все ключи, а потом будет сделан парсинг каждого из них еще раз. То есть к примеру на первом круге будет собрано 600 ключей, второй круг, это проход каждого из этих 600 еще раз. Не рекомендую это делать!

Настройка -> Парсинг -> Yandex.Direct

Яндекс Директ

Идем в настройку Yandex Direct и вводим два аккаунта зарегистрированные в Яндекс. Ни в коем случае не ставьте свой рабочий аккаунт на котором вы ведете почту. Парсинг через КК, это не совсем белый метод, а тем более на потоке и автомате, ваш аккаунт просто могут забанить, поэтому регистрируете себе чистый не нужный почтовик в Яндексе и его используете. Если вы будете парсить со своего IP без списка прокси, тогда ставим количество потоков 1 не более!

Настройка -> Антикапча -> Автораспознавание капчи

Антикапча

Очень часто при парсинге большого объема информации, ваш IP может получить временную блокировку, которая будет выводиться вам в виде всплывающих окон с просьбой ввести капчу. Это может продолжаться очень часто и вы просто устанете все вводить руками.

Поэтому в КК есть настройка Антикапча, где можно выбрать любой из предоставленных сервисов и пополнив его использовать по полной. То есть уже не вы будете вводить капчу руками, а какой-то школьник, желающий заработать пару центов в интернете. Я использую руКапчу, так как там самая дешевая стоимость одного ввода капчи. Достаточно пополнить на рублей 200 и этого вам хватит с головой на долгие месяцы.

Настройка -> Парсинг -> Подсказки

Поисковые подсказки

В настройках подсказок желательно сделать такие настройки, как у меня, если вы впервые работаете с этой программой и у вас нет оснований изменять настройки под себя. Также обратите внимание настройку домена, если вы парсите подсказки в Украине, ставите com.ua, России — ru, то есть в зависимости от региона указываете нужный домен.

Сбор семантики в Key Collector, практическое руководство

После того, как мы закончили с настройками программы пришло время взяться за получение поисковых фраз при помощи имеющего функционала. Я распишу метод, который очень хорош на нынешний момент, это не значит, что вы будете использовать такие же, но на состояние 2016 года этого достаточно!

Этапы сбора ключей

На скриншоте я указал последовательность парсинга в одну группу запросов. То есть, тот список слов, которые мы с вами собрали в начале статьи мы будем использовать во всех 4 пунктах. Давайте разберем каждый из них подробнее, чтобы вы понимали, что и зачем нужно!

Пакетный сбор из левой колонки Яндекс Вордстат

Указываем регион в Яндекс

Перед тем, как приступить к парсингу, нам нужно указать регион в котором будет проводиться сбор слов и соответственно частотность запросов будет по этому региону. Указываете тот, под который вы создаете ресурс, для информационных сайтов, можно использовать к примеру СНГ, чтобы побольше спарсить данных.

Сбор ключей в Яндекс

По нажатию соответствующей иконки, вам будет предложено ввести стартовый список слов, для сбора ключевых слов с левой колонки Yandex Wordstat. Задаете те слова, которые уже отобраны по описанным методам в начале этой статьи и запускаем сбор.

Пакетный сбор слов из Google AdWords

Пакетный сбор слов в Google

Нам не обязательно дожидаться окончания загрузки парсинга по Яндекс, мы можем смело запускать сбор ключей в Google AdWords, что делать, думаю уже понятно, вводим те же самые ключи, что и в Яндекс вводили, ставим нужные галочки и парсим. Но, здесь регион нужно задавать в ручном режиме, кликаем на ссылку «вручную через IE» и вводим данные, которые мы использовали для настройки Гугла выше,  в разделе настройки.

Настройка региона для Гугл

Вот так задаются настройки в Гугл Эдвордс через браузер IE, у вас получится )))

Пакетный сбор поисковых подсказок

Пакетный сбор подсказок

В поисковых подсказках, задаем нужные ПС, главное понимать под какой регион мы парсим подсказки. От того, что мы везде проставим галочки лучше нам не будет, поэтому выбираем то, что реально нам нужно, то есть приоритетные поисковые системы.

Сбор расширений ключевых фраз

SerpStat

Завершающим шагом по сбору слов будет парсинг фраз из сервиса SEMRush или SerpStat, оба требуют наличия платной подписки, что конечно будет проблемой, для вас, если вы не на столько обширно используете эти сервисы. Без этого пункта можно обойтись, это скорее уже этап профи или полу профи, ничего, я уверен когда нибудь и вы будете использовать данные инструменты, не все сразу!

Дополнительные ключи для уже существующих сайтов

Возможно вы собираете семантику под уже имеющийся сайт, то есть не под молодой начинающий проект, тогда вам могут пригодиться выгрузки запросов из Yandex.Metrika и Google Analytics:

Экспорт ключей

Авторизуемся с аккаунта на котором у нас привязан сайт и получаем нужные данные, я сейчас это демонстрировать не буду, но если это вам нужно и не сумеете разобраться, пишите в комментариях, я добавлю этот пункт сюда!

Чистка мусорных запросов из собранной базы

Мы получили довольно внушительный список ключевых слов с указанных выше каналов, но их настолько много, что не верится в их реальную ценность. И вы правы, среди полученного количества фраз, есть очень много мусора, с которым мы прямо сейчас начнем бороться!

В зависимости от направления тематики под которую вы собираете семантику, следует поискать уже готовые списки минус слов или стоп слов. К примеру, если вы продвигаетесь под определенный регион, вам нужно сразу отминусовать всевозможные города России, Украины, Белоруссии и т.д. Можно поискать готовые списки минус слов под тематики.

Чистка минус слов по готовым базам

Используя базу с городами добавим ее в Кей Коллектор.

Стоп слова городов

Можно использовать два способа:

  1. Добавление списка из буфера обмена системы
  2. Загрузить из файла txt

Переименовать группу минус слов

После того, как добавили группу с минус словами, ее нужно переименовать, чтобы понимать какая группа в дальнейшем, ибо их может быть у нас очень много!

Отмечаем минус слова

Отмечаем фразы в нашем списке и удаляем при помощи красного крестика удалить. Таким образом мы почистили в пару кликов наш список от всех запросов содержащих города.

Ручная чистка минус слов

Открываем наши минус слова и создаем группу с названием, которое поможет понять, что это за база слов у вас используется. Если у вас очень много групп, то стоит написать в название к какой группе этот список относится.

Ручная база минус слов

Это подготовка пустой группы в которую мы сейчас будем в ручном режиме добавлять список ненужных, мусорных запросов. Логика следующая, смотрим список слов, который у нас есть после всех видов парсинга и когда видим, что-то не нужное, лишнее удаляем по следующей схеме:

Собираем слова в ручном режиме

Таким методом намного дольше чистить, чем просто взять и подгрузить список городов, но! это дает ощутимую чистоту вашим запросам. У меня по запросу «верстка сайта» вышло около 3600 фраз, я их просмотрел примерно за минут 20, не скажу что быстро, но и не долго! А иначе никак, хотите хорошую семантику придется поработать.

Чистка минус слов при помощи анализа групп

Анализ групп в KeyCollector

Данный функционал программы позволяет сгруппировать слова по входящим в них словам для удобной ручной фильтрации. В этих группах проходим по всему списку и если видим группу, которая явно нам не нужна, ставим сразу напротив нее галочку.

Минусуем группы

После того, как прошлись по всем группам до самого конца списка, проделаем следующее, добавим все слова в наш список минус слов, они нам могут еще пригодиться.

Группа по стоп словам

Для вызова окна, которое выше, нужно сделать правый клик на любой выделенной группе и выбрать из списка «Отправить все слова из определений  целиком отмеченных групп в окно стоп-слов».

Добавляем стоп-слова

Пролистайте отмеченные слова, если там нет нужных вам, укажите группу минус слов, куда будут добавлены и эти слова, вот таким способом мы получили еще порцию ненужных запросов!

Чистка слов через «неявные дубли»

Сейчас мы удалим неявные дубли запросов, но для этого придется немного спарсить с Гугла статистики. Перед тем, как запускать парсинг, фильтруем колонку с частотностью по Гуглу. Так как мы делали парсинг через сервис SerpStat и у нас уже есть часть слов с частотностью запросов, мы их отфильтруем, а для остальных запустим парсинг.

Частота Google AdWords

После таких параметров в столбце с данными частоты по GA мы получим запросы у которых нет данных, вот для них и запускаем парсинг.

Сбор с Гугл Эдвордс

В зависимости от количества слов в вашей группе, это может занять от пары минут, до нескольких часов. Понимаю, не мигом,но подумайте, как приятно понимать, что вы делаете свою работу качественно и у вас будет чем гордиться позже!

Сортировка по убыванию

Далее сортируем запросы по убыванию, это нам понадобится в следующем шаге, ради чего мы собственно и собирали частоту по Гуглу.

Удаление дублей

Переходим во вкладку «Данные», далее в «анализ неявных дублей», выполняем умную группировку и удаляем все дубли. Из-за того, что мы все отсортировали по убыванию и сняли частотность, в итоге получаем только более частотные запросы, а менее частотные будут удалены.

Группировка запросов в Key Collector

Существует очень огромное количество сервисов для группировки запросов (кластеризация). Но раз уж мы в этом посте работаем сугубо с Коллектором, то и группировку проведем в нем. Что нам нужно сделать для получения группировки?

  1. Определяемся под какой регион и какую поисковую систему будем собирать группировку
  2. Собираем для этой зоны KEI
  3. Производим группировку запросов

Задаем регион для KEI

Я буду парсить KEI по Гугл, поэтому задал регион Россия, как говорят коллеги из SEO Profy там лучше структурированы сайты, соответственно под них лучше спарсится. Если вы нацелены в основном под Яндекс, тогда задаете регион рядом, относящийся к ПС Яндекс.

Получение KEI

Как и писал выше, я беру данные с Гугла, вы же можете пропарсить и Яндекс. Скажу по правде парсинг KEI это не шуточное дело и весь процесс может занять довольно много времени и вот здесь прокси были бы, как нельзя кстати, а иначе будьте готовы получить много капчи!

Группировка на основе выдачи Google

Группировка по Google выдаче

После указанных настроек, как я показал на скриншот выше, вы получаете готовые кластеры по вашим ключам. Также можно поиграть с параметром «сила связи SERP» и просмотреть на качество группировки.

Сила связи SERP

Внимательно просмотрите, какие группы создает KeyCollector при использовании разного уровня силы связи. Оптимальные значения это: 4, 5, 6. Но все зависит от тематики и индивидуальности подхода.

Экспорт групп с KeyCollector

По завершению кластеризации мы можем в один клик получить экспорт готовых ключей. Это делается очень просто и на выходе мы получаем примерно вот такую картину:

Кластеры в Excel

Если учитывать мой опыт по различным сервисам по кластеризации, то КК примерно получает 8 из 10. Где  пару баллов я добавил за абсолютную бесплатность. Да, да я даже не использую прокси, большие задержки между запросами и мы получаем готовую разбивку.

Подведем итоги по работе с семантикой в Кей Коллектор

Мы с вами прошли этап сбора, чистки и кластеризации ключей для одной группы (категории товара, если у вас интернет магазин), таких групп может быть как 5 -7, так и более 30 или даже 50. Думаю вы понимаете, что по каждой из них нужно будет проделать тоже самое. Да, это долго, нудно и т.д., но это почти бесплатно и это колоссальный опыт для вас.

Набив руку вы сможете спокойно в будущем предоставлять такие услуги по сбору семантики для клиентских проектов, стоит это дело не дешево, так что это один из видов заработка!

Сделать группировку это так сказать половина дела, заключающим этапом в работе с семантикой и кластеризацией есть создание структуры по уже готовым группам. Шаг довольно важный и также занимает не мало времени, но это уже будет другая история и другая статья!

P.S. Не забудь поделиться с друзьями и коллегами!

Поделись с друзьями:

27 thoughts on “Составление полного семантического ядра в Key Collector | Кластеризация запросов

  1. Мне кажется. что для новичков больше подходит второй способ кластеризации. Более громоздкий, конечно, и времени потребует больше, но зато пока делаешь, точно разберешься. Ну а время можно заранее запланировать, помня, что спешка хороша только при ловле блох.

  2. Как мне не хватало подобного мануала, когда я только приобрел Key Collector за огромную сумму в 1500 рублей. На сайте автора все было конечно, но на тот мой период развития приспособиться к работе к программой было трудновато. Тем более, что я люблю нажимать все кнопки сам 🙂

  3. Действительно очень полезная статья. Оказывается я использовала Кейколлектор не на полную мощность и попробую собрать в соотвествии в Вашими рекомендациями и сравню. В целом, программа очень интересная и полезная и думаю, что практически все при сборе семантики ее используют.

  4. Кейколлектор действительно потрясающий софт. Мне кажется более нет ничего подобного на данный момент. Использую кейколлектор для сбора ключей для рекламных кампаний. Даже трудно самому представить, сколько времени он мне сэкономил.

  5. По рекомендациям друзей приобрел себе KK, но долгое время не знал что с ним делать. Благодаря вашей статье я наконец-то начал им пользоваться и понял насколько же крутая штука КК и что все кто против него — просто не умеют им пользоваться. Что меня особо порадовало, так это максимально детальная пошаговая инструкция, раньше я таких не встречал. Спасибо за отличный обзор!

  6. Однозначно в закладки! Много написано про сбор семантики, но чтобы вот так четко и подробно, по шагам редко встретишь. Как раз и искал нечто подобное. Вчера приобрел Кей коллектор, буду собирать ядро по стройке по вашей инструкции, спасибо за подробный мануал.

  7. Я оставил репосты и лайки, что бы получить доступ к закрытому разделу со стоп словами. Но увы у вас не работает механизм.. и информацию по стоп словам, спискам стоп слов я не получил. Увы, в этой части развод (((((

  8. Я долго и много читал про КК, но однозначно статья вполне полезная. Особенно хорошо, что все визуализировано в картинках. Все четко и понятно. Думаю, что скоро надо будет вплотную заняться этоу программой.

  9. Я для сбора ключевых запросов использую программу Magadan. Она тоже платная. Цена — такая же, как и стоимость Key Collector. Пользуюсь ей уже несколько лет. Ее относительный недостаток — она заточена под Яндекс. Собственно, на этом недостатки заканчиваются.

    Однако для дальнейшего развития думаю приобрести Key Collector. В этом смысле настоящая статья — прекрасный материал, по которому, насколько я сейчас могу оценить, можно быстро и, самое главное, в полном объеме научиться работать в Key Collector.

    Благодарю! Сохранил статью у себя в закладках.

  10. Наконец-то! Приобрел Key Collector несколько месяцев назад. После долгих попыток эксплуатации был разочарован, пытался найти какие то манулалы, но в итоге получалось полное «не то». Прекрасная статья, всё четко и, что самое главное, последовательно. Теперь я совершенно новыми глазами взглянул на программу, жаль что время сейчас познее, уже руки чешутся всё попробовать заново. Завтра с утра начну парсить:)

  11. Здравствуйте, статья действительно очень полезная. Единственное обратите внимание на ту базу минус слов которую вы скрыли под сац замок, по ссылке базы уже нет, обидно…

    1. Сори, сайт был на поддомене другого блога, исправил ссылку, отправил вам на почту базу! Спасибо за соц активность!

  12. Подскажите, а чем сейчас можно и актуально проверить обратные ссылки на сайт и на конкретную страницу?

  13. Отличная статья, спасибо! А где бы еще найти описание по составлению ТЗ на контент по подобному, большому сем.ядру?!

  14. А кластеризацию кейколлектор делает правильно или же стоит использовать сторонние сервизы ?

    1. Все зависит, как вы его настроите… А вообще есть сервисы, которые и похуже делают ))

  15. Насколько я понял запросы в вордстате в приведенном примере в кей коллекторе проверяются без кавычек, то есть получается частотность не верно определяется. Например запрос «верстка сайтов» с кавычками и без даст разную частотность 175 и 1030. Разве не должны запросы набираться в кавычках для определения точной частотности?

    1. Если вам нужна точная частотность, то ставите кавычки и даже знак восклицания, а если нет, то собираете, как есть

  16. Если тематика очень узкая и нашлось всего 10 ключей, через КК собралось от силы 30-40 с указанием первоначального списка в 10 ключей, что тогда делать?

    1. 1. Смотреть конкурентов
      2. Смотреть синонимы
      3. Уточнять у владельца бизнеса, как еще могут называть его товар

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *