Автоматизация генерации URL посадочных страниц для категорийных запросов

Автоматизация генерации URL посадочных страниц для категорийных запросов

Речь пойдет об автоматизации генерации landing page для категорийных кампаний в системах контекстной рекламы. Перед прочтением рекомендуем ознакомиться с первыми двумя статьями и скачать прилагаемые файлы. (Анализ больших семантических ядер, или «Робот-распознаватель», Лемматизация в Excel, или «Робот-распознаватель 3.0»)

Сегодняшняя статья будет полезна сотрудникам рекламных агентств и маркетологов на стороне клиента, самостоятельно ведущих рекламные кампании в Google AdWords и Яндекс.Директ. К сожалению, если ваш профиль – сфера услуг, у вас сайт-одностраничник и т.п., данная статья – не для вас. Если же на вашем сайте много, например, 30 и более вариантов рекламных landing page – welcome! Кому это может быть интересно в первую очередь:

1. Интернет-магазинам

2. Различного рода агрегаторам товарных и других предложений от множества поставщиков

3. Арбитражникам :)

ИТАК:

Кто работает с системами контекстной рекламы, наверняка сталкивался с этим важным аспектом во время запуска рекламных кампаний – как быстро прописать для большого количества запросов много качественных релевантных посадочных.

Как известно, от того, насколько релевантна будет посадочная страница запросу пользователя, в конечном счете зависят ваши CR и CPO. Однако, если у вас семантическое ядро, скажем, из 5000 запросов, каждый из которых является комбинацией нескольких параметров, прописать каждому такому товару абсолютно релевантную посадочную становится довольно трудозатратно. Допустим, вы продаете слонов.

У вас есть слоны разных:

  1. размеров (большие, маленькие, миниатюрные, гигантские, огромные…)
  2. цветов (розовые, черные, белые, синие…)
  3. комплектаций (с ногами, ушами, глазами)
  4. спецификаций (четырехногие, длинноносые, гладкошерстные)
  5. стран происхождения (Африка, Индия, …)
  6. эксклюзивности и дороговизны (недорогие, дорогие, элитные, редкие, премиум класса…)

Это только если вы продаете слонов. А если не их, то можно еще добавить комплектацию, бренд, год производства, модель… и еще много чего, чем можно описать ваш товар/услугу.

И вот у вас четырех или даже пятизначное число низкочастотных запросов вида «купить большого элитного розового слона из Индии», с текстами вы кое-как разобрались, посадочных еще нет, а запуск завтра.

Что делать?

Как правило, большинство сайтов в сфере e-commerce передают вышеуказанные категории через дополнительные параметры в URL. Заходим в категорию товаров «слоны» там присутствуют списки фильтров по категориям, обычно в виде чекбоксов, иногда в виде кнопок, кто во что горазд.

Итоговая посадочная будет чем-то вроде:

http://realweb.ru/catalog/slony/?razmer=bolshoy&tsvet=rozoviy&strana=afrika&...

Параметры могут быть очевидными, как в данном примере, а могут быть и неочевидными, передаваться численными значениями. Например:

http://realweb.ru/catalog/slony/?set_filter=y&arrFilter_36_629568842=Y&arrFilter_35_833187184=Y&arrFilter_17_4151095074=Y&arrFilter_32_3608472104=Y

Бывают и сайты, где под каждую категорию запроса – своя посадочная, в виде:

http://realweb.ru/catalog/slony/s_nogami/dlinnonosye/bolshie/afrika/

При этом CMS генерирует контент страницы на основе URL, а не параметров, а URL автоматически меняется при выставлении параметров, при этом порядок категорий в URL не играет роли, т.е. теоретически имеется бесконечное количество посадочных. Что объединяет все эти типы посадочных? Изъясняясь терминами морфологии, мы имеем общий «корень» -http://realweb.ru/catalog/slony/ - и имеем различные «суффиксы», порядок которых обычно не важен.

К чему сводится в итоге наша задача? К двум этапам:

  1. Выяснить, какой «суффикс» какому слову в запросе соответствует.
  2. Автоматически добавить к исходному URL все суффиксы, соответствующие содержимым словам-эпитетам из запросов.

Первый этап можно сделать вручную (обычно недолго, если у вас не огромный ассортимент с огромным количеством категорий и фильтров), а можно спросить у разработчика сайта, наверняка он сможет вам предоставить такую таблицу, в которой в первом столбце будут параметры, а во втором – что они означают (какой эпитет какой категории).

Второй этап – кластеризации и лемматизации семантического ядра, файл «Робот-распознаватель». Первая версия файла была только про кластеризацию, вторая - и про кластеризацию, и про лемматизацию.

По ссылке (https://yadi.sk/d/rbkbaeY8kQJKy) можно скачать пример данного файла, адаптированный под нашу задачу со слонами.

Запросы сгенерированы искуственным образом. Что нужно сделать - нажать 2 кнопки:

  1. Сначала лемматизировать текст - это нужно для того, чтобы не приходилось для всех словоформ проставлять один и тот же параметр (купить розового слона, розовые слоны, выбор розовых слонов).
  2. Затем нажать макрос «с категориями» - он находит слова-маркеры и проставляет их категории. В данном случае категориями являются фильтры (в предыдущих статьях категориями были категории запросов, например, минус-слова).

Что получаем на выходе: параметры для каждого запроса, которые остается добавить к основной ссылкеhttp://realweb.ru/catalog/slony/ (функция «=СЦЕПИТЬ»), и удалить пробелы.

Пара примечаний:

  1. Макрос лемматизации достаточно быстрый, практически мгновенный (оптимизирован алгоритм), второй же макрос не оптимизирован, может исполняться более длительное время на слабых машинах. Может потребоваться около минуты, нужно просто подождать, результат в любом случае себя оправдывает. В ближайшее время будет оптимизирован и будет выложена новая версия.
  2. Таблица соответствий «эпитет-параметр» должна быть сортирована по алфавиту – только так работает макрос.
  3. Макросы ищут только отдельные слова, поэтому, если у вас бренды из 2х и более слов, сложные цвета (черно-белый, сине-зеленый и т.д.) – как в исходных данных, так и в таблице соответствий они должны быть 1-м словом, например через дефис. Либо нужно искать 1 слово, например «Gabbana» для запроса “Dolce & Gabbana”.

Возврат к списку

Мы отправляем только полезные и интересные материалы