Бинарная сегментация

В прошлый раз мы уже с вами общались на тему самых простых способов сегментации. Думаю, у вас было время не только внимательно почитать материал, но и опробовать данные методы на практике. Сегодня мы с вами перейдём к более сложному виду, к бинарной сегментации (binary segmentation). Этот метод основан на поведенческой сегментации клиентской базы и позволяет лучше понять что происходит с вашими клиентами:

Полученную информацию можно использовать для целевой рассылки, где одних надо поддержать, других удержать, третьих вернуть, а о некоторых и вовсе забыть.

Основным достоинством этого метода есть простота, что не мешает многим компаниям игнорировать подобный анализ и делать рассылки всем обо всем с одинаковыми предложениями, следить за «средним по больнице» показателем прочтения и переходов. Если вы относитесь к одной из таких компаний — ничего страшного, нас много. Но в этой статье я попытаюсь исправить ситуацию.

Какие данные нужны?

Всё что надо для построения отчёта — это данные о покупках: дата покупки и кто её сделал. И всё…

Приступая к анализу данных, в первую очередь надо понять какая оптимальная частота покупок в вашем магазине. Например, в некоторых магазинах — одна покупка в квартал, у других — один раз в неделю. Для нашей системы показатель — минимум одна рассылка в месяц. И если клиент не делал этого действия в течение месяца — это ненормально. Обычно этот период маркетологам известен интуитивно, а как посчитать его «по-научному» мы постараемся рассказать в одной из следующих статей.

Далее, будем считать, что оптимальный период для нас — месяц. Есть ещё один нюанс: анализировать поведение надо на основании достаточно длинного промежутка времени, равного хотя бы 4 периодам. Поэтому в расчёт не берём компании, которые с нами меньше 4 выбранных периодов (недель, месяцев, кварталов, лет).

Приступаем к сегментации

Итак, когда мы определились с начальными параметрами, надо построить табличку для каждого клиента, где в столбцах будут последние четыре периода (для простоты дальше буду писать «месяц») и совершали они покупки или нет.

Клиенты

июнь

июль

август

сентябрь

Клиент 1

покупал

покупал

не покупал

покупал

Клиент 2

не покупал

не покупал

не покупал

покупал

Клиент 3

не покупал

покупал

не покупал

не покупал

Клиент 4

покупал

покупал

покупал

покупал

Теперь, в каждом из столбцов, покупки клиентов представим в виде чисел: совершившим покупки в этом месяце указываем значение 1, если нет — ставим 0. Наша таблица примет вот такой вид:

Клиенты

июнь

июль

август

сентябрь

Клиент 1

1

1

0

1

Клиент 2

0

0

0

1

Клиент 3

0

1

0

0

Клиент 4

1

1

1

1

Потом каждому клиенту мы можем поставить в соответсвие число, состоящее из 4 цифр (0 или 1). Эту последовательность и называют бинарным кодом. Таких кодов (разных комбинаций 0 и 1) будет всего 16:

1111

1110

0000

Каждая комбинация и определяет принадлежность клиента к одному из сегментов. У клиентов каждого сегмента есть своя история, например, сегмент 1111 — это те, кто постоянно с нами (наши VIP-клиенты), а 0000 — зарегистрированные у нас клиенты, которые вообще не покупают, это потерянные клиенты. Традиционно, для клиентов каждого сегмента опеределяется важность из расчета, чем ближе к текущему моменту была покупка и чем чаще покупал клиент раньше, тем выше его значимость.

Для расчёта значимости предлагается простая формула:

1*(1ая цифра) + 2*(2ая цифра) + 4*(3ая цифра) + 8*(4ая цифра).

Например, для 1111 это значение будет равно 1+2+4+8 = 15, а для 1101 1+2+0+8=11

Эффективный email-маркетинг с eSputnik

Регистрация

Расчёт значимости сегмента

Эти числа не дают ответа на вопрос: "а насколько 14 хуже 15"?

Для полноты картины добавляем ещё один месяц, чтобы быть более точными в расчётах и узнать, кто совершал покупки в следующем месяце:

Клиент

июнь

июль

август

сентябрь

октябрь

Клиент 1

1

1

0

1

0

Клиент 2

0

0

0

1

1

Клиент 3

0

1

0

0

1

Клиент 4

1

1

1

1

0

Полученные результаты группируем по сегментам и считаем, сколько контактов из сегмента сделали покупку в следующем месяце. В нашем примере в октябре.

июнь июль август сентябрь Число клиентов
на конец периода
Число клиентов
купивших в октябре
Доля клиентов, сделавших заказ
в октябре
1 1 1 1 94 83 88%
1 1 1 0 19 6 32%
1 1 0 1 16 7 44%
1 1 0 0 23 4 17%
1 0 1 1 11 9 82%
1 0 1 0 9 4 44%
1 0 0 1 9 2 22%
1 0 0 0 54 5 9%
0 1 1 1 30 17 57%
0 1 1 0 17 3 18%
0 1 0 0 7 2 29%
0 1 0 0 43 6 14%
0 0 1 1 31 18 58%
0 0 1 0 51 8 16%
0 0 0 1 110 36 33%
0 0 0 0 1152 77 7%

Теперь мы знаем, с какой вероятностью от нас может уйти клиент, покупавший 4 месяца подряд. Для того, чтобы получить более точные представления об этих цифрах, посчитайте те же данные сместив период на один, два или три месяца назад. Обычно эти показатели сильно не меняются, если вы не предпринимали никаких действий для этого.

Таблица нам показывает, что чем выше процентный показатель (который мы получили в процессе сегментации), тем выше вероятность, того что клиент будет совершать покупки в ближайшее время. Долю клиентов с низкими показателями трудно определить к какому-то определённому этапу жизненного цикла. Клиент может только начинать работать с нами, находится на стадии роста или же наоборот упадка. Зато клиентов с высокими показателями (хотя бы от 85%) можно определить, как VIP, которые приносят постоянный доход.

Никому не верьте

Забавно, что «классическая» последовательность важности клиента в зависимости от «веса» не всегда подтверждается практикой. Например, в одной из компаний я видел такую картину:

Сегменты Вероятность покупки «Вес клиента»
x1111 86.7% 15
x1011 76.5% 13
x0111 64.6% 14
x0011 60.7% 12
x1101 50.0% 11
x1110 46.6% 7
x0001 43.3% 8
x0101 37.6% 10
x1010 27.3% 5
x1001 25.9% 9
x0110 21.7% 6
x0010 14.3% 4
x1100 12.7% 3
x0100 9.9% 2
x1000 8.4% 1
x0000 6.7% 0

Выходит, что 1110 может быть значительно перспективнее, чем 0101. Например, здесь видно, что даже те, кто на 4 месяца забыли о компании, всё равно могут возвратиться. А вы знаете, как дела обстоят у вашей компании? Если нет — попробуйте узнать уже прямо сегодня.

Если статья понравилась — ставьте лайк, а мы продолжим готовить серию постов о «продвинутых методах сегментации». Следующие на очереди статьи о RFM, eRFM и когортном анализе. Будут вопросы — обращайтесь;)

Хотите провести бинарную сегментацию контактной базы клиентов вашего бизнеса?

 

 

Даже если вы не нашли интересующие вас функции в списке возможностей eSputnik, мы открыты к предложениям и внедрим решения, способные повысить эффективность работы с системой.