08 октября 2013
9038
14 мин
3.19
Бинарная сегментация
В прошлый раз мы уже с вами общались на тему самых простых способов сегментации. Думаю, у вас было время не только внимательно почитать материал, но и опробовать данные методы на практике. Сегодня мы с вами перейдём к более сложному виду, к бинарной сегментации (binary segmentation). Этот метод основан на поведенческой сегментации клиентской базы и позволяет лучше понять что происходит с вашими клиентами:
-
кто покупал регулярно, и вдруг перестал;
-
кто ваши постоянные и надёжные клиенты;
-
кого мы теряем;
-
кого уже потеряли.
Полученную информацию можно использовать для целевой рассылки, где одних надо поддержать, других удержать, третьих вернуть, а о некоторых и вовсе забыть.
Основным достоинством этого метода есть простота, что не мешает многим компаниям игнорировать подобный анализ и делать рассылки всем обо всем с одинаковыми предложениями, следить за «средним по больнице» показателем прочтения и переходов. Если вы относитесь к одной из таких компаний — ничего страшного, нас много. Но в этой статье я попытаюсь исправить ситуацию.
Какие данные нужны?
Всё что надо для построения отчёта — это данные о покупках: дата покупки и кто её сделал. И всё…
Приступая к анализу данных, в первую очередь надо понять какая оптимальная частота покупок в вашем магазине. Например, в некоторых магазинах — одна покупка в квартал, у других — один раз в неделю. Для нашей системы показатель — минимум одна рассылка в месяц. И если клиент не делал этого действия в течение месяца — это ненормально. Обычно этот период маркетологам известен интуитивно, а как посчитать его «по-научному» мы постараемся рассказать в одной из следующих статей.
Далее, будем считать, что оптимальный период для нас — месяц. Есть ещё один нюанс: анализировать поведение надо на основании достаточно длинного промежутка времени, равного хотя бы 4 периодам. Поэтому в расчёт не берём компании, которые с нами меньше 4 выбранных периодов (недель, месяцев, кварталов, лет).
Приступаем к сегментации
Итак, когда мы определились с начальными параметрами, надо построить табличку для каждого клиента, где в столбцах будут последние четыре периода (для простоты дальше буду писать «месяц») и совершали они покупки или нет.
Клиенты |
июнь |
июль |
август |
сентябрь |
---|---|---|---|---|
Клиент 1 |
покупал |
покупал |
не покупал |
покупал |
Клиент 2 |
не покупал |
не покупал |
не покупал |
покупал |
Клиент 3 |
не покупал |
покупал |
не покупал |
не покупал |
Клиент 4 |
покупал |
покупал |
покупал |
покупал |
Теперь, в каждом из столбцов, покупки клиентов представим в виде чисел: совершившим покупки в этом месяце указываем значение 1, если нет — ставим 0. Наша таблица примет вот такой вид:
Клиенты |
июнь |
июль |
август |
сентябрь |
---|---|---|---|---|
Клиент 1 |
1 |
1 |
0 |
1 |
Клиент 2 |
0 |
0 |
0 |
1 |
Клиент 3 |
0 |
1 |
0 |
0 |
Клиент 4 |
1 |
1 |
1 |
1 |
Потом каждому клиенту мы можем поставить в соответсвие число, состоящее из 4 цифр (0 или 1). Эту последовательность и называют бинарным кодом. Таких кодов (разных комбинаций 0 и 1) будет всего 16:
1111
1110
…
0000
Каждая комбинация и определяет принадлежность клиента к одному из сегментов. У клиентов каждого сегмента есть своя история, например, сегмент 1111 — это те, кто постоянно с нами (наши VIP-клиенты), а 0000 — зарегистрированные у нас клиенты, которые вообще не покупают, это потерянные клиенты. Традиционно, для клиентов каждого сегмента опеределяется важность из расчета, чем ближе к текущему моменту была покупка и чем чаще покупал клиент раньше, тем выше его значимость.
Для расчёта значимости предлагается простая формула:
1*(1ая цифра) + 2*(2ая цифра) + 4*(3ая цифра) + 8*(4ая цифра).
Например, для 1111 это значение будет равно 1+2+4+8 = 15, а для 1101 1+2+0+8=11
Эффективный email-маркетинг с eSputnik
Расчёт значимости сегмента
Эти числа не дают ответа на вопрос: "а насколько 14 хуже 15"?
Для полноты картины добавляем ещё один месяц, чтобы быть более точными в расчётах и узнать, кто совершал покупки в следующем месяце:
Клиент |
июнь |
июль |
август |
сентябрь |
октябрь |
---|---|---|---|---|---|
Клиент 1 |
1 |
1 |
0 |
1 |
0 |
Клиент 2 |
0 |
0 |
0 |
1 |
1 |
Клиент 3 |
0 |
1 |
0 |
0 |
1 |
Клиент 4 |
1 |
1 |
1 |
1 |
0 |
Полученные результаты группируем по сегментам и считаем, сколько контактов из сегмента сделали покупку в следующем месяце. В нашем примере в октябре.
июнь | июль | август | сентябрь | Число клиентов на конец периода |
Число клиентов купивших в октябре |
Доля клиентов, сделавших заказ в октябре |
---|---|---|---|---|---|---|
1 | 1 | 1 | 1 | 94 | 83 | 88% |
1 | 1 | 1 | 0 | 19 | 6 | 32% |
1 | 1 | 0 | 1 | 16 | 7 | 44% |
1 | 1 | 0 | 0 | 23 | 4 | 17% |
1 | 0 | 1 | 1 | 11 | 9 | 82% |
1 | 0 | 1 | 0 | 9 | 4 | 44% |
1 | 0 | 0 | 1 | 9 | 2 | 22% |
1 | 0 | 0 | 0 | 54 | 5 | 9% |
0 | 1 | 1 | 1 | 30 | 17 | 57% |
0 | 1 | 1 | 0 | 17 | 3 | 18% |
0 | 1 | 0 | 0 | 7 | 2 | 29% |
0 | 1 | 0 | 0 | 43 | 6 | 14% |
0 | 0 | 1 | 1 | 31 | 18 | 58% |
0 | 0 | 1 | 0 | 51 | 8 | 16% |
0 | 0 | 0 | 1 | 110 | 36 | 33% |
0 | 0 | 0 | 0 | 1152 | 77 | 7% |
Теперь мы знаем, с какой вероятностью от нас может уйти клиент, покупавший 4 месяца подряд. Для того, чтобы получить более точные представления об этих цифрах, посчитайте те же данные сместив период на один, два или три месяца назад. Обычно эти показатели сильно не меняются, если вы не предпринимали никаких действий для этого.
Таблица нам показывает, что чем выше процентный показатель (который мы получили в процессе сегментации), тем выше вероятность, того что клиент будет совершать покупки в ближайшее время. Долю клиентов с низкими показателями трудно определить к какому-то определённому этапу жизненного цикла. Клиент может только начинать работать с нами, находится на стадии роста или же наоборот упадка. Зато клиентов с высокими показателями (хотя бы от 85%) можно определить, как VIP, которые приносят постоянный доход.
Никому не верьте
Забавно, что «классическая» последовательность важности клиента в зависимости от «веса» не всегда подтверждается практикой. Например, в одной из компаний я видел такую картину:
Сегменты | Вероятность покупки | «Вес клиента» |
---|---|---|
x1111 | 86.7% | 15 |
x1011 | 76.5% | 13 |
x0111 | 64.6% | 14 |
x0011 | 60.7% | 12 |
x1101 | 50.0% | 11 |
x1110 | 46.6% | 7 |
x0001 | 43.3% | 8 |
x0101 | 37.6% | 10 |
x1010 | 27.3% | 5 |
x1001 | 25.9% | 9 |
x0110 | 21.7% | 6 |
x0010 | 14.3% | 4 |
x1100 | 12.7% | 3 |
x0100 | 9.9% | 2 |
x1000 | 8.4% | 1 |
x0000 | 6.7% | 0 |
Выходит, что 1110 может быть значительно перспективнее, чем 0101. Например, здесь видно, что даже те, кто на 4 месяца забыли о компании, всё равно могут возвратиться. А вы знаете, как дела обстоят у вашей компании? Если нет — попробуйте узнать уже прямо сегодня.
Если статья понравилась — ставьте лайк, а мы продолжим готовить серию постов о «продвинутых методах сегментации». Следующие на очереди статьи о RFM, eRFM и когортном анализе. Будут вопросы — обращайтесь;)
Хотите провести бинарную сегментацию контактной базы клиентов вашего бизнеса?
- Напишите нам на info@esputnik.com.ua.
- Мы свяжемся с вами, уточним, какие данные у вас есть и на их основе в течение недели подготовим документ с отчетом бесплатно.
- Нам доверяют более 2 000 компаний, но чтобы вы были уверены в сохранности данных ваших клиентов, мы можем подписать договор о защите конфиденциальных данных.