Когортный анализ

Анализ данных в электронном маркетинге. Статья 3 - когортный анализ и LTV

Когортный анализ в последнее время становится все более популярным, все большее число аналитиков осваивают его и начинают им пользоваться. Google Analytics даже не побоялся включить этот инструмент в свою систему, изначально рассчитанную на широкий круг пользователей.

Когортный анализ в Google Analytics

Действительно, когортный анализ до гениального прост, хотя и необычен, поэтому воспринимается не сразу. Необычность его в том, что в большинстве методов анализа клиентской базы берется срез как-бы «поперек» — на какую-то дату, а в когортном анализе — «вдоль» всего жизненного цикла клиентов.

Посмотрим на пример

Но давайте не будем застревать на теории, а сразу перейдем к практике. Мы уже несколько раз использовали в аналитических статьях специально подготовленный файл с базой продаж вымышленного интернет-магазина «Тип-топс».

Вы можете загрузить этот файл с Google Drive.

Файл Analysis_Sample

Описание содержимого этого файла можно найти в первой статье аналитической серии — Анализ данных в электронном маркетинге. Статья 1 — Каналы привлечения клиентов.

Кроме всего прочего, в файле есть пример когортного анализа, который мы подробно разберем в этой статье.

Из исходных данных нам нужна только база продаж, в которой есть информация о дате, цене заказа и id клиента. Это всё. Вычисления делаются автоматически, а результаты выводятся в таблицы и диаграммы на листе «Когортный_Анализ».

Как строится сегментация по когортам

Когортный анализ — это не какой-то анализ «в себе», это сегментация базы клиентов, результаты которой уже можно анализировать как угодно. Таким образом, в первую очередь, мы должны сегментировать нашу базу, т.е. выделить когорты. А когорты в нашем применении — не что иное как группы пользователей, однотипных по времени чего-то, например, первой покупки.

Мы в нашем примере строим когорты именно по времени первой покупки. Для начала, разбиваем весь наш отрезок времени на равные периоды (здесь и далее исходные данные вносятся в оранжевые ячейки, а результаты появляются в голубых). Чаще всего в качестве такого периода выбирается месяц, но здесь важно, чтобы в когортах было достаточное количество людей для возможности усреднения. Мы выбрали квартал и получили 8 когорт.

Периоды когорт

Это клиенты, которые сделали свой первый заказ в соответствующие периоды.

Формулы автоматически проставили номера когорт на листе «База_клиентов», а оттуда уже посчиталось количество клиентов в когортах и сумма всех их покупок в показанной выше таблице.

Начинаем анализировать

По датам, таблица с когортами будет выглядеть характерной «лесенкой».

Выручка по когортам

Те же данные удобней «читать» в диаграмме.

Диаграмма выручки по когортам

Первые выводы видны уже в этом представлении:

  1. Каждая новая когорта тратит больше предыдущей. Это хорошо. Но на последней когорте рост затормозился. Нужно думать почему.
  2. В первый квартал каждой когорты совершается максимальный объем покупок, во втором клиенты уже тратят значительно меньше. Очевидно, что если увеличить повторные продажи, бизнес просто «взлетит».

Для того, чтобы сравнивать поведение разных когорт, их лучше привести к одному базису — началу жизненного цикла. На примере количества покупателей, делавших покупки, таблица будет выглядеть уже так:

Количество активных клиентов

Это уже типичное представление в когортном анализе. Помните как у Google в начале статьи?

Если привести данные из предыдущей таблицы к максимальным значениям в когорте (индекс) мы сможем сравнивать динамику активных покупателей в когортах.

Индекс активных клиентов

Что мы видим в нашем магазине:

  1. Поведение когорт очень похоже. Каких-то серьезных различий, например сезонных, нет.
  2. Во втором и последующих кварталах покупки делает только около 20% когорты.
  3. Сильно упав во втором квартале, потом количество покупателей в когорте остается в целом стабильным, т.е. дальнейший отток не заметен (где churn rate, где конец life cycle?).
  4. Количество покупателей в когорте может падать, а потом — расти.

Очевидно, что снижение выручки в когортах, которое мы рассмотрели ранее, объясняется тем, что клиенты не возвращаются за второй покупкой. Но интересно посмотреть на динамику сумм, которые тратят клиенты.

Средняя выручка на покупателя

Из этой диаграммы видно, что во всех без исключения когортах сумма, которую тратит покупатель во втором квартале, растет! Этот интересный момент мы видели во многих бизнесах, и объясняться он может ростом доверия нового клиента к магазину, уходом страхов после первой удачной покупки. А у вас так?

Customer churn rate и Customer lifetime value

Еще в первой статье нашей аналитической серии мы обещали разобраться показателями оттока клиентов (customer churn rate) и ценности клиента в течение жизненного цикла (CLV или LTV). Теперь для этого самое время — у нас есть тестовая база продаж и мы сделали когортную сегментацию, которая, как нельзя лучше подходит для изучения этих величин.

Churn rate

Churn rate — это доля клиентов ушедших за какой-то период времени. Определив этот показатель на основе исторических данных, мы можем строить прогнозы количества клиентов, будущей выручки и ценности клиента за весь цикл «жизни».

Этот показатель хорошо работает в подписном бизнесе, где есть явное событие ухода клиента — отказ, отписка. В ecommerce, однако, такого события нет, клиент просто перестает покупать по каким-то неизвестным нам причинам. Он фактически ушел, нам уже трудно на него рассчитывать, но как определить факт ухода? А вдруг он вернется?

Критерий ухода приходится определять самостоятельно и это будет, как правило, временной критерий. Иногда задать предел жизненного цикла проще, как например, в магазине товаров для младенцев, иногда сложнее, например, в гипермаркете бытовой техники.

Мы предлагаем привязаться к периоду неактивности клиента. Особенно логично получается, если в бизнесе уже рассчитаны критерии ухода для других видов анализа. Так, в нашем тестовом интернет-магазине мы изучали уходящих клиентов и делали сегментацию по давности покупок. Подробнее об этом написано в статье, посвященной RFM-анализу. И там мы определили категорию «ушедших», как тех клиентов, кто не делал покупки 1 год. Таких у нас получилось 100 чел из 1711. Мы знаем их id и можем вычислить их в нашей когортной сегментации.

Количество ушедших клиентов

И тут мы видим другую проблему Churn rate в ecommerce — он нелинеен во времени. Поскольку наибольшее количество клиентов делают только одну покупку, то спустя заданный период времени неактивности происходит лавинообразный отток. В таблице выше это хорошо видно — первые цифры оттока намного превышают последующие.

Получается, что если мы рассчитаем среднеквартальный отток клиентов, то эта цифра не скажет нам ровным счетом ничего.

И все же churn rate можно применять в ecommerce. Мы не сможем сделать прогноз на произвольный период времени в будущем, но можем, глядя на первые когорты, предсказать отток во второй квартал, в третий и т.д. насколько хватит у нас истории. Например, у нас, по нашим правилам признания клиентов ушедшими, получилось что churn rate впервые появляется в пятом квартале жизненного цикла и составляет в среднем 60,5%, в шестом — 9,7%.

Churn rate

Customer Lifetime Value (CLV, LTV)

При расчете Customer Lifetime Value в ecommerce мы сталкиваемся с теми же вопросами неоднозначной длительности жизненного цикла и его нелинейности во времени. Но раз мы уже дали на них ответ, то и CLV вычислим с теми же оговорками.

Вообще, CLV — это средняя прибыль, полученная за средний жизненный цикл среднего клиента. Посчитать ее можно разными способами, при этом, нужно быть готовым к тому, что и результаты могут оказаться разными. Это все из-за усреднения, которое очень не любят приверженцы точных наук. Апофеозом же являются рекомендации усреднить еще и результаты усреднений :) Об этом говорят, например, в блоге KISSmetrics.

Итак, нам необходима средняя прибыль на клиента за средний жизненный цикл. Чтобы получить эту величину, возьмем среднюю прибыль на клиента за квартал и помножим на среднюю длительность жизненного цикла. Формула:

CLV = AMPU * average lifetime, где AMPU — average margin per user

Средняя длительность жизненного цикла, при этом, не что иное, как величина, обратная нашему churn rate, т. е. мы сможем записать:

CLV = AMPU * (1 / churn rate) или CLV = AMPU / churn rate

И AMPU, и churn rate в ecommerce нелинейны, т.е. зависят от периода времени за который мы делаем выборку. Чтобы минимизировать проблему нелинейности, возьмем их по первой когорте, которая имеет максимальный охват по времени.

Расчет Customer Lifetime Value (CLV)

В результате несложных вычислений, мы получаем CLV = $1,448, притом что средняя Lifetime у нас составила 6,6 кварталов.

Customer Lifetime Value vs Customer Acquisition Cost

Смысл расчета показателя CLV заключается в том, что исследовав поведение некоторых ключевых метрик бизнеса в прошлом, мы получаем возможность строить прогнозы прибыли в будущем. При этом, одним из самых важных применений CLV является вычисление предела приемлемых затрат на привлечение клиента (customer acquisition cost — CAC, подробнее о CAC в ecommerce — в статье на нашем блоге).

Делается этот путем сопоставления CAC и CLV. Логично, что клиент должен принести прибыли больше, чем затрачено на его привлечение. Тут, однако, нужно не забывать о том, что эти величины должны быть сопоставимыми. В идеале нужно балансировать чистую прибыль (но без учета затрат на привлечение) с этими самыми затратами на привлечение. Тогда CAC < CLV будет уравнением успешного бизнеса, генерирующего прибыль для собственника.

Но делать такие расчеты достаточно сложно и маркетологи в ecommerce оперируют, как правило, CLV, рассчитаной из валовой прибыли. Именно так мы посчитали CLV в нашем примере. Понятно, что в этом случае CLV должна уже быть не просто больше CAC, а намного больше, ведь из нее надо оплатить все прочие затраты бизнеса, включая проценты банкам и налоги. Соотношение 1:3 является неким принятым ориентиром, но оптимальное для вашего бизнеса соотношение можете определить только вы сами.

О точности балансирования копейка в копейку здесь уже, конечно, речь идти не будет, но и к точности и достоверности самих величин CAC и CLV в ecommerce, как мы уже говорили, есть масса вопросов. Тем не менее, «зрячее» использование этих показателей с пониманием их сути и нюансов позволит маркетологу быстро принимать решения о своих затратах и реагировать на негативные тенденции в прибыли раньше, чем об этом начнет кричать финансовый директор или бухгалтер. А в самом благоприятном случае, последние двое даже не увидят ничего, кроме растущей прибыли. Желаем, чтобы в вашем бизнесе было именно так! :)

Статья 1 — Каналы привлечения клиентов

Статья 2 — RFM сегментация

Добавить комментарий

Andriy Kosetsky
17:05, 6 апреля 2015

Повторяю залогинившись..)
Как расчитывается "среднеквартальный churn для когорты"? Для первой когороты он 15,2%
Понятно, что churn = 1- retention rate.
Но retention rate у вас расчитывается как «количество акивных на конец периода»/ «всего покупателей в когорте» и это отношение возводится в степень 1/7.
Почему именно возводится в степень 1/7? Не могу уловить смысл этой математической операции. Можете объяснить чуть подробнее?

Андрей Панкратов
Андрей Панкратов
10:18, 7 апреля 2015

Андрей, спасибо за столь пристальное внимание к теме.
Про степень 1/7 - это не что иное, как среднегеометрическое.
Т.е. итоговый ретеншн за 8 кварталов - это 12/38 (конец/начало). Для расчета среднего предположим, что каждый квартал происходил одинаковый отток, т.е. r1=r2=r3=...=r. Тогда r*r*r... т.е. r в степени 7 должен дать 12/38. И отсюда получаем, что r = 12/38 в степени 1/7 (корень степени 7).

Андрей Панкратов
Андрей Панкратов
10:33, 7 апреля 2015

Кстати, можно быстро проверить это. Средневкартальный ретеншн для 1й когорты у нас 1-15,2%= 84,8%.
Берем начальное кол-во клиентов - 38 и умножаем его 7 раз (7 последующих кварталов) на 84,8%. В итоге мы должны получить 12 - кол-во клиентов оставшихся в последнем квартале.

Andriy Kosetsky
17:55, 15 апреля 2015

а какой смысл использовать среднеквартальный ретеншн, если можно использовать итоговый ретеншн?
Мы не можем говорить, что каждый квартал у нас был ретенш 84,8%, потому что первые три периода он был равен 0.
Паша Левчук напсиал у себя, что вы расчитываете какбы "прогнозный" ретеншн. Но зачем расчитывать прогнозный, если можно расчитать реальный?
Какая логика стоит за этим расчетом?

Андрей Панкратов
Андрей Панкратов
09:50, 16 апреля 2015

> а какой смысл использовать среднеквартальный ретеншн, если можно использовать итоговый ретеншн?

Это смотря для чего использовать. Например для расчета LTV нужен именно такой, т.к. мы среднеквартальную прибыль с клиента делим на среднеквартальный же churn rate, получая прогноз на ВЕСЬ жизненный цикл. Можно получить прогноз и на квартал, на два, на сколько угодно.

А для чего можно использовать ретеншн за анализируемый период, о котором Вы говорите? Ведь он представляет собой "retention rate за первые 8 кварталов жизненного цикла".

По моему убеждению, любой анализ должен давать информацию для принятия решений в будущем. Т.е. анализируем мы всегда прошлое, чтобы увидеть какие-то закономерности и использовать это знание в будущем. Прошлое/будущее, фактический/прогнозный период - это две "стороны ОДНОЙ медали" и не могут быть разделены. ИМХО. Хотел тогда поспорить с Павлом по поводу сущностей "реальность" и "прогноз", но это бы увело дискуссию от основной темы.

А основная тема такова: такие классные штуки как retention rate, churn rate в ecommerce радикально нелинейны во времени и использовать их нужно осторожно, понимая "подводный камень" нелинейности. При анализе короткой истории - особенно. А производные не менее классные штуки - Life cycle, LTV в ecommerce - вообще имеют еще и неоднозначность факта конца жизненного цикла... Но что же делать маркетологам-аналитикам? Они же хотят понять сколько, например, можно тратить на привлечение и удержание клиента. Каждый находит свои способы.

И да, Андрей, спасибо за то, что поднимаете эту тему (и Павлу Левчуку - заочное спасибо :) ). На самом деле, именно эта проблема послужила поводом для написания статей, и я был бы очень рад продолжить дискуссию.

Анализ данных в электронном маркетинге. Статья 3 - когортный анализ и LTV