Сегментированная статистика
Если кое-кто съел целую курицу и банку сметаны, то по простой статистике оба должны быть сыты... и третий немного.
Если же все это сегментировать, станет ясно, и кто виноват, и что делать...
Большинство событий нашей жизни - это прежде всего совокупность определенных условий и других, не заметных с первого взгляда, событий. Это становится очевидным только тогда, когда мы можем эти второстепенные события установить, связать воедино не только между собой, но и с конечным исследуемым событием. Конечно, тут не бывает и без перегибов, ибо каждый «исследователь» норовит выставить в качестве аргумента именно ту причинно-следственную связь, которая была обнаружена именно им или просто более соответствует его жизненной позиции или установке. Примером служит анекдот где один из едоков долго гонял вилкой горошину по тарелке, тогда как другой, попав с первого раза, услышал, что это стало возможным исключительно по причине того, что первый ее как следует загонял.
Одно дело в жизни, когда значение сопутствующих факторов не учитывается или анализируется всего лишь эмоционально и ретроспективно. Совершенно другое дело, когда необходимо докопаться до истины в сложных объективных категориях. Именно для этого везде развешиваются видео камеры и записываются разговоры - для обеспечения достоверного разбирательства любой потенциально сомнительной ситуации, а не для банальной слежки за добропорядочными параноиками.
Огромный массив данных, получаемых при любом потоковом исследовании, практически никогда не исследуется, ибо значение имеет сама возможность обращения к любому элементу для тщательного анализа и выведения причинно-следственной связи между теми или иными явлениями.
Учитывая что большинство статистической информации имеет разномодальный характер, точность сегментирования (разделения на сегменты или кластеры) имеет определяющее значение. Ведь любой исследуемый предмет может рассматриваться с разных сторон и в зависимости от оснований классификации ключевых параметров будет определена и последующая работа с ними. Например, при описании собаки могут выделяться такие параметры: порода, вес, цвет, характер, длина шерсти, возраст, любовь к ней детей, дрессура и т.д. Но иногда в этот винегрет еще и добавляется брехливость, репрезентативность скелета породе, кариес и прививки. Если эти основания классификации свалить в кучу, то у ребенка получится одно простое: «Собачка», а у таксидермиста: «Глаза какие предпочитаете?».
Но ведь в бизнесе, где основное значение имеют цифры, так не допустимо! Данные нужны конкретные, имеющие отношение к принимаемым решениям и несущие в себе исчерпывающе-репрезентативные параметры исследуемого предмета или явления, чтобы решение соответствовало целям, поставленным в любой момент исследования.
Чем сложнее массив информации, тем большее количество параметров подлежит систематизации и тем больше оснований классификации для одних и тех же групп данных. Иными словами идеальная система - это сетецентрическая модель, где любой из параметров может быть проанализирован в связи с окружающими параметрами и наоборот: эффективность того или иного параметра может быть исследована во взаимосвязи с остальными. В одном случае мы можем исследовать поведение системы при изменении параметра, а в другом - изменение параметра, при изменении системы. И тут важно уметь вычленять кластер или сегмент статистических данных из массива. Чем больше параметров может быть отделено от системы и автоматически объединено по функциям или параметрам, тем более детализированной будет выборка и, соответственно, репрезентативнее данные для анализа. В дальнейшем это позволяет исключать из системы такие факторы, которые требуют затрат, но положительного влиняния на работу не оказывают. И именно это и есть цель всей заморочки - убрать все лишнее.
Эффективная реклама складывается из эффективных кампаний и объявлений. Для успешного управления рекламой необходимо рассматривать не только общую эффективность, но и эффективность этих отдельных составляющих, выделяя их в сегменты по определенным признакам.
Для детальной и разносторонней аналитики рекламы используется сегментированная статистика - инструмент, позволяющий из общей массы объявлений выделить отдельный сегмент и проанализировать именно его.
В общем именно сегментирование данных - это и есть основная задача любой автоматизированной системы управления рекламой и статистикой.
Для работы сегментированной статистики необходимо, чтобы все объявления были размечены специальными метками.
Сегментация позволяет отвечать, например, на такие вопросы:
- какие показатели были на прошлой неделе у мультиварок Redmond в ценовом диапазоне от 10 до 25 тысяч рублей?
- каков CPO у товаров бренда Phillips?
- какие самые эффективные по продажам товары отсутствуют в наличии в данный момент? и т.п.
Сегментирование доступно в первую очередь для прайс-площадок, так как там объявление однозначно соответствует конкретному товару, однако возможно сегментирование и для контекстных площадок: (для потоварных объявлений, создаваемых автоматически).
Возможно сегментирование по следующим критериям (и их комбинациям):
- категория товара (от корневой до листовой);
- фрагмент названия товара (например, “Makita” или “телевизор”);
- идентификатор карточки товара (для Яндекс.Маркета);
- диапазон цены товаров;
- наличие;
- привязка к карточке (для Маркета);
- и т.п.
Анализируя различные сегменты, можно выявлять их сильные и слабые стороны, и вносить корректировки в стратегии продвижения товаров из этих сегментов, оптимизируя тем самым рекламу в целом.
Продвинутый вариант Сегментированной статистики также позволяет учитывать:
- Сегментирование по времени суток (с точностью до часа) - позволяет анализировать распределение кликов, транзакций и анализ эффективности во временном разрезе. Учет этих показателей в работе автоматических стратегий размещения позволяет учитывать изменение эффективности рекламы в зависимости от дня недели, времени суток, а также выходных и праздничных дней.
- Учет метеорологических факторов: дает возможность проводить корреляции эффективности рекламы с колебаниями температуры, наличием осадков и др. погодными условиями на основании доступных погодных фидов крупных метео-сайтов. Результаты анализа данных можно тут же применить в стратегиях управления рекламы (например, повышая активность во время дождя или понижая ставки в случае солнечных весенних выходных).
- Учет колебаний курсов валют, котировок акций и т.п., так как в некоторых тематиках существуют корелляции между потребительской активностью и динамикой курса валют, рыночных индексов.