Без кофейной гущи

Спор между гадалкой и предиктивным аналитиком

Дмитрий Иванов

Кажется, кто-то залез вам прямо в голову: реклама, услуги, товары на экране вашего устройства — все как вы хотели, как будто эти кто-то считывают ваши мысли. Маги, колдуны, фокусники? Нет, конечно. Это результат грамотной предиктивной аналитики, способной предсказать вероятность покупки того или иного товара конкретным человеком. Вам все еще кажется, что тут не обошлось без уличной магии? Вот вам рассказ о том, как перед доводами Дмитрия, ведущего аналитика компании «ЛАНИТ Омни», сдалась даже профессиональная гадалка.

Дама из анекдотов

Кофе уже остыл, а Дмитрий все еще не просил счет. Мимо его столика на веранде обычного московского кафе мелькали лица — бесконечный конвейер из потребностей, сомнений, финансовых возможностей и забот.

— Дай-ка я все про тебя расскажу, счастье твое узнаю, — над Дмитрием склонилась женщина лет пятидесяти с лишним.

— Вам позолотить? — попытался отшутиться ведущий аналитик.

— Я все про тебя знаю, все вижу, прямо по кофейной гуще. Я гадалка в третьем поколении, у меня мать колдуньей была, и бабка, и зять ее, и мать матери его, — не унималась женщина.

Дмитрий смерил даму взглядом. Длинное черное платье, павлопосадский платок, волосы сальные, собранные в хвост, зубы, кто бы сомневался, золотые. Казалось, дама ограбила гримерку цыганского театра «Ромэн» либо свято верила, что настоящие гадалки ходят только в «униформе».

— Да я сам могу все про вас рассказать. И вон про ту женщину, и про эту тоже, — ехидно улыбнулся ведущий аналитик «ЛАНИТ Омни».

— Ты из наших, что ли? — гадалка внезапно перешла на деловой тон и опустилась на соседний стул.

Когда человеку хочется колбасы

— Я, женщина, занимаюсь предиктивной аналитикой. Правда, сейчас этот термин уже не в ходу, чаще говорят про машинное обучение. Маркетинговые термины вообще зачастую не отражают сути дела и тяготеют к наиболее модным словам. Вот была когда-то модной концепция 4P – product-placement-people-price. Потом появилась 5P, а потом и 7P. И все это, в принципе, одно и то же. Вас, кстати, как зовут?

— Галиной Венедиктовной, — совсем растерялась гадалка.

— А меня Дмитрием. Давайте я вам проще объясню, что такое предиктивная аналитика. Представьте, на уровне неких статистических методов вы предсказываете вероятность наступления того или иного события. Вот в математике есть арифметика: один плюс один равно два. В высшей математике есть интегралы и производные. И есть раздел математики, который связан со статистикой. Если что-то произошло два раза, то следующее событие, скорее всего, будет таким же, как уже произошедшее два раза, а не таким, какого еще не происходило никогда. И в зависимости от того, насколько продвинутые у вас предсказательные и статистические методы, насколько много у вас событий прошлого, которые вы анализируете, настолько велика будет вероятность наступления следующего события. Так понятнее?

Гадалка смотрела на Дмитрия так, будто перед ней сидел Нострадамус собственной персоной — испуганно и восхищенно.

— Хорошо, Галина Венедиктовна, давайте представим, что у вас есть магазин. Вы же хотите, чтобы была прибыль? Значит, вам нужно просчитать потребности покупателей.

— Да кто ж их поймет, что им нужно, — натужно засмеялась женщина.

— Допустим, есть два гражданина, которые покупают молоко, сыр и колбасу. А третий — только молоко и сыр. Когда у вас сто человек постоянно покупают три продукта, а один, сто первый, — почему-то всего два, вы рано или поздно задумаетесь, что бы ему такое предложить.

— Ну, колбасу ему предложить, — обрадовалась своей находчивости гадалка.

— Верно. Потому что сто других покупателей берут колбасу, которую он почему-то еще не брал. Вот это и есть статистика. Вероятность того, что наш сто первый человек купит колбасу, по отношению к вероятности того, что он купит что-то другое, выше именно потому, что у нас есть набор определенных событий, происходивших в прошлом.

— Как же это понимать? — снова нахмурилась гадалка.

— Это статистические методы. Допустим, сто покупателей тех самых трех продуктов ходят в магазин раз в неделю. И сто первый гражданин тоже ходит раз в неделю. То есть они уже похожи по двум параметрам. Далее, введем еще три параметра: допустим, мы знаем их пол, возраст и семейное положение. Скажем, все они 25-летние холостые мужчины, и те сто, и этот один. Итого у нас уже пять параметров: пол, возраст, семейное положение, частота посещения магазина, предпочтение определенных продуктов. Степень сходства нашего сто первого покупателя с остальными, выбирающими три продукта, растет. И вероятность того, что и он купит третий продукт, тоже.

— И какое отношение это имеет к колбасе? Как понять, что все эти сведения тебе помогут, что все эти…

— Вы хотите сказать, что эти параметры могут оказаться незначимыми?

Галина Венедиктовна выпрямила спину и вальяжно положила ногу на ногу. Она явно почувствовала, что загнала аналитика в угол.

Методы предсказаний

На столике в обычном московском кафе стоят уже две чашки с кофе. Официанты с любопытством наблюдают за странным спором мужчины средних лет и сомнительного вида женщины о какой-то колбасе, но на самом деле — о системе управления покупательским поведением.

— Мы все проверили на практике. Включаем здравый смысл, формализуем его и говорим: если сто человек покупают три продукта, а сто первый покупает два, то логично предложить ему третий. Так работает предиктивная аналитика. Есть человек, собирающий доступные данные и на основании этого выписывающий определенные параметры. Он способен сказать: смотреть надо на это, на это и на это. На первом этапе работает машина, потому что параметров может быть и 100, и 200. А потом подключается аналитик.

— Давай-ка на конкретном примере, — в нетерпении заерзала на стуле гадалка.

— Вот случай из практики. Есть мобильное приложение продавца одежды. Нам в этом приложении дали доступ к просмотрам product pages — товарных страниц за последние три месяца, в общей сложности 60 миллионов страниц. И нам нужно построить определенную модель. Мы знаем, что человек смотрел, знаем, что он купил. Значит, уже можем ему что-то предложить. Но главный вопрос в том, что мы должны не просто знать, что ему предложить, надо и понимать, как и в какой момент это сделать. То есть нам надо заинтересовать его набором близких ему параметров, и лишь после того, как он откроет одну страницу, другую, сказать ему: посмотри еще вот это. Был такой замечательный господин Бенеттон, хозяин и руководитель одноименной компании. Он любил повторять: «Люди смотрят разноцветные свитера, а покупают черные. Но если продавать одни только черные свитера, их никто не купит».

— Чужая душа — потемки, — пустилась в философию Галина Венедиктовна.

Школа ремонта

— Есть еще одни пример применения этой методики: продажи стройматериалов. Бытовая эрудиция подсказывает нам, что люди сначала делают пол, потом — стены, только потом — крышу. Есть компания, которой нужно построить временные ряды, есть полмиллиона покупателей. И нам нужно понять, на каком этапе, с точки зрения временных рядов, находится сейчас…

— Их ремонт.

— Да, их покупательский интерес. И каждому из них сделать нужное предложение. Например, мы знаем, что от покупки материалов для пола до покупки материалов для стен проходит до 10 дней, а от стен до крыши — от 20 до 30 дней. Но в жизни «потолок» и «крыша» — это два простых слова. На самом же деле речь идет о десятках тысяч видов стройматериалов. Поэтому, когда мы формировали временные ряды, их получилось около 60 тысяч. При этом надо было оценить вероятность того, что через 15, 30 или 45 дней после последней покупки человек купит что-то еще. И вот мы следим: он что-то покупает, покупает, покупает. И через 15 дней мы сделали ему предложение. А он взял и ничего не купил.

— Ошиблись, значит, — оживилась гадалка.

— В таком случае мы предполагаем: с какой вероятностью он купит этот конкретный товар через 30 дней? И выдаем, если вам будет угодно, предсказание. Вот это и есть предиктивная аналитика. Предсказание вероятности наступления какого-то события с той или иной степенью. Основной метод сбора данных — тотальный: даже если не знаешь, зачем тебе это надо и пригодится ли вообще, все равно запиши. Продажи, процент коммерции, трафик и так далее.

Предсказания по картам лояльности

Галина Венедиктовна поймала себя на мысли, что за все время разговора успела бы погадать как минимум пяти клиентам заведения. Вот тот, с усами, явно хочет поговорить, а эта, белокурая, точно поведется на любую байку. И гадалка поняла, что хочет научиться анализировать и просчитывать. Она сделала большой глоток кофе и жестом попросила Дмитрия продолжить рассказ.

— Как вы эти параметры-то находите?

— Можно собирать данные из истории браузера, это рядом с продажами. Можно — данные о лояльности или Wi-Fi-аналитику, какие MAC-адреса ко мне приходили. Можно туда же прикладывать погоду и изменения таможенных пошлин. На самом деле, существует миллион событий, способных повлиять на предпочтения покупателей. Вот это все необходимо держать в одном хранилище, чтобы потом из этих данных можно было что-то извлечь. Так как речь идет о машинной обработке, в них могут найтись необъяснимые и не видимые для обычной, кухонной логики влияния и события.

— То есть просто бери любые данные, какие найдешь, — поддержала диалог гадалка.

— Да. Я всегда говорю, что IT является хребтом розницы. И, к сожалению, не все меня понимают. Идея, на мой взгляд, состоит в том, что у компании обязательно должно быть единое хранилище. Не умеешь сделать его сам — найми специалистов. Допустим, вот есть покупки и есть MAC-адреса. Какой ключ способен их соединить?

— Это время покупки, — неожиданно для самой себя ответила женщина.

– Галина Венедиктовна, вы делаете успехи! Даже если данные у вас разрозненные, за ними все равно стоит общий ключ. Скажем, есть покупки и есть идентифицированные люди, которые к вам приходили. Что это за ключ? Номер карты лояльности в чеке. В чеке ведь карта лояльности есть? Есть. Время покупки есть? Есть. Так мы потихоньку и связываем данные. Сейчас еще мало какие компании записывают всю историю клиентских посещений, ограничиваются лишь тем, что есть в Google Analytics. И никто не собирает больше. А ведь для этого давно есть разные инструменты.

Игры с данными

— Так получается, компании не собирают данные просто потому, что не видят в этом смысла? Какой-то абсурд. Это все равно что я приду к плотникам и скажу: «Мне нужная баня из бревен». Они ответят: «Давай бревна». А я руками разведу: «Бревен нет. Но баня нужна», — возмутилась гадалка.

Дмитрий на секунду задумался и медленно покрутил кружку в руках.

— И с таким тоже приходится сталкиваться. У нас есть клиенты, у которых не хватает данных. Вот руководитель говорит: «Мне нужны персональные предложения». Мы, в свою очередь, выясняем, какие данные у них есть. Это может быть, например, множество разношерстных данных, но небольшой глубины. И построить на них значимые, валидные стратегические модели невозможно. Или другой пример. Допустим, руководитель с гордостью заявляет, что у него просто прорва продаж. Нам предоставляют сто миллионов записей чеков, но без идентификаторов клиентов. Как здесь делать персональные предложения, непонятно. Множество других выводов сделать можно, но самого главного — как сформировать персональные предложения — нельзя. Так что каждый случай надо отдельно разбирать.

— Я вот что думаю, Дима, — гадалка заговорила необычайно серьезно. — Данные сегодня — это новая нефть.

— Не все это понимают. На Западе, например, уже несколько лет рассказывают про новую должность — marketing officer. Это может быть chief executive, chief information, а по-хорошему даже chief officer. На самом деле, не так важно, есть у тебя человек с профильным образованием или нет, важно, чтобы в компании была такая должность. И тогда компания будет понимать, что у нее есть большие данные. И что их можно монетизировать. Вот есть большая розничная сеть, обойдемся без названий. Например, продуктовая, в сегменте «средний плюс». В какой-то момент она начала собирать MAC-адреса своих покупателей. А потом стала этими MAC-адресами торговать. То есть они знают, что к ним приходят люди с доходом «средний плюс». Почему бы, если кому-то надо таргетировать рекламу в интернете на сегмент с доходом «средний плюс», не взять базу посетителей этой сети? Это уже даже не предиктивная аналитика. Это про то, что у данных есть…

— Ценность, — не выдержала Галина Венедиктовна.

— Да. На этих клиентов можно таргетировать рекламу в интернете, даже не собирая разрешений на показ персональной рекламы. То есть человек не разрешил писать ему смс, не разрешил отправлять ему письма. Но показать ему что-то в браузере ты можешь. Ты можешь сгенерировать для него персональное предложение и дотянуться до него через браузер. Вот это и есть персональное предложение, подготовленное с использованием методов предиктивной аналитики.

— А это законно? — гадалка задала вопрос, которого ведущий аналитик «ЛАНИТ Омни» от нее явно не ожидал.

— Ну, у нас достаточно строгое законодательство и в значительной степени гармонизированное с Европой. Представим, что я — владелец данных. Человек добровольно отдал мне свои имя, фамилию, номер телефона. Разрешения на сбор MAC-адресов не давал, но его устройства их отдают. Что же, мне теперь нельзя их брать?

— Можно? — гадалка перешла на шепот.

— Можно. Это как судебный процесс по поводу того, можно ли использовать данные, опубликованные человеком в соцсетях. Можно. Потому что он эти данные публиковал для неограниченного круга лиц. Я являюсь частью неограниченного круга лиц? Являюсь. А остальное — юридические тонкости.

— Фантастика, — не смогла скрыть восторг Галина Венедиктовна.

— Еще нет. Этот рынок пока что формируется на уровне владельцев данных. Очень много компаний не понимают, что ведут себя как собака на сене. И собака померла, и лошадь померла, говоря грубо. Все умерли, а сено осталось. Чтобы такого больше не было, компаниям пора взрослеть.

Галина Венедиктовна и аналитик замолчали. Официант уловил возникшую неловкость и принес счет. Гадалка первой взяла чек и заплатила за оба кофе наличными. Потом она зачем-то поклонилась Дмитрию и задумчиво пошла к выходу.

Наталья Лучкина

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

Превосходство кванта

Разбираетесь ли вы в вычислениях, использующих принципы квантовой механики?

Тимофей Кочкар

Квантовые вычисления могут подарить нам невиданные возможности — например, значительно ускорить машинное обучение или помочь в решении сложных вычислительных проблем. Но достаточно ли вы знаете, чтобы понимать, на что они способны на самом деле? Вместе с Университетом МИСИС мы подготовили тест, который поможет вам разобраться в принципах, лежащих в основе квантовых вычислений.