Андрей Ревяшко (Wildberries): "Big Data - это не мегамозг из фантастического фильма"
Игорь Бахарев
Big Data стала частью жизни многих крупных компаний. Работают в этом направлении и в российских интернет-магазинах. Мы решили расспросить IT-директора самого крупного одежного интернет-ретейлера России WildBerries Андрея Ревяшко о том, как выстроена работа с информацией на их площадке.
Big Data. Это просто мода или действительно то, без чего в ближайшем будущем не сможет обойтись ни одна уважающая себя компания?
Большинство компаний хоть и интересуются big data, но еще далеки от того, чтобы на самом деле применять их на практике. Но некоторые все же научились извлекать из огромных массивов информации свою выгоду: строить прогнозы, находить закономерности и применять эти данные для увеличения продаж и развития бизнеса. В том числе и мы.
Big Data и искусственный интеллект в Wildberries — это не какая-то одна целостная сущность, не мегамозг из фантастического фильма. Это скорее «скучный» со стороны набор математических формул, обрамленных удобной программной реализацией, и подогнанный под конкретные задачи. В будущем, на мой взгляд, на рынке eCommerce останутся только те компании, которые смогут собирать и правильно анализировать исчерпывающую информацию о предпочтениях своих клиентов.
Большие данные при определенном размере компании производятся сами собой, достаточно представить себе ежедневное количество взаимодействий между миллионами пользователей и миллионами артикулов товаров. Сама суть Big Data – это просто исторический набор событий, который сгенерили пользователи.Откуда вы черпаете основные данные о клиентах?
Каждый день миллионы покупателей заходят на наш сайт, получают от нас письма и уведомления, просматривают, отмечают, откладывают товары, оставляют свои отзывы и оценки. Происходит доставка, оплата и получение товаров и по России, и по Беларуси, и по Киргизии, и по Казахстану. Так что проблем с получением достаточного количества данных у нас нет, остается все это изобилие хранить и использовать для того, чтобы предлагать пользователям наиболее качественный контент не только на сайте, но и в других каналах коммуникации. С нашей стороны было важным организовать структурированное хранение этих данных, их анализ и такую обработку, чтобы клиентам было максимально комфортно их у нас покупать.
Всё это анализируется искусственным интеллектом. Он впоследствии, обучаясь, формирует рекомендации для просмотра на сайте и персональный контент для email-рассылки. Мы делаем качественное предложение каждому клиенту, и наша стратегия работает: open rate email рассылки увеличился на 100% и составляет на данный момент более 30%.Хорошо. Вы собрали кучу данных. И?
Самое главное в машинном обучении - выбрать наиболее подходящий алгоритм с нужными параметрами, а затем потратить время на обучение машины выбранным алгоритмам. Ведь пока машина учится, попадаются и неактуальные рекомендации.Какие были курьезные случаи при работе с Big Data?
Мы в свое время пытались настраивать систему рекомендаций "топорным способом". Исходили из простого принципа: вот люди покупают какие-то вещи, давайте посмотрим, что они параллельно с этим покупают. И такие же товары пытались рекомендовать другим клиентам. Смотрели конверсию таких рекомендаций, потом меняли модели.
И некоторые алгоритмы вели себя очень неожиданно. Встречались курьёзы. Например, они предлагали товары для реабилитации после травм суставов людям, интересующимся спортивными товарами, возможно, еще до появления у тех каких-либо подобных травм. Также одна из моделей советовала к бинтам для рукопашного боя приобретать тональный крем, что, если подумать, не так уж необоснованно.
Или был случай, когда обратилась женщина, которая чуть ли не обвинила нас в шпионской деятельности. Говорит, что ей начали предлагать товары, связанные с балетом. А она на нашем сайте и близко никаких похожих запросов не делала. А система по каким-то своим алгоритмам вычислила, что внучка этой женщины занимается балетом и предложила ей соответствующие товары.
Нет, нет, нет. Мы работаем исключительно со своими данными. И поэтому такие попадания системы нас самих в шок повергают иногда. Есть алгоритм, но он делает такие заключения, которые просто удивляет.Ну может быть вы поменялись об этой женщине данными с каким-то другим сервисом или магазином?
В некотором смысле, нам легче и удобнее работать с Big Data, чем некоторым конкурентам, так как мы не анализируем личные данные клиентов, как, например социальные сети, а фиксируем только действия на сайте. Проблемы выбора обрабатываемых данных - какие данные необходимо извлекать, хранить и анализировать, а какие – не принимать во внимание, - у нас не возникает.
Много всего. Например, иногда непонятно, как расшифровывать запрос клиента. Вот хочет он найти на сайте "детскую коляску"? С одной стороны, он может искать обычную коляску, куда можно посадить младенца. С другой стороны, может быть он искал коляску, в которой его дочка кукол возит? Как понять? Этот момент еще не решен.А если говорить не о смешных эпизодах с рекомендациями, есть ли какие-то серьёзные проблемы с внедрением Big Data?
Не совсем. Это комплекс алгоритмов, позволяющих предсказать, что окажется наиболее интересно пользователю. Основная задача системы - сделать персональное предложение покупателю и, более того, прогнозировать его потребности в будущем. Мы начали вводить предиктивные рекомендательные системы и работать с большими данными в 2015 году. Хотелось предлагать клиентам наиболее качественный контент не только на сайте Wildberries, но и в других каналах коммуникации.Я же правильно понимаю, что рекомендательные системы вы используете исключительно для допродаж?
Критерий один - повышение конверсий заказов и их числа. Внедрение того или иного функционала, если оно не отображается на конверсии, на росте заказов, на удовлетворенности покупателей – не имеет смысла.А какие критерии, по которым понять, хорошо ли вы используете данные или нет?
Такое уже пробуем. Мы хотим дать возможность людям "поиграть в дизайнера", выкладывать свои образы из товаров, купленных на сайте WB. Затем у нас есть дизайнеры, которые делают подборку вещей и создают свои "образы".Некоторые западные магазины предпочитают показывать клиентам "образ", который состоит сразу из нескольких предметов одежды. Так товары покупают лучше, ведь становится понятнее, как их носить. Вы собираетесь делать систему общего образа?
Хотим подключить к этому процессу ИИ. Чтобы он показывал, как разные вещи подходят друг к другу по цвету, например. Сейчас мы работаем над соответствующим алгоритмом.
Совершенствование картины пользователей. Правильно обработанные и проанализированные большие данные помогают сформировать полное представление о клиенте и дают информацию о том, кому конкретно стоит предложить продукт, где это сделать и в какое время.Назовите 3 причины, по которым использование Big Data необходимо eCommerce?
Повышение качества обслуживания. Если пользователь не нашел то, что искал, он покидает сайт. Предложив ему альтернативный товар, можно не только предвосхитить его ожидания, но и сделать лояльным клиентом.
Увеличение продаж. Использование инструментов прогнозной аналитики поможет повысить конверсию сайта и рассылок, а значит, значительно увеличить прибыль компании. К примеру, у нас в 2017 году конверсия с рассылок выросла на 50%.
Я говорю, что мы этого не исключаем. Сейчас такой задачи не стоит. Опыт на сегодняшний день большой. Я не могу исключать, что мы займемся рекомендательным сервисом. У нас есть понимание, как это сделать.Вы предполагаете, что станете рекомендательным сервисом для других магазинов?
Нет, нам пока для обучения ИИ хватает и своих данных.Вы уже прогоняли свою рекомендательную систему на базе других магазинов?
Подписаться на новости
Прочитаете,
когда вам будет удобно
Свежий дайджест из мира
eCommerce у вас в почте