Андрей Ревяшко (Wildberries): "Big Data - это не мегамозг из фантастического фильма"

Игорь Бахарев

Big Data стала частью жизни многих крупных компаний. Работают в этом направлении и в российских интернет-магазинах. Мы решили расспросить IT-директора самого крупного одежного интернет-ретейлера России WildBerries Андрея Ревяшко о том, как выстроена работа с информацией на их площадке.

Big Data. Это просто мода или действительно то, без чего в ближайшем будущем не сможет обойтись ни одна уважающая себя компания?

Большинство компаний хоть и интересуются big data, но еще далеки от того, чтобы на самом деле применять их на практике. Но некоторые все же научились извлекать из огромных массивов информации свою выгоду: строить прогнозы, находить закономерности и применять эти данные для увеличения продаж и развития бизнеса. В том числе и мы.

Big Data и искусственный интеллект в Wildberries — это не какая-то одна целостная сущность, не мегамозг из фантастического фильма. Это скорее «скучный» со стороны набор математических формул, обрамленных удобной программной реализацией, и подогнанный под конкретные задачи. В будущем, на мой взгляд, на рынке eCommerce останутся только те компании, которые смогут собирать и правильно анализировать исчерпывающую информацию о предпочтениях своих клиентов.

Откуда вы черпаете основные данные о клиентах?

Большие данные при определенном размере компании производятся сами собой, достаточно представить себе ежедневное количество взаимодействий между миллионами пользователей и миллионами артикулов товаров. Сама суть Big Data – это просто исторический набор событий, который сгенерили пользователи.

Каждый день миллионы покупателей заходят на наш сайт, получают от нас письма и уведомления, просматривают, отмечают, откладывают товары, оставляют свои отзывы и оценки. Происходит доставка, оплата и получение товаров и по России, и по Беларуси, и по Киргизии, и по Казахстану. Так что проблем с получением достаточного количества данных у нас нет, остается все это изобилие хранить и использовать для того, чтобы предлагать пользователям наиболее качественный контент не только на сайте, но и в других каналах коммуникации. С нашей стороны было важным организовать структурированное хранение этих данных, их анализ и такую обработку, чтобы клиентам было максимально комфортно их у нас покупать.

Хорошо. Вы собрали кучу данных. И?

Всё это анализируется искусственным интеллектом. Он впоследствии, обучаясь, формирует рекомендации для просмотра на сайте и персональный контент для email-рассылки. Мы делаем качественное предложение каждому клиенту, и наша стратегия работает: open rate email рассылки увеличился на 100% и составляет на данный момент более 30%.

Какие были курьезные случаи при работе с Big Data?

Самое главное в машинном обучении - выбрать наиболее подходящий алгоритм с нужными параметрами, а затем потратить время на обучение машины выбранным алгоритмам. Ведь пока машина учится, попадаются и неактуальные рекомендации.

Мы в свое время пытались настраивать систему рекомендаций "топорным способом". Исходили из простого принципа: вот люди покупают какие-то вещи, давайте посмотрим, что они параллельно с этим покупают. И такие же товары пытались рекомендовать другим клиентам. Смотрели конверсию таких рекомендаций, потом меняли модели.

И некоторые алгоритмы вели себя очень неожиданно. Встречались курьёзы. Например, они предлагали товары для реабилитации после травм суставов людям, интересующимся спортивными товарами, возможно, еще до появления у тех каких-либо подобных травм. Также одна из моделей советовала к бинтам для рукопашного боя приобретать тональный крем, что, если подумать, не так уж необоснованно.

Или был случай, когда обратилась женщина, которая чуть ли не обвинила нас в шпионской деятельности. Говорит, что ей начали предлагать товары, связанные с балетом. А она на нашем сайте и близко никаких похожих запросов не делала. А система по каким-то своим алгоритмам вычислила, что внучка этой женщины занимается балетом и предложила ей соответствующие товары.

Ну может быть вы поменялись об этой женщине данными с каким-то другим сервисом или магазином?

Нет, нет, нет. Мы работаем исключительно со своими данными. И поэтому такие попадания системы нас самих в шок повергают иногда. Есть алгоритм, но он делает такие заключения, которые просто удивляет.

В некотором смысле, нам легче и удобнее работать с Big Data, чем некоторым конкурентам, так как мы не анализируем личные данные клиентов, как, например социальные сети, а фиксируем только действия на сайте. Проблемы выбора обрабатываемых данных - какие данные необходимо извлекать, хранить и анализировать, а какие – не принимать во внимание, - у нас не возникает.

А если говорить не о смешных эпизодах с рекомендациями, есть ли какие-то серьёзные проблемы с внедрением Big Data?

Много всего. Например, иногда непонятно, как расшифровывать запрос клиента. Вот хочет он найти на сайте "детскую коляску"? С одной стороны, он может искать обычную коляску, куда можно посадить младенца. С другой стороны, может быть он искал коляску, в которой его дочка кукол возит? Как понять? Этот момент еще не решен.

Я же правильно понимаю, что рекомендательные системы вы используете исключительно для допродаж?

Не совсем. Это комплекс алгоритмов, позволяющих предсказать, что окажется наиболее интересно пользователю. Основная задача системы - сделать персональное предложение покупателю и, более того, прогнозировать его потребности в будущем. Мы начали вводить предиктивные рекомендательные системы и работать с большими данными в 2015 году. Хотелось предлагать клиентам наиболее качественный контент не только на сайте Wildberries, но и в других каналах коммуникации.

А какие критерии, по которым понять, хорошо ли вы используете данные или нет?

Критерий один - повышение конверсий заказов и их числа. Внедрение того или иного функционала, если оно не отображается на конверсии, на росте заказов, на удовлетворенности покупателей – не имеет смысла.

Некоторые западные магазины предпочитают показывать клиентам "образ", который состоит сразу из нескольких предметов одежды. Так товары покупают лучше, ведь становится понятнее, как их носить. Вы собираетесь делать систему общего образа?

Такое уже пробуем. Мы хотим дать возможность людям "поиграть в дизайнера", выкладывать свои образы из товаров, купленных на сайте WB. Затем у нас есть дизайнеры, которые делают подборку вещей и создают свои "образы".

Хотим подключить к этому процессу ИИ. Чтобы он показывал, как разные вещи подходят друг к другу по цвету, например. Сейчас мы работаем над соответствующим алгоритмом.

Назовите 3 причины, по которым использование Big Data необходимо eCommerce?

Совершенствование картины пользователей. Правильно обработанные и проанализированные большие данные помогают сформировать полное представление о клиенте и дают информацию о том, кому конкретно стоит предложить продукт, где это сделать и в какое время.

Повышение качества обслуживания. Если пользователь не нашел то, что искал, он покидает сайт. Предложив ему альтернативный товар, можно не только предвосхитить его ожидания, но и сделать лояльным клиентом.

Увеличение продаж. Использование инструментов прогнозной аналитики поможет повысить конверсию сайта и рассылок, а значит, значительно увеличить прибыль компании. К примеру, у нас в 2017 году конверсия с рассылок выросла на 50%.

Вы предполагаете, что станете рекомендательным сервисом для других магазинов?

Я говорю, что мы этого не исключаем. Сейчас такой задачи не стоит. Опыт на сегодняшний день большой. Я не могу исключать, что мы займемся рекомендательным сервисом. У нас есть понимание, как это сделать.

Вы уже прогоняли свою рекомендательную систему на базе других магазинов?

Нет, нам пока для обучения ИИ хватает и своих данных.
Материал по теме

Wildberries начал продажи во Франции, Италии и Испании

Материал по теме

Wildberries рассказал о продажах в Израиле

Материал по теме

Wildberries запустил новый портал для продавцов

Подписаться на новости

Актуальное сейчас

Fashion Tech Day 2021

2 марта в конгресс-центре “Экспоцентр” на  Краснопресненской набережной UPGRADE проведёт IV Fashion Tech Day —  место встречи технологических компаний и Fashion-ритейлеров, российских и международных модных...

Книги из "Читай-города" доставят в отделения Сбербанка

С 1 марта клиенты, оформившие заказ на сайте книжного интернет-магазина "Читай-город", смогут воспользоваться услугой бесплатной доставки от СберЛогистики. Посылку можно получить в пунктах выдачи заказо...

Домкрат весом в 32 грамма: обратная сторона социальной коммерции

В Швеции набирает обороты волна интернет-мошенничеств, связанная с покупками через социальные сети. Одной из её жертв стал Хокан Васен, который заказал в магазине на FaceBook электрический домкрат. Через месяц ...

"Пятерочка" привела экспресс-доставку в малые города

Торговая сеть "Пятерочка" впервые запустила экспресс-доставку в малых городах - теперь услугой могут воспользоваться жители Дзержинска в Нижегородской области и Зеленодольска в Республике Татарстан. ...

H&M вынуждена обновляться из-за популярности онлайн-продаж

H&M объявила о намерении обновить свою сеть из 5000 магазинов. Причиной стали новые покупательские привычки, которые сформировались в пандемию: многие клиенты из-за коронавируса привыкли заказывать товары о...

Сумма продаж через интернет-блоги увеличилась на 64% за год

По данным партнерской сети Admitad, сумма продаж через интернет-блоги и онлайн-СМИ в России всего лишь за год увеличилась на 64%. При этом россияне готовы совершать все более крупные покупки по рекоменд...