Created by potrace 1.13, written by Peter Selinger 2001-2015 LOGO

Кто самый авторитетный специалист в российском eCommerce

Игорь Бахарев
17 Октября 2017, в 12:02, в Новости e-commerce, в сюжете: исследование рынка e-commerce, исследование, facebook
Андрей Кулинич из Московской международной высшей школы бизнеса МИРБИС решил вычислить, кто самый авторитетный специалист в российском eCommerce в России. Тема интересная и необычная. Ищите себя и оценивайте других!

Полгода назад, я показывал Сергею Егорушкину результаты анализа аудитории в ВКонтакте. «А можно такое же, но в Facebook и по определенному списку?» - спросил Сергей. В кураже я был неудержим и пообещал чуть ли не в течении суток предоставить результаты и указать на самых авторитетных специалистов E-commerce в Facebook. Погорячился...

Как известно, практически все социальные сети закрыли возможность получения информации через API о пользователях и их активности. И именно данные стали основной проблемой. Первоначальный поставщик обещал, но не выгрузил датасет для анализа. Потом вообще перестал контактировать. На этом фоне скорость реакции ребят из SocialDataHub просто поразительная! Искомые данные были у меня в течении суток после запроса с моей стороны. Спасибо Вам!

Что за данные были на входе? Сергей Егорушкин передал мне ссылки на профили 47 наиболее авторитетных на его взгляд специалистов в eСommerce. Мы собрали информацию о связях этих людей, а также их друзей. Получилось 10677 персон и 48197 дружеских связей. Данный способ формирования датасета несколько ущербный и позволяет справедливо ранжировать по рейтингу только именно этих первоначальных 47 персон. Так что просьба не относится к результатам крайне серьезно.

Для анализа графа использовался Python + библиотека NetworkKit. Применялась абсолютно стандартная методология для анализа социального графа.

На картинке ниже собственно наш исходный граф. Но по сути, я мог бы изобразить абсолютно любой граф с большим количеством узлов и связей. Смысловая нагрузка от картинки в данном случае крайне небольшая. Но красиво.
Кулинич1.png

Давайте посмотрим на общие характеристики нашего графа, цифры больше скажут:
  1. У нас получился связанный граф. Это значит, что через некоторое количество контактов все участники связаны друг с другом, нет изолированных сообществ.
  2. Средняя ширина нашего графа составляет 1,857. Что означает, что в среднем все участники анализа знакомы друг с другом через два рукопожатия. Очень плотный граф и эту его характеристику определил подход к формированию датасета.
  3. Уровень глобальной кластеризации вершин графа составляет 0,889, что говорит о высокой вероятности наличия отдельных сообществ.
  4. А кумулятивный график степени вершин сильно перекошен, как и должно быть в жизни. Что говорит о том, что есть некоторое количество вершин (персон) с большим количеством входящих связей и наоборот.
Кулинич2.png

Граф не является однородным, и мы легко диагностируем 12 комьюнити.

Кулинич3.png
Сообщества тесно связаны друг с другом, что видно на графе взаимосвязей сообществ.

Кулинич4.png

А численность членов сообществ убывает равномерно.

Кулинич5.png

Их анализу можно посвятить отдельный материал позже, но вот как выглядит граф самого маленького внутреннего сообщества.

Кулинич6.png

Очевидно, что это сообщество объединено вокруг какого-то человека. Это выходит за рамки первоначальной цели анализа, но стало очень любопытно. Центром этого маленького сообщества оказался Александр Крынский. Если интересно, можно будет разобрать позже и остальные сообщества. Но давайте двигаться к нашей основной цели – кто он, самый авторитетный специалист в области eCommerce в Facebook.
Для определения авторитетности были использованы два алгоритма.

  1. Считал центральность узла - степень, которая показывает «важность» или «влияние» определенного пользователя (кластера пользователей) внутри графа. Если быть точным, использовался алгоритм Брандеса.
  2. Так как это интернет индустрия, то нельзя было не воспользоваться PageRank.
Результаты нашего скромного анализа представлены ниже.
Кулинич7.png

Результаты обоих методов если расходятся, то в деталях. И на первый взгляд выглядят вполне правдоподобными. Забавно, но сразу видно, что я не из этой «банды». По обоим оценкам авторитетности я замыкаю список. Поискать себя можете в файле MS Excel по ссылке, где приведен общий список всех участников анализа.

Безусловно, количество друзей очень относительный показатель авторитетности. По этой причине, я надеюсь получить от SocialDataHub данные о лайках, комментариях и репостах. И здесь картина может изменится кардинально. Продолжение следует.

Автор: Андрей Кулинич, kulinich.ru, andrey.kulinich@gmail.com

Комментарии к статье

comments powered by HyperComments
Похожие статьи и интервью