Кто самый авторитетный специалист в российском eCommerce
Игорь Бахарев
Полгода назад, я показывал Сергею Егорушкину результаты анализа аудитории в ВКонтакте. «А можно такое же, но в Facebook и по определенному списку?» - спросил Сергей. В кураже я был неудержим и пообещал чуть ли не в течении суток предоставить результаты и указать на самых авторитетных специалистов E-commerce в Facebook. Погорячился...
Как известно, практически все социальные сети закрыли возможность получения информации через API о пользователях и их активности. И именно данные стали основной проблемой. Первоначальный поставщик обещал, но не выгрузил датасет для анализа. Потом вообще перестал контактировать. На этом фоне скорость реакции ребят из SocialDataHub просто поразительная! Искомые данные были у меня в течении суток после запроса с моей стороны. Спасибо Вам!
Что за данные были на входе? Сергей Егорушкин передал мне ссылки на профили 47 наиболее авторитетных на его взгляд специалистов в eСommerce. Мы собрали информацию о связях этих людей, а также их друзей. Получилось 10677 персон и 48197 дружеских связей. Данный способ формирования датасета несколько ущербный и позволяет справедливо ранжировать по рейтингу только именно этих первоначальных 47 персон. Так что просьба не относится к результатам крайне серьезно.
Для анализа графа использовался Python + библиотека NetworkKit. Применялась абсолютно стандартная методология для анализа социального графа.
На картинке ниже собственно наш исходный граф. Но по сути, я мог бы изобразить абсолютно любой граф с большим количеством узлов и связей. Смысловая нагрузка от картинки в данном случае крайне небольшая. Но красиво.
Давайте посмотрим на общие характеристики нашего графа, цифры больше скажут:
- У нас получился связанный граф. Это значит, что через некоторое количество контактов все участники связаны друг с другом, нет изолированных сообществ.
- Средняя ширина нашего графа составляет 1,857. Что означает, что в среднем все участники анализа знакомы друг с другом через два рукопожатия. Очень плотный граф и эту его характеристику определил подход к формированию датасета.
- Уровень глобальной кластеризации вершин графа составляет 0,889, что говорит о высокой вероятности наличия отдельных сообществ.
- А кумулятивный график степени вершин сильно перекошен, как и должно быть в жизни. Что говорит о том, что есть некоторое количество вершин (персон) с большим количеством входящих связей и наоборот.
Граф не является однородным, и мы легко диагностируем 12 комьюнити.
Сообщества тесно связаны друг с другом, что видно на графе взаимосвязей сообществ.
А численность членов сообществ убывает равномерно.
Их анализу можно посвятить отдельный материал позже, но вот как выглядит граф самого маленького внутреннего сообщества.
Очевидно, что это сообщество объединено вокруг какого-то человека. Это выходит за рамки первоначальной цели анализа, но стало очень любопытно. Центром этого маленького сообщества оказался Александр Крынский. Если интересно, можно будет разобрать позже и остальные сообщества. Но давайте двигаться к нашей основной цели – кто он, самый авторитетный специалист в области eCommerce в Facebook.
Для определения авторитетности были использованы два алгоритма.
- Считал центральность узла - степень, которая показывает «важность» или «влияние» определенного пользователя (кластера пользователей) внутри графа. Если быть точным, использовался алгоритм Брандеса.
- Так как это интернет индустрия, то нельзя было не воспользоваться PageRank.
Результаты обоих методов если расходятся, то в деталях. И на первый взгляд выглядят вполне правдоподобными. Забавно, но сразу видно, что я не из этой «банды». По обоим оценкам авторитетности я замыкаю список. Поискать себя можете в файле MS Excel по ссылке, где приведен общий список всех участников анализа.
Безусловно, количество друзей очень относительный показатель авторитетности. По этой причине, я надеюсь получить от SocialDataHub данные о лайках, комментариях и репостах. И здесь картина может изменится кардинально. Продолжение следует.
Автор: Андрей Кулинич, kulinich.ru, andrey.kulinich@gmail.com
Подписаться на новости
Прочитаете,
когда вам будет удобно
Свежий дайджест из мира
eCommerce у вас в почте