Твой проект —
твоя профессиональная
Траектория

Разработка системы оценки влиятельности пользователя в социальной сети

Партнер
ВУЗ
Актуальность

Разные люди по-разному пользуются социальной сетью: кто-то много пишет посты и лайкает друзей, а кто-то предпочитает общаться лишь с парой знакомых. 

Иногда вы хотите узнать, кто наиболее влиятелен в классе, школе, регионе или даже всем мире: вы можете искать блогера, который мог бы написать о вашем проекте или познакомиться с “нужными” людьми на конференции.

Основной вопрос задания — “можем ли бы посчитать влиятельность человека по его странице в социальной сети?”


Описание

Влиятельность — это способность человека распространять свое мнение. Когда вы делитесь чем-то в социальных сетях или реальной жизни и ваше окружение реагирует — это влиятельность.  

Чем больше людей реагируют на ваши действия и чем активнее они это делают, тем больше ваша влиятельность в ВКонтакте. 

Например, один репост вашей записи весит больше для влиятельности, чем просто лайк от друго пользователя. С другой стороны, лайк известного блогера должен весить больше, чем сделанный одноклассницей репост.

Нам интересно, можно ли оценить влиятельность человека одним числом, используя открытые данные ВКонтакте — социальный граф, лайки и репосты, охват постов и т.д.

Результат

Попробуйте написать простое веб-приложение, которое позволит посчитать для конкретного пользователя его influence score. 

Опишите в отдельном документе методы, которые вы использовали и почему вы их использовали. В идеале, каждое решение должно основываться на данных — тогда об этих данных тоже стоит упомянуть.

В любом случае, постарайтесь подготовить график распределения разных значений влиятельности (есть гипотеза, что он должен быть похож на нормальное распределение).

Если у вас останется время, создайте топ пользователей по вашей модели influence score из какой-нибудь социальной группы (например, только люди с “галочкой”). Сравните его с различными рейтингами медиаперсон.

Требования

Система должна опираться только на открытые данные, полученные с помощью API ВКонтакте.

Ограничения
Вы должны иметь возможность посчитать данный показатель для 1 пользователя за 3 секунды, поэтому сложные методы анализа графов исключаются. При подсчете алгоритм не должен использовать >256 MB оперативной памяти.