Media Hack Day в Берлине: визуализация пользовательских сетей при помощи social graph

Журналистика данных

22-23 марта в Берлине во второй раз прошел хакатон Media Hack Day,  организованный одним из крупнейших немецких издательств Axel Springer. В нем принимало участие около 60 человек из Германии, Польши, Италии. Основные темы хакатона – content и mobile. Свои API участникам предоставили издательства в том числе Axel Springer и Sanoma, немецкий журнал Spiegel, фотоагентство Getty Images и агентство социальных новостей Storyful. Наша команда – я и программист Артем Пряхин – работала с API Storyful и выиграла приз за лучшее использование их API.

Наталья и Артем с Адамом Томасов (Storyful)
Наталья и Артем с Адамом Томасов (Storyful)

Storyful – это социальное новостное агентство, которое занимается тем, что отслеживает темы, набирающие значение в соцсетях и создает на их основе истории. Одну из важнейших направлений работы Storyful составляет верификация информации, для этого был разработан специальный чеклист. Чего в нем не хватает, так это визуализации связей между пользователями, чьи материалы агентство использует для новостей.

Поэтому мы решили создать инструмент для внутреннего анализа данных. Суть такова: мы берем из API Storyful список пользователей по определенной теме вместе с названием их аккаунта в Твиттере, подключаемся к API Твиттера и «вытаскиваем» оттуда «фолловеров» первой, а в идеале еще и второй и более степени.

После двухдневного хакатона
После двухдневного хакатона

При помощи библиотеки D3.js можно в итоге создать social graph пользователя – это дополнительный параметр верификации, позволяющий определить социальное окружение пользователя. К дальнейшим параметрам проверки относятся не только имена «фолловеров», но и их степень доверия, географическое положение и темы, которые они затрагивают в своих твитах. Конечно, это пока сырая версия продукта, при дальнейшем развитии каждый узел заменяется изображением профильного фото пользователя, также должна появится сортировка по региону и теме.

hackathon_code
Наш код

Полное описание нашего проекта можно найти на английском здесь, все проекты, представленные на хакатоне, лежат вот здесь.