Курс молодого дата журналиста. Начало пути.

Журналистика данных

Многие спрашивают меня об этой области журналистики, которой я увлеклась совсем недавно. По-английски это data journalism, сравнительно новая область, которая зародилась и активно развивается в США, в Великобритании эта область только появилась. Пока только две газеты имеют такие команды, the Financial Times и The Times. Область эта здесь совсем молодая, все строится практически с нуля, люди очень охотно друг другу помогают. Многие, я думаю, слышали про WikiLeaks. Об этом подробнее я напишу в следующих статьях-обзорах о моей работе. Сейчас напишу кратко, на простых примерах, что такое журналистика данных.

Итак, эта область включает в себя много всего. Одной из основных частей является анализ данных Например, сейчас я работаю над созданием базы данных и написанием истории по теме, сколько какая часть Британии потратила на олимпийский факел. Есть такой ресурс в Великобритании: https://www.whatdotheyknow.com/ Это портал, на котором можно посылать запросы Британскому правительству и общественным организациям и получать внутреннюю информацию. Например, сколько в таком-то месте потратили на факел и на что эти деньги были потрачены. По закону такого рода информация должна быть предоставлена, если приходит отказ, должна быть указана причина. И можно перейти на следующую инстанцию.

Что может сделать журналистика данных? Послать 300-400 запросов по всем частям Британии, получить такую информацию. Каждый пришлет ответ в виде письма с каким-то набором информации.. Дальше нужно ввести это все в базу данных, проанализировать. Например, кто-то потратил 40,000 на перекрытие дорог, а кто-то всего 1000 фунтов. Но при этом, возможно, те, кто потратили 1000 – это маленькая деревня… а те, кто 40,000 – это большой город. А бывает так, что все наоборот, и тогда возникают вопросы.. почему так много? А бывает.. честно, бывает, что кто-то тратил на.. огнетушители на значки для детей и на питьевую воду (300 фунтов ) В целом и общем, на основе такого анализа данных всплывают интересные выводы: воровство, неэффективный расход ресурсов и так далее. Дальше нужно собрать все эти подозрительные случае и провести расследование.. например, город А потратил на подстригание травы 7000 фунтов, при этом человек, который бежал по дороге с факелом.. ну вы понимаете, откуда там трава? Нужно им позвонить и спросить. И в статье указать их ответ. Потому что по закону нельзя просто сказать, что кто-то украл, нужно их версию тоже учесть. Так рождаются самые простые истории-расследования на основе данных.

Еще в эту область входит визуализация данных, например, на карте интерактивно показывать, где кто и на что потратил. Всю эту информацию можно предоставить в виде формы и каждый житель может посмотреть, сколько в его регионе было потрачено и на что. Местные журналисты могут у себя сделать более глубокое расследование, так как на месте лучше понятно им, что, например, закрыли 3 пожарные команды из-за того, что денег нет, но в то же время потратили на факел нереальные деньги.

Для любопытных. Вот как выглядит запрос (там же ответ):

https://www.whatdotheyknow.com/request/cost_of_olympic_torch_procession_178#incoming-379608

https://www.whatdotheyknow.com/request/cost_of_olympic_torch_procession_177#incoming-382069

Где можно почитать что-то по теме журналистики данных:

http://www.guardian.co.uk/news/datablog
http://www.niemanlab.org/
https://twitter.com/martinstabe/data-journalism

http://civic.mit.edu/blog/natematias/behind-the-new-york-times-interactive-team-with-aron-pilhofer
https://online.journalism.utexas.edu/2010/papers/Royal10.pdf

Propublica
http://www.propublica.org/nerds
https://github.com/propublica

LA Times
http://datadesk.latimes.com/
https://github.com/datadesk

Chicago Tribune
http://blog.apps.chicagotribune.com/
https://github.com/newsapps

Guardian
http://www.guardian.co.uk/profile/guardian-interactive-department
http://www.guardian.co.uk/profile/guardian-us-interactive-team

FT
http://www.ft.com/interactive
https://github.com/ft-interactive

Какие бывают работы в этой области сейчас:
http://www.newsnerdjobs.com/

Какие околопрограммистские знания могут потребоваться для журналистики данных:
– базы данных, SQL, Excel
– Python, Ruby
– статистика/анализ
– компьютерная графика (вот как это может пригодиться: http://www.nytimes.com/interactive/2013/05/26/sports/tennis/nadals-knee.html?smid=tw-share)