Курс молодого журналиста данных. История журналистики данных.

Журналистика данных

Журналистика данных (data journalism или Computer Assisted Reporting (CAR)) – использование современных технологий для сбора новостей. Процесс, который включает в себя фильтрование и анализ информации, чтобы находить новости. Используется открытая информацией, которая доступна онлайн или с помощью запросов такой информации у организаций и правительства.

Почему это резко стало так важно? 

— новые технологии
— движение в сторону большей открытости информации
— приложение методов социологии для сбора и представления новостей
— большая скорость и доступность компьютеров
— программное обеспечение, быстрее, дешевле, надежнее
— большие объемы информации
— большее число людей, читающих новости в электронном виде, таким образом больше возможностей рассказывать эти новости

На самом деле анализ и визуализация данных присутствовали еще до появления мощных современных технологий и методов анализа.

1812-1813: Чарльз Джозеф Минард (Charles Joseph Minard) французский инженер впервые использовал графики в инженерии и статистике.

Borodino

Изображение в полном разрешении

График не слишком простой для понимания, поэтому опишу, что происходит. Розовым показана французская армия, которая идет в Москву. Черным французская армия возвращается. Наверное, у многих читателей возникнет вопрос, а где же Бородинское сражение? Видите Москву-реку и Можайск (Moskowa и Mojaisk)розовый график 187.000 французских солдат и упадок 100.000 солдат.
Внизу на графике показаны температуры зимой. Видите, как падает температура и показаны пики и армия уменьшается? Рядом с Ботром (Botr) армия разделилась. Если найдете на графику речку Березина (Berezina)после нее от армии ничего почти не осталось.

1821: британская газета the Guardian (Manchester Guardian в то время) опубликовала таблицу школ в Манчестере, Великобритании количество школьников, посещающих каждую школу и затраты каждой школы. Она показывает, что число школьников, учащихся бесплатно больше, чем показывали официальные цифры.

ManchesterGuardianbackfull

Изображение в полном разрешении
1854: Карта Холеры доктора Джона Сноу (John Snow)

Cholera 1984


История современной журналистики данных. 

Журналистика данных появилась в США.

1952: Телеканал CBS использовал информационные технологии, чтобы предсказать результаты президентских выборов. Был использован компьютер Univac I, единственный компьютер общего назначения того времени.

Univac1
(терминал Univac I, фотография из Wikipedia) 

Читать подробнее (на английском): http://www.cnn.co.uk/TECH/computing/9904/30/1952.idg/

1967: Филип Мейер (Philip Meyer), освещая беспорядки в Детройте, использовал  социологические методы, чтобы исследовать причины беспорядковРабота получила Пулитцеровскую премию.

Читать подробнее (на английском): http://www.guardian.co.uk/uk/video/2011/dec/09/reading-the-riots-detroit-meyer-video

1980: Бил Дедман (Bill Dedman) написал серию статей о том, что банки в Атланте систематически охотнее выдают кредиты менее обеспеченным белым, чем черным американцам среднего достатка.
Также получил Пулитцеровскую премию за это работу.

Читать подробнее (на английском):
http://en.wikipedia.org/wiki/Redlining

1990: Стив Доиг (Steve Doig) проанализировал разрушения во время ураганы Эндрю, чтобы показать недостатки в градостроении. Он применил многие статистические методы анализа информации и визуализацию данных.

Читать подробнее (на английском): http://www.mentalmunition.com/2011/11/being-more-versatile-journalist-data.html

В 1970 году журналистика данных была известна как Precision Journalism.