Журналистика данных как процесс

Журналистика данных

Журналистика данных или дата-журналистика представляет собой дисциплину, в рамках которой изучается работа с данными (базами данных, данными, представленными в вебе и  открытыми данными). Получается, что в основе журналистики данных лежит некий процесс, производимый дата-журналистом над данными (массивом или набором данных), и этот процесс можно условно разделить на четыре стадии:
1. Получение данных.
2. Фильтрация данных.
3. Визуализация данных.
4. Построение истории на основе данных.

Условная схема сего процесса представлена на следующем рисунке.
Это по сути перевод на русский язык схемы, представленный Мирко Лоренцом в своем блоге (http://www.mirkolorenz.com/?id=6).
DDJprocess
Необходимо отметить, что данные, которые используются в этом процессе, должны быть открытыми данными, а инструментарий дата-журналиста должен распространяться под открытой лицензией с открытым кодом. Лишь в этом случае все участники процесса и сам процесс обработки данных выполняется в рамках доктрины открытости, которая подразумевает свободный доступ к данным и аналитическим инструментам обработки данных.
Таким образом, решается одна из важных и краеугольных задач — повторяемость эксперимента.
Когда есть возможность проверить результаты действий дата-журналиста, в этом случае возникает больше доверия к его деятельности.

Via Ирина Радченко