Журналистика данных

О дата-журналистике на русском языке

Глоссарий

База данных (Database)
1. Совокупность взаимосвязанных данных, организованных в соответствии со схемой базы данных таким образом, чтобы с ними мог работать пользователь (ГОСТ 34.321-96).
2. Совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимая от прикладных программ (из п. 6 ГОСТ 20886-85).

Большие данные (Big Data)
1. Большие данные в информационных технологиях — серия подходов, инструментов и методов обработки структурированных и неструктурированных данных огромных объёмов и значительного многообразия для получения воспринимаемых человеком результатов, эффективных в условиях непрерывного прироста, распределения по многочисленным узлам вычислительной сети, сформировавшихся в конце 2000-х годов, альтернативных традиционным системам управления базами данных и решениям класса Business Intelligence. (Источник:http://ru.wikipedia.org/wiki/Big_Data)
2. Это относительное понятие, значение которого может со временем меняться. Наиболее простой способ определения – это данные, которые не помещаются на жёстом диске одного компьютера. Естественно, объемы жестких дисков у разнах компьютеров могут быть разными, кроме того вместительность и производительность компьютеров постоянно растет. Однако объемы доступных для обработки данных также постоянно наращиваются. Исходя из этого всё чаще оказывается более рациональным не увеличивать объемы диска одного компьютера, а развивать методы и инструменты для так называемой облачной обработки данных, которые хранятся частями на нескольких компьютерах.

Визуализация (Visualization)
Представление данных в графической форме. В отличие от термина “инфографика”, который может относиться к любым формам графического отображения информации (в том числе, например, инструкций), визуализация подразумевает, в первую очередь, отображение численных данных. При работе с данными она используется двояко. Во-первых, при исследовании данных строятся черновые графики, позволяющие быстро заметить закономерности и потенциальные взаимосвязи. Во-вторых, представление результатов анализа данных зачастую требует визуального сопровождения, как наиболее эффективного способа продемонстрировать некоторые наблюдения.

Геймификация (Gamification)
Применение подходов, характерных для компьютерных игр в программных инструментах для неигровых процессов с целью привлечения пользователей и потребителей, повышения их вовлечённости в решение прикладных задач, использование продуктов, услуг (Источник: http://ru.wikipedia.org/wiki/%D0%98%D0%B3%D1%80%D0%BE%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D1%8F).

Грязные данные (Messy Data)

Данные (Data)
Представление информации в формализованном виде, пригодном для передачи, интерпретации или обработки. (Источник: ГОСТ Р 52653-2006, Информационно-коммуникационные технологии в образовании. ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ, http://docs.cntd.ru/document/gost-r-52653-2006)

Дата-журналист (Data Journalist)
Журналист, специализирующийся на журналистике данных (см.).

Дата-экспедиция (Data Expedition)
Это неформальное общедоступное образовательное онлайн-мероприятие, строящееся на принципах проектного обучения и взаимопомощи. Под “проектным” имеется в виду, что итогом участия в идеале должно стать создание индивидуального или коллективного проекта. Даже если идеала достичь по тем или иным причинам не удается, каждая экспедиция сама по себе строится как процесс работы над определенным проектом. Говоря о “взаимопомощи”, мы исходим из того, что у каждого из участников экспедиции, помимо желания получить результат, есть те или иные навыки и опыт. Будучи у всех людей разными, они могут дополнять друг друга. Чем интенсивнее обмен знаниями между участниками в ходе работы над проектом, тем у всех больше шансов научиться чему-нибудь новому и полезному. С другой стороны, если участник просто наблюдает и следует инструкциям, но не хочет вступать во взаимодействие с остальными, против этого тоже никто возражать не будет. У каждого свой стиль обучения и работы. Термин “экспедиция данных” заимствован из практики OKF/School of Data (http://schoolofdata.org/). Принципы взаимного обучения, лежащие в основе такого формата, разработаны, в частности, такими открытыми образовательными ресурсами, как OKF/School of Data (http://schoolofdata.org/) и P2P University (https://p2pu.org/en/). Подробнее о дата-экспедициях см. раздел Экспедиции данных (http://datadrivenjournalism.ru/practicum/data-expeditions/).

Журналистика данных (Data Journalism)

Краудсорсинг (Crowdsourcing)
Передача некоторых производственных функций неопределённому кругу лиц, решение общественно значимых задач силами добровольцев, часто координирующих при этом свою деятельность с помощью информационных технологий. (Источник: http://ru.wikipedia.org/wiki/%D0%9A%D1%80%D0%B0%D1%83%D0%B4%D1%81%D0%BE%D1%80%D1%81%D0%B8%D0%BD%D0%B3)

Машиночитаемые форматы данных (Machine-Readable Data)

Открытые данные (Open Data)
Это данные, представленные в открытом доступе в машиночитаемом формате и доступные для дальнейшей переработки. Согласно определению НП “Информационная культура” (http://infoculture.ru/ru/ekspertiza/glossary/), “открытые данные – это одна из форм представления информации в машиночитаемом виде, когда информация представлена в формате, пригодном для загрузки в системы баз данных и может быть интегрирована с другими массивами данных или быть объектом анализа”.

Очистка грязных данных (Cleaning Messy Data)

Полнотекстная визуализация (Full-Text Visualization)

Скрэпинг (Scraping)

Хакер (Hacker)

Цифровая история (Digital Storytelling)

Cross-Border Collaboration —

Computer-Assisted Reporting —

Theme by Anders Norén