Данные ДЭ2

Экспедиции данных

UPD (18.12.2013): Набор в ДЭ2 завершен начиная со второй недели экспедиции. Если кто-то хотел, но не успел поучаствовать в этот раз, мы будем рады, если вы присоединитесь к нам в следующей экспедиции, о подготовке к которой мы будем сообщать в этом блоге.

2014-10-06 18_18_17-Microsoft Excel - onlineVideo

Сегодня стартовала Вторая русскоязычная дата-экспедиция, в просторечии именуемая ДЭ2.

Пока она только началась, так что если есть еще желающие, есть возможность подключиться к процессу на ранних этапах. Для этого нужно заполнить анкету:

https://docs.google.com/forms/d/1YMEpBG-2khhSqIv0mtLbRjO-RR6LldUg3iDqawoaKrU/viewform

Единственный момент. Если вы хотите участвовать, то вам понадобится аккаунт в Google. Можно зарегистрировать новый, можно воспользоваться имеющимся, если он у вас есть. И пожалуйста, оставляйте актуальный электронный адрес, потому что в противном случае мы не сможем включить вас в группу экспедиции. У нас уже есть одна такая заявка. Вероятно, в адресе ошибка. В любом случае, если в течение суток вам не приходит приветственное письмо и приглашение к вступлению в группу экспедиции, это значит, что мы не смогли с вами связаться по тому адресу, который вы предоставили. А если это так, имеет смысл повторно заполнить анкету.

Для заранее подготовленного сценария дата-экспедиции мы подобрали набор данных. Разумеется, никто не обязан следовать этому сценарию или использовать именно этот набор.

Итак, для этой экспедиции мы взяли набор данных, собранных летом 2013 г. по итогам опроса, проведенного среди американцев исследовательским центром PSRAI Omnibus (http://www.psrai.com/omnibus.shtml) и размещенные на портале проекта по исследованию того, как люди используют Интернет (PEW Internet & American Life Project, http://pewinternet.org/).

Опрос был посвящен использованию онлайн-видео (кто смотрит, что смотрят, что публикуют, каким образом – и т.д.).

Данные можно найти здесь:

http://pewinternet.org/Shared-Content/Data-Sets/2013/July-2013–Online-Video-%28onmibus%29.aspx

Это прямая ссылка, по которой можно скачать данные в формате CSV:

http://pewinternet.org/~/media/Files/Data%20Sets/2013/Omnibus_July_2013_Video_csv.csv

Это прямая ссылка, по которой можно скачать описание данных в формате DOCX:

http://pewinternet.org/~/media/Files/Data%20Sets/2013/Omnibus_July_2013_Video_Questionnaire.docx

Файл с описанием содержит расшифровку сокращений, используемых для обозначения переменных, способов обозначения того или иного ответа, а также позволяет получить представление о том, на какие именно вопросы и в каком случае отвечали респонденты.

Естественно, оригинальный файл с описанием – англоязычный. На случай, если кто-то с английским языком не совсем на дружеской ноге, мы сделали перевод, точнее  сопроводили исходные описания переводом, так чтобы там были и английский, и русский варианты.

Описание данных с русским вариантом, можно найти здесь:

https://docs.google.com/document/d/1uMmvCfsXt2IgbHANhP9yoDEP7rmGiVoTyr2By28EP3w/edit?usp=sharing

Почему именно этот набор?

Выбрать набор данных для экспедиции было непросто, потому что некоторые наши пожелания к нему противоречили друг другу. Во-первых, например, нам, конечно, хотелось найти какие-нибудь интересные данные по России. Во-вторых, нам нужно было, чтобы эти данные с самого начала были довольно чистыми и хорошо организованными, чтобы участники не тратили время на приведение их в удобоваримый вид, ибо у нас всего две недели. В-третьих, мы хотели, чтобы в наборе сразу было много переменных – чтобы был готовый материал для сопоставлений и сравнений. В-четвертых, нам нужно было, чтобы данные по своим габаритам умещались в гугл-таблицу на случай, если у кого-то из участников будет именно этот инструмент.

Иными словами, пришлось определяться с приоритетами, и последние три перевесили.

Надеемся, что этот набор данным окажется занятным тренажером.