Tableau Public и Data Wrangler

Журналистика данных Инструменты

Два хороших инструмента.

Tableau Public – это программа для визуализации данных. Скачивается (в целях ознакомления) с сайта, читает самые разные форматы, обладает внятным (в какой-то мере даже интуитивно понятным, как и полагается проприетарному софту) интерфейсом и в качестве конечного продукта выдает интерактивную инфографику, которую автор может расположить и оформить по своему усмотрению. На сайте также есть большое количество учебных материалов (по-английски, естественно). И еще есть такая полезная вещь, как галерея визуализаций. Прелесть галереи в том, что там представлены действительно качественные работы, которые можно скачать к себе на компьютер и препарировать на предмет того, как это устроено. В частности, можно извлечь таблицу с данными, которые, собственно, были исходным материалом.

Подготовка таблицы к работе с Tableau Public – это один из ключевых моментов. Её надо подготовить так, чтобы программа могла её правильно прочитать и чтобы её компонентами можно было свободно оперировать. Специфика в том, что таблица, понятная человеку, может быть крайне непонятной для TP. Говоря точнее, чтобы TP мог нормально её обрабатывать, данные должны быть представлены в виде исходника, без пустых строк, столбцов, лишних заголовков, заметок, вычислений и т.д.

Из недостатков. Tableau Public существует только  для Windows – под Линукс MacOS версии нет.

И здесь мы переходим к еще одному полезному инструменту под названием Data Wrangler. Data Wrangler работает в браузере и представляет собой инструмент для очистки данных и видоизменения таблицы. О том, как оно работает, можно почитать (по-английски) здесь и здесь.