ДЕНЬ 01

Про интерфейс и основные термины

Осматриваем ландшафт

Перед началом забега мы установили и настроили программное обеспечение, выбрали стратегию обучения и познакомились с продуктами Tableau.

СЕГОДНЯ

Стартуем с КЛЮЧЕВЫХ концепций Tableau, без которых сложно сделать понятную визуализацию. А без разбора деталей интерфейса продукта работа не может быть быстрой и комфортной. Начнем с основных элементов визуализаций. Дальше работаем c классическими таблицами — скучно, но полезно. И обязательно — полезняшки в виде ссылок, материалов и видео для вдохновения.


Ваша главная цель — научиться «видеть» данные.

Мы постарались избежать англоязычных материалов для демонстрации базовых возможностей Tableau. Но не бойтесь искать их сами — у Tableau прекрасное англоязычное сообщество. Его участники щедро делятся материалами.

РАЗБИРАЕМСЯ

В основах и терминологии
Как работать в Tableau?

Работа в Tableau построена на взаимодействии с данными в Рабочей книге (Workbook) при помощи Листов-вкладок (Sheet). Стартовая вкладка для работы с данными — DataSource. Здесь подключаются новые и редактируются уже существующие источники данных, создается модель данных. В остальных вкладках ведется работа над визуализацией данных. Вкладки рабочей книги называются Рабочий лист, Дашборд и История.

Рабочий лист (Sheet или Worksheet) — основная вкладка для работы в Tableau. Создание визуализаций (диаграмм, графиков, карт) происходит именно здесь. Каждый Лист может быть скопирован в новую рабочую книгу и сохранен отдельно. Вы можете создавать новые Листы, переименовывать их, дублировать, скрывать или удалять.

Дашборд (Dashboard) — это коллекция из нескольких рабочих листов. Он позволяет собрать вместе графики, созданные на Рабочих листах, добавив к ним заголовки, легенды, фильтры и выстроить «рассказ».

История (Story) — это последовательность Рабочих листов или Дашбордов в виде повествования, презентации.

Рабочая область и визуальные обозначения

Разберем, из каких областей состоит Рабочий лист — наша главная рабочая среда.
Рабочая область
рабочая область Tableau
A — Название Рабочей книги
B — Область Pages
C — Область фильтров
D — Область меток (визуального представления данных)
E — Панель инструментов
F — Полки строк (Rows) и столбцов (Columns) (сюда помещаются поля, задействованные в визуализации)
G — Рабочая область
H — Кнопка перехода на начальную страницу
I — Боковая панель (Панель данных или Панель аналитики)
J — Переход на страницу источника данных
K — Строка состояния
L — Созданные рабочие листы, дашборды или истории
M — Для создания нового рабочего листа, дашборда или истории
Визуальные обозначения
Познакомьтесь с визуальными обозначениями и кодировками. Обращайте внимание на цвет, подписи, пиктограммы. Они помогают понимать информацию на экране.
обозначения Tableau

A — перейти на начальную страницу

B — отменить последнее действие

C — повторить последнее действие, которое отменили с помощью кнопки «Отменить»

D — сохранить изменения

E — подключить новый источник данных

F — остановить/запустить автоматические обновления

G — обновить текущий лист или дашборд (при остановленном автоматическом обновлении)

H — создать новый рабочий лист (либо дашборд или историю при раскрытии списка)

I — создать дубликат текущей вкладки (листа, дашборда или истории)

J — очистить текущий лист или дашборд

K — переместить строки в столбцы и наоборот

L — сортировать по возрастанию

M — сортировать по убыванию

N — добавить на лист или дашборд подсветку по определенному полю

O — включить выделения для рабочего листа

P — включить подписи данных

Q — зафиксировать оси

R — настроить вид отображения листа (с заданными шириной и высотой либо в полный экран)

S — добавить или скрыть элементы (заголовок, фильтры, легенды и т. д.)

T — запустить режим презентации

U — поделиться рабочей книгой

Продолжение большого справочника визуальных подсказок, значков и горячих клавиш — в карусели. Сейчас все это немного пугает, но сделайте себе закладку на будущее — всегда можно вернуться и подсмотреть нужное обозначение. Увеличивается по клику.
Измерения и меры.
Дискретные и непрерывные поля

Чтобы работать с данными, надо понимать, как они устроены.

Когда Tableau подключается к источнику данных, все столбцы с данными превращаются в поля на панели данных.

Все поля на панели данных в Tableau делятся на две основные группы: Измерения (Dimensions) и Меры (Measures).

Представим, что вам нужно проанализировать продажи. Вряд ли вас устроит ответ 1,5 миллиарда (а это сумма выручки по всем проданным товарам в вашем источнике данных). Для анализа нужны определенные срезы данных: по годам, по категориям товаров, по типам клиентов.
Измерения — это те поля, которые позволяют создавать срезы данных, сегментировать данные. Например, поле с названиями категорий товаров. Добавляя такое поле на визуализацию, получим не сумму выручки вообще, а сумму выручки по каждой из категорий. И вместо одной метки в рабочей области, увидим несколько.

Меры — это поля с количественными данными. Меры в Tableau автоматически агрегируются при добавлении на визуализацию (например, суммируются).

На панели данных Измерения находятся над серой чертой, Меры — под чертой.

Второе деление полей в Tableau: поля Дискретные (Discrete) и Непрерывные (Continuous).

Дискретные поля можно узнать по синему цвету. Они содержат отдельные значения и создают заголовки на визуализации. Примеры дискретных данных: названия регионов, имена клиентов, коды товаров.

Непрерывные поля — зеленого цвета. Они принимают значения из определенного диапазона, а на визуализации создают ось. Примеры непрерывных данных: вес, рост, количество проданных товаров, прибыль, температура.

Поля становятся похожими на цветные пилюли. По-английски поля в этой области так и называются — «pills».
Таким образом, в Tableau может быть 4 типа полей:
  • Discrete Dimension*
  • Discrete Measure
  • Continuous Dimension
  • Continuous Measure*
*Используются чаще всего и назначаются Tableau по умолчанию.

Дискретные меры и непрерывные измерения вообще встречаются? Да! В карусели ниже примеры таких случаев.
Поля и их типы
Tableau автоматически определяет тип данных каждого поля: текст, число, дата, геоданные, булевое (True/False). На тип указывают маркеры: какие символы встречаются, какова длина поля.

Присвоенный полю тип данных можно узнать из пиктограммы и в контекстном меню нужного поля. Там же можно изменить присвоенный тип данных.

Когда нужно изменять тип данных?


Автоматически тип данных может быть определен неверно. Например, полю присвоен числовой тип с целочисленным значением вместо дробного. При добавлении новых данных в источник это может привести к неточным расчетам.

Быстрый способ изменить тип данных в поле или присвоить ему геороль — кликнуть на пиктограмму слева от поля на панели данных и сделать нужный выбор.

Alias

Для Дискретных Измерений можно создавать псевдонимы (alias) для отдельных значений. Эти псевдонимы будут использоваться на визуализации, но не повлияют на оригинальные значения поля. Например, можно назвать яблоки «фруктами», а огурцы «овощами».
Важно
Помните про алиасы при создании вычисляемых полей. Там вы можете использовать только оригинальное значение поля, иначе Tableau не поймет вашу формулу.
Автоматически создаваемые Tableau переменные

Tableau умеет создавать поля не только на основе источников данных, но и генерировать их автоматически. Чтобы их не перепутали с полями, загруженными из источника, автоматические поля выделены курсивом.
Вот эти поля:

  • Count
  • Measure Names & Measure Values
  • Latitude (generated) & Longitude (generated)

Поле Count в формате ИмяТаблицы(Count) показывает количество записей в таблице источника или в текущем срезе данных. Если в вашей таблице 100 записей, то ИмяТаблицы(Count) покажет 100. Если вы отфильтруете только города в России и их останется 50, то Count покажет 50. До версии 2020.2 оно называлось Number of Records.

По сути, это счетчик строк, по которому удобно проверять качество загруженных данных. Если вы знаете, что в исходной таблице должно быть 1 300 строчек, именно это поле покажет, все ли они загружены в Рабочую книгу. Аналогом поля Count является поле с числом 1.
Measure Names & Measure Values

Дискретное поле Measure Names — это измерение, которое содержит названия всех мер в вашем источнике данных. Просто как список названий всех полей, которые находятся под чертой: прибыль, продажи, количество заказов и т.п.
Непрерывное поле Measure Values содержит набор всех мер из вашего источника данных. При добавлении поля на визуализацию появляется отдельная область (полочка) под карточкой меток, на которой можно оставить только необходимые меры.
Больше информации про Measure Names & Measure Values будет в дне 11.
Latitude (generated) & Longitude (generated)

Если Tableau распознает в источнике поля с геоданными, оно автоматически создаст для них поля с геокоординатами: Широтой и Долготой. Без лишних сложностей можно построить карту и показать на ней нужные данные.
Больше информации про Latitude (generated) & Longitude (generated) будет в дне 10.
Для систематизации полей используйте возможность создания папок (Folders) на панели данных. Группируйте близкие по смыслу переменные или собственные вычисления. Держите все в порядке.
Как создавать визуализации
Мы рассказали о том, какие бывают данные и из чего состоит рабочая область Tableau. Теперь о том, как создавать визуализации.

Все визуализации составляются из разных полей, как набор кубиков конструктора Лего. Одни кубики влияют на макет и структуру визуализации (Rows/Columns), другие — на внешний вид (Marks: Color, Size, Shape, Detail), третьи — на выборку данных (Filters).

Есть несколько подходов к созданию визуализаций, но наиболее правильным будет такой маршрут:

  1. Определение нужных полей (Dimensions, Measures).
  2. Добавление выбранных полей в области Rows/Columns для получения структуры виза.
  3. Если необходимо, то настройка фильтров (Filters).
  4. Изменение внешнего вида (Marks...).
  5. Добавление контекста (Labels, Tooltips).
  6. Прочие настройки: форматирование, размер визуализации, «докручивание» внешнего вида.
  • На схеме показаны области, которые «создают» визуализации:
    • фильтры;
    • структура визуализации (какие поля должны быть на осях, в категориях);
    • внешний вид (цвет, размер, подписи, способ визуализации);
    • в центре экрана есть область автоматической визуализации Magic Zone. Tableau использует магию Show Me.
Show Me

Набор лучших практик по визуализации данных у вас под рукой. В правом верхнем углу рабочего листа Tableau собраны 24 виза с подсказками, как их получить.
Можно пользоваться двумя подходами к созданию визуализаций.

1. Получите рекомендации. Выберите виз в Show Me и наведите мышью на его пиктограмму. Внизу появится подсказка, какие типы полей нужны для создания виза. Или через Shift выделите категории и меры, которые хотите визуализировать. Откройте меню Show Me. Выберите подходящий вам вариант диаграммы (красным прямоугольником Tableau подсвечивает оптимальный виз).

2. Постройте самостоятельно. Добавляйте поля в области Строк, Столбцов, Меток (Rows, Columns, Marks) или же напрямую в область визуализации.

Из чего состоит визуализация?
Любая визуализация состоит из 4 компонентов — система координат, шкала, визуальная кодировка и контекст. Каждый выполняет свою функцию, а вместе они обеспечивают простое и быстрое понимание диаграммы зрителем. Если вы разберетесь, из чего состоят и как работают эти компоненты, выбрать подходящий тип визуализации для ваших данных будет проще.

Внешний вид визуализации полностью зависит от выбранной системы координат. Их 3 вида: Декартова, полярная и географическая.
Система координат
Самая популярная и знакомая со школы Декартова система с координатами X и Y. Геосистема в качестве координат использует широту и долготу, позволяя строить карты. В полярной системе координаты располагаются в соответствии с радиусом и величиной угла.
Шкалы
На шкалах находятся подписи данных. Благодаря им мы понимаем, на что смотрим, какая размерность у графика, что представляет каждая категория.
Визуальная кодировка
Визуальная кодировка данных позволяет представить их в понятном, легко считываемом виде. К визуальной кодировке относятся типы меток (линии, столбики, текст), цвет, форма, размер и т.д.
Помните, что для правильного понимания данных важна Легенда. Она нужна, если у визуализации есть условные обозначения: цвета, формы или размера. Чтобы увидеть и настроить Легенду, нажмите на стрелку раскрывающегося списка в правом верхнем углу Листа и выберите этот пункт.
Контекст
Контекст позволяет не только считать общие тренды, но и понять причину, их вызвавшую. Подумайте над заголовком, добавьте аннотацию, но не увлекайтесь, чтобы не перегрузить визуализацию.
Пробуем сделать таблицу
Это тоже визуализация!
Вы не любите кошек таблицы? Вы просто не умеете их готовить! Тем важнее будет иметь этот навык, если ваши пользователи «прикипели» к табличному представлению данных.

Чтобы построить таблицу в Tableau нужны только поля Измерений, а Меры добавляем на карточку Меток в область текста. Или пользуемся всемогущим меню Show Me: выделяем нужные измерения и меры, нажимаем на пиктограмму таблицы (text table) в Show Me и наслаждаемся результатом.
Зачем делать таблицы, это же не про визуальную аналитику?

У всего есть область применения. С таблицами эффективно:
  • сравнить несколько разнородных показателей, например, План/Факт анализ;
  • показать значения с высокой точностью после запятой;

  • переходить от табличной отчетности к визуальной аналитике (и обратно, когда вам говорят: это всё хорошо, но покажите мне ЦИФРЫ!).

СОВЕТ
Не бойтесь экспериментировать и пробовать! Всегда можно вернуться на шаг назад. Кнопка «Отменить» в Tableau бесконечна.
Как поделиться дашбордом
Tableau предлагает много вариантов, как поделиться результатами своей работы. От простой выгрузки в виде картинок, PDF или загрузки данных в Excel до публикации онлайн, обмена рабочими книгами по почте или интеграции в корпоративный портал.

Для Tableau Public
Для Tableau Desktop
ПРАКТИКУЕМСЯ
О датасете
Датасет содержит статистику по топ-игрокам Чемпионата Европы по футболу 2020.

Чтобы подключиться к данным, посмотрите короткую инструкцию.
Для выполнения заданий стройте таблицы. На некоторые вопросы вам помогут ответить знания визуальных обозначений и автоматически сгенерированные поля.
Задания
  1. Подсчитайте количество записей в датасете.
  2. Сколько в датасете полей Измерений? Не учитывайте автоматически сгенерированные поля.
  3. Какие Меры с числовым типом данных с плавающей точкой есть в датасете?
  4. Найдите страну с максимальным количеством забитых голов. Помните, мы используем таблицы.
  5. Создайте Алиасы для позиций игроков в футболе (forward, midfielder, defender, not specified). Определите, игроки какой позиции пробежали максимальную совокупную дистанцию.
  6. Какой футболист сыграл наибольшее количество минут за Италию?

Скачать задание в виде книги Tableau
В теории нет разницы между практикой и теорией. Но на практике она есть.

// Jan van de Snepscheut
ВДОХНОВЕНИЕ
Полезные ссылки по теме
Знакомимся со справочными материалами и примерами использования баров в визуализации. Насмотренность помогает подобрать нужный виз или прием.
Что нужно знать для работы в DataScience
Вдохновляющие визуализации, созданные в Tableau Public
Потрясающий источник вдохновенных проектов
Справка Tableau

Полный (и очень user-friendly) справочник по работе с Tableau.

МАТЕРИАЛЫ
Видео
Выступление неподражаемого Ханса Рослинга. Уважаемый спикер на Tableau конференциях и большой шоумен статистических инсайтов.
Рослинг рассказывает о статистике, данных и экономиках стран мира. Смотреть с русским транскриптом на сайте TED.com
Книги
Чтобы создавать эффективные визуализации данных, вам нужно быть и экспертом в статистике, и дизайнером, а еще мастером рассказывать истории. Автор книги «Данные» говорит о том, что же помогает создавать оригинальные и полные смысла визуализации, которые аудитория не только поймет, но и запомнит.
Данные
Nathan Yau
Итоги этапа
Освоили интерфейс и запомнили нужные сочетания клавиш для быстрой работы, отличаете измерения от мер. Построили свою первую таблицу — не так уж и сложно, правда? Разогрелись на ответах на простые вопросы при работе с датасетом и листаем книги из библиотеки, заполняя время, отведенное для вечерней медитации. Завтра — ответы на вопросы практики и подготовка к освоению визуальных кодировок и бар-чартов. Виз-виз ура!

Бежим Марафон в команде!

С менторством и в компании единомышленников.
Нажимая кнопку, вы соглашаетесь на обработку персональных данных. Мы используем их, чтобы оставаться на связи. Подробнее здесь.