ДЕНЬ 30

Про аналитику
Вчера мы узнали, как в Tableau строить график маркетинговых воронок и охватили принцип 80/20, визуализировав его графиком Парето.

СЕГОДНЯ

Изучаем вкладку Analytics в Tableau. Разберемся с основными понятиями и возможностями аналитического раздела в интерфейсе продукта. Главное понять, зачем нам нужны все эти инструменты в реальной работе. Для пытливых ставим на полку базовый курс статистики в комиксах.
Напомним: визуальная аналитика это не только цвет и шрифт, а еще и понимание того, что скрывается за данными. Этому мы посвятили постер аналитических практик, который поможет связать «данные-полки-визы» в единую картину. Вдохновляться будем дата-гуманистическим манифестом от Джорджии Лупи, которая призывает нас делать аналитику более человечной. Ну что, побежали!

РАЗБИРАЕМСЯ

Аналитика в Tableau

кластерный анализ
Пример использования аналитики — кластеризация. Это когда множество объектов разбиваются на группы (кластеры) по определенному сходству или различию.
Вкладка аналитики в панели данных дает возможность легко и быстро использовать популярные аналитические функции в Tableau. Можно добавлять опорные линии, тренды и прогнозы, доверительные интервалы и другие функции. Такие простые улучшения диаграмм могут раскрыть новый смысл данных и показать их с другой стороны.

Чтобы добавить аналитические функции на диаграмму, перенесите их мышкой на рабочую область. Многие из функций доступны в других частях интерфейса Tableau, при построении диаграммы. Но для удобства и скорости работы они сгруппированы во вкладке Analytics.
Полный список аналитических функций Tableau

Линия константы / Constant Line
Линия среднего значения / Average Line
Линия тренда / Trend Line
Линия референс-значения / Reference Line
Среднее значение с 95% доверительным интервалом / Average with 95% CI
Медиана с 95% доверительным интервалом / Median with 95% CI
Медиана с квартилями / Median with Quartiles
Прогнозы / Forecasts
Кластеризация / Clustering
Диапазон референс-значений / Reference Band
Диапазон распределения / Distribution Band
Боксплот (диаграмма «Ящик с усами») / Box Plot
Итоги / Totals
аналитика Tableau

Выбираем область применения функции аналитики

...или Scope.
Для большинства аналитических функций нужно задать область применения. Выбирая Scope, вы указываете Tableau, как рассчитать и отобразить значение. Например, если вы хотите посчитать среднее и вывести линию среднего (Average Line), Tableau может посчитать среднее по всей визуализации, по каждой подкатегории на визе или по каждой панели.

Выбор области применения зависит от вашей цели:
медиана Tableau
  1. Полная таблица / Entire Table. Рассчитывает и отображает линию аналитики по агрегированному значению всей таблицы (визуализации).
  2. На панель / Per Pane. Рассчитывает и отображает линию аналитики по агрегированному значению для каждой панели по первой категории.
  3. На ячейку / Per Cell. Рассчитывает и отображает линию аналитики для каждого значения визуализации.
функция аналитики Tableau

Популярные функции аналитики Tableau

Референс-линии

Вы можете добавлять референс-линии на визуализацию, чтобы отметить важные значения на оси. Референс-линии помогают сориентироваться и сфокусироваться на диаграмме.
Как только вы перетащите референс-линию на диаграмму, Tableau автоматически откроет окно для ее редактирования.
референс-линия
«Расфокусированная» ось
Чтобы настроить референсную линию:

  1. Выберите область действия.
  2. Выберите переменную для показа (можно использовать параметры) и ее вид агрегации.
  3. Выберите подпись и тултип.
  4. Выберите вид, цвет и заливку референсной линии.
  5. При необходимости отметьте опцию «Show recalculated line for highlighted or selected data points», чтобы пересчитывать значение референсной линии для выбранных точек на графике.
референс-линия
Кластерный анализ

Кластерный анализ группирует точки на диаграмме рассеяния по схожести, присваивая каждому кластеру свой цвет.

Tableau использует метод k-средних для кластерного анализа. По этому методу данные разбиваются на сегменты с центрами кластеров, которые минимизируют суммарное квадратичное отклонение точек от центров.

Иными словами, метод k-средних вместе с Tableau пытается определить схожесть точек на основе их расстояния до центра кластера. Метод k-средних зависит от выбора исходных центров кластеров. Этот выбор не всегда оптимален.
кластерный анализ
Кратко про остальные функции

  1. Прогнозы / Forecast — добавляют линию прогноза по изменению показателя. Доступны только для одной меры и не для многомерных источников данных.
  2. Линия константы / Constant Line — добавляет статичную линию по заданному значению.
  3. Линия среднего значения / Average Line — добавляет динамическую линию по среднему значению показателя.
  4. Медиана с квартилями / Median with Quartiles — добавляет медианы и интервалы распределения для одного или нескольких наборов значений.
  5. Боксплот / Box Plot — добавляет ящики боксплот, отражающие статистику по выборке значений.
  6. Итоги / Totals — добавляет дополнительную категорию по выбранной модели агрегации. При нескольких категориях можно добавить под-итоги / Subtotals.
  7. Среднее значение с 95% доверительным интервалом / Average with 95% CI — добавляет линию среднего значения с диапазоном доверительного интервала в 95%, показывающим, в каком диапазоне лежат значения показателя в 95% случаев.
  8. Линия тренда / Trend Line — добавляет линию, построенную по значениям по заданной модели.
  9. Диапазон референсных значений / Reference Band — добавляет две линии, обозначающие границы диапазона заданного показателя.
  10. Диапазон распределения / Distribution Band — показывает диапазон распределения значений показателя по заданному правилу. Например, отмечает границу 60% и 80% от среднего.
аналитика Tableau

Примеры

ПРАКТИКУЕМСЯ

О датасете

В датасете представлены клиентские оценки, отражающие удовлетворенность работой сотрудников колл-центра.
Задание
  1. Постройте график рассеяния в детализации по агентам. Используйте меры средней оценки удовлетворенности и суммарного количества звонков.
  2. Добавьте цветовое кодирование области средней оценки удовлетворенности и подпишите получившиеся зоны: от 0 до 2 — BAD CS, от 2 до 4 — NEED ATTENTION CS, от 4 до 5 — PERFECT CS.

Скачать задание в виде книжки Tableau
Решение задания предыдущего дня

ВДОХНОВЕНИЕ

Полезные ссылки по теме

Да пребудет с вами визуальная аналитика.

Визуальная аналитика

Материал для ...«покопаться» в терминах

Референс-линии: как использовать?

... несколько фишек для разнообразия приемов

Как работает прогнозирование в Tableau

Разъяснение от самого Tableau

Tableau Pane: практика

Рабочие книжки, подготовленные SuperDataScience

Видео

Предлагаем вдохновиться потрясающей лекцией Джорджии Лупи, посвященной Дата Гуманизму.

Дата Гуманизм

Giorgia Lupi: Data Humanism

МАТЕРИАЛЫ

Наши артефакты

Помогут вам лучше усвоить и вовремя вспомнить основные элементы методик, подходов, последовательностей действий, проверенных практик.

Книги

Статистика в самой доступной и интересной форме. Что может быть лучше для занудной темы, чем хороший комикс.
Статистика в комиксах
Грейди Клейн и Алан Дебни
Иллюстратор Грейди Клейн и статистик Алан Дебни соединили искусство и науку в пособии по статистике. В форме комикса они учат, как собирать достоверные данные, делать верные выводы из ограниченной информации и оценивать достоверность экзит-поллов и прочих данных, которые обрушиваются на нас каждый день.

Итоги этапа

Быстро пробежались по функциональности аналитики в Tableau. Пролистали базовый курс статистики и вспомнили, чем мода от медианы отличается и как работают доверительные интервалы. Вдохновились гуманистическим подходом к визуализации данных и готовимся разбирать тему дашбордов. Виз-виз уррра!

Бежим Марафон в команде!

С менторством и в компании единомышленников.
Нажимая кнопку, вы соглашаетесь на обработку персональных данных. Мы используем их, чтобы оставаться на связи. Подробнее здесь.