ДЕНЬ 23
Про круговые диаграммы и пончики
СЕГОДНЯ

День донатсов и пирожков. Изучаем круговые диаграммы. Смотрим на ошибки их использования и способы технической замены на более подходящие варианты визуализаций. Учимся строить средствами Tableau. Делаем выводы для будущих проектов. Смотрим на аргументы от заслуженных деятелей визуальных наук, как пончики влияют на фигуру дашборда и читаем научные доказательства к этим аргументам в новой книге Cole Nussbaumer. Всем визуального ЗОЖ. Побежали!

РАЗБИРАЕМСЯ
Круговые диаграммы и пончики / Pie Charts & Donut Charts
Что это такое
Круговая диаграмма – диаграмма, показывающая составные части целого, отношение между категориями при помощи сегментов круга. Дуга каждого сегмента показывает долю категории, а вся окружность – общую сумму в 100%.

Круговые диаграммы идеально подходят к показу пропорций небольшого количества сегментов. Однако, в последнее время, их редко хвалит сообщество визуализации данных, и все чаще ругает. Почему нежелательно использовать круговые диаграммы?
Пончики – почти то же самое, что и круговая диаграмма. Отличие заключается в том, что на пончиках оставляют пустое место по середине круга. Туда удобно добавлять подпись показателя или значение целевого KPI.
Все просто: случаев неправильного и неумелого использования круговых диаграмм, по сравнению с другими видами визуализации, очень много. В их применении очень легко допустить ошибку. Далее мы рассмотрим плохие примеры.
Наихудший вариант использования круговых диаграмм - сравнение данных во времени.
Создатель такой визуализации предполагает, что ее зритель будет сравнивать угол сегмента в нескольких пайчартах между собой, для того, чтобы оценить динамику изменения. Это очень сложная работа нашего восприятия - нужно не только увидеть, но и запомнить цифры, сопоставить их в уме и сравнить, что больше и насколько.
Чрезмерное усложнение визуализации сегментов. Если бы данные не были бы подписаны, вряд ли бы можно было все верно разобрать. Кроме хаотичного расположения, здесь еще добавился объем 3D, резкая цветовая кодировка, и отсутствие сортировки.
Это примеры с Википедии. Круговая диаграмма показывает страны по их площади. Если быть точнее, то на диаграмме показаны все страны мира, но это не добавляет информативности.

При большом количестве сегментов круговые диаграммы не читаемы. Попробуйте группировать второстепенные сегменты в группу "Другие", чтобы ограничить количество секторов круга до 5.
Из-за добавления объема и особенностей цветового кодирования, мы воспринимаем красный сегмент на переднем плане как больший, по сравнению с тем же сегментом синего цвета, хотя их значение одинаковое.
А есть хорошие примеры?

Если пайчарты используются со знанием дела - то диаграмма будет помогать понимаю всего дашборда, а не мешать. Сделайте свои и прочитайте наши выводы по использованию круговых диаграмм, и держите их у себя в голове.
Выводы
Основные недостатки круговых диаграмм:

  • Сложно сравнивать данные между собой. Все сегменты имеют разную точку отсчета (так как идут по кругу, один за одним).
  • Нельзя показать много данных. Читаемость диаграммы резко падает после 5 сегментов.
  • Чем больше категорий на диаграмме, тем хуже видно маленькие сегменты.
  • Занимают много места на дашборде.

Также помните, что круговые диаграммы:

  • Не подходят для показа изменения пропорций во времени.
  • Не подходят для точных сравнений данных по категориям.
  • Не терпят излишнего визуального оформления и 3D объема.
Как построить
Простые круговые диаграммы
1. Добавьте нужную меру в Columns.
2. Добавьте нужную категорию в Rows. Будет автоматически создан барчарт.
3. Откройте Show Me и выберите визуализацию круговой диаграммы.
Чтобы увеличить созданную диаграмму зажмите Ctrl + Shift (Cmd + стрелочка вверх на Mac) и нажмите B несколько раз.
4. Добавьте нужные поля в подписи и цвет на области слева.

Подробнее тут →
Как построить
Пончики
Готовим базу
1. Создайте простой пайчарт - это будет основной будущего пончика.
Создаем две оси
2. Добавьте поле Number of Records в Rows.
3. Добавьте еще одно поле Number of Records в Rows. Мы должны получить две оси - два пайчарта рядом.
4. В Rows, поставьте агрегацию на обоих полях на MIN - Минимум. Для этого нажмите на каждое добавленное поле правой кнопкой мыши и найдите в меню Measure (Sum) > Minimum.
Меняем второй пайчарт на кружок
5. В левой части, в области Marks, выберите нижнюю вкладку MIN(Number of Records) (2)
6. Уберите все поля, которые находятся в Color, Size, Segment
7. Уменьшите размер кружка при помощи Size
8. Измените цвет кружка на цвет фона визуализации, например на белый
9. Добавьте нужные поля в Label
10. Наверху, в Rows, нажмите правой кнопкой мыши на второе поле Number of Records и выберите Dual Axis. Соедините две диаграммы в одну.

Подробнее тут →
СОВЕТ
Используйте круговую диаграмму с сегментами как фильтр на другие диаграммы дашборда.
ПРАКТИКУЕМСЯ
Для сегодняшней практики и построения донатчартов, мы взяли профильные данные компании Krispy Kreme, которая производит донатсы по всему миру - утешение для сладкоежек.
Датасет
Продажи Krispy Kreme

Скачать датасет
Задание
1. Построить два донатс-чарта по годам и каналам продаж - очень простое задание.
2. Разместите решение на дашборде.

Скачать задание в виде книжки Tableau
Решение задания предыдущего дня
Желудок просвещенного человека имеет лучшие качества доброго сердца: чувствительность и благодарность

А.С. Пушкин
ВДОХНОВЕНИЕ
Полезные ссылки по теме
Картинка стоит тысячи слов объяснений.
Видео
Тему вредности донатсов для визуального здоровья продолжит аргументировать заслуженный деятель сторителлинговых наук Cole Nussbaumer.
Смерть пайчартам
Cole Nussbaumer
МАТЕРИАЛЫ
Книги
Еще раз для повторения закрепленных в видео тезисов ставим на полку Cole Nussbaumer
Рассказывание историй на основе данных
Cole Nussbaumer
Итоги этапа
Люди любят круговые диаграммы, что бы там не говорили мировые эксперты по визуализации - так цитировал классика один известный поисковик. Сегодня мы посмотрели проблеме в сегмент и поняли, что решений есть несколько. Научились строить пайчарты и донатсы в Tableau. Следуя советам, попробовали разные способы улучшений круговых диаграмм или их замены на более подходящие. Готовимся к новому дню для освоения слоупграфа, чтобы понять на сколько важен угол наклона. До встречи. Виз виз урррааа!
~
DATA YOGA CLUB