ДЕНЬ 13

Про визуализации
Tableau марафон
Вчера мы конструировали дашборд, настраивали его масштаб и разбирались в тонкостях визуализации для экранов мобильных устройств.

Следующие 20 дней марафона системно рассмотрим подходы к построению самых популярных и практичных видов визуализаций.
Цель марафона — показать весь процесс создания визуализации данных. Это пригодится на любом проекте.

СЕГОДНЯ

Рассмотрим визуальное восприятие и атрибуты, зададим вопросы к данным и обсудим «золотой набор» визов для следующих дней марафона.
визуализация
Самый визуальный этап марафона

РАЗБИРАЕМСЯ

Зачем нужна визуализация данных

Когда-нибудь сталкивались с тем, что вам не удавалось объяснить смешное видео своим друзьям? Им было бы легче понять, если бы вы просто показали им это видео, а не пытались описать словами.

Когда мы хотим передать какую-то информацию нужной аудитории, наши слова могут быть истолкованы по-разному. У каждого свой уникальный опыт, поэтому одно и то же может вызывать разные реакции. Даже одну и ту же презентацию на конференции слушатели воспринимают по-своему: запоминают разные слайды, задают разные вопросы. Как обеспечить четкое и однозначное понимание?

Визуальные образы воспринимаются намного быстрее и лучше, чем слова. По исследованию Массачусетского Технологического Института (MIT) 2014 года, человек может распознать содержание фотографии за 13 миллисекунд. Кроме того, визуальные образы лучше запоминаются, вызывают больше эмоций и передают больше информации.

Сколько информации, по-вашему, могут усвоить наши глаза?
Взгляните на результаты исследования работы органов чувств человека. Это количество информации, которое поступает через каждый орган чувств за секунду. Большая голубая область — глаза. Другие области отображают осязание (розовое), слух и обоняние (желтое) и вкус (темно-розовое). Белый прямоугольник справа внизу — это то, сколько информации мы осознаем из всего потока.
эффективность зрения
Настолько эффективно наше зрение в целом и визуализация данных в частности.
Визуализация также помогает структурировать и упорядочить данные, превращая их в понятные диаграммы и графики. Без визуализации данных мы бы терялись в бесконечном потоке информации. Сырые данные сами по себе мало что значат.
обработка данных
Чтобы понять суть данных и донести их до аудитории —
надо поработать.

Визуальные атрибуты

визуальные атрибуты
Помните пример с подсчетом троек? Контрастные цифры сразу привлекают наше внимание. Как это работает? Благодаря визуальным атрибутам и нашему подсознанию. Визуальные атрибуты (preattentive attributes) — это визуальные сигналы для нашего подсознания.
Замечая визуальные атрибуты в текстах, на визуализациях, в рекламе, фотографиях, кино, постерах и других визуальных материалах, наши глаза концентрируются на различиях. Мозг задается вопросами: почему этот элемент отличается, что он хочет мне сообщить?

С помощью визуальных атрибутов мы можем акцентировать внимание аудитории на том, что нам важно выделить на общем фоне. Еще до того, как они это осознают.
визуальные атрибуты
Основные визуальные атрибуты
Основные принципы визуализаций основаны на принципах визуальных атрибутов. Принципы нашего визуального восприятия не меняются — только на диаграммах мы отображаем данные.
визуальное представление диаграмм
Но визуальные атрибуты не одинаково точно передают данные. В 80-е годы прошлого века статистик Уильям Кливленд (William Cleaveland) написал книгу «Элементы графических данных», которая стала научной основой визуализации данных. Его работа не только определяет базовые «задачи восприятия», но и показывает, с какими из них люди лучше всего справляются.
Именно он провел эксперимент по изучению того, как разные визуальные атрибуты передают одну и ту же информацию. Оказалось, что точность у них разная.

Например, положение точек или баров на общей шкале позволяет делать наиболее точные оценки и получать конкретные цифры. Это пример обычной столбчатой диаграммы.

А вот визуальные атрибуты размера или цвета дают только приблизительные сведения. Это значит, что, посмотрев на график с пузырьками, вам будет трудно точно сказать, насколько один кружок больше другого. Если те же самые данные показать в виде бар-чарта, вы сможете сделать это точнее:
выбор графика
На примере ниже представлены отрасли (подписи сверху) и объем их финансирования за 2010 и 2015 годы. Попытайтесь ответить на эти вопросы:

  1. Какая отрасль получила наибольшее финансирование в 2015 году?
  2. Какая отрасль заняла второе место по объему финансирования в 2015 году?
пример графика
А теперь обратите внимание на другие варианты тех же данных ниже. Диаграмма была преобразована в бары и перестроена. Перелистайте по слайдам и посмотрите ответы ниже. Сравните процесс вашего визуального восприятия.
А может и нет никакой разницы? Фрукт-фрукт. Цветок-цветок
Фрукт-фрукт
Цветок-цветок

Вопросы к данным

Вы не можете позволить себе попробовать все — слишком много статистических методов и визуальных средств для показа данных. Нужно различать свою тактику, ставя правильные цели и задавая нужные вопросы к данным.
Визуализация должна отвечать на вопросы к данным, в понятной и доступной форме. Поэтому все составляющие материала отчета или на сайте — заголовки, иллюстрации, текст, дополнительные справочные сведения — организуются так, чтобы максимально полно сообщить то, чем интересуется пользователь.
вопросы к данным
Способ визуализации данных также определяется тем, какой ответ мы ищем. В зависимости от вопросов к данным можно выделить разные типы сравнения данных.

Типы сравнения данных

Мы можем представлять данные в разных формах — сравнивать нашу компанию с конкурентами, показывать долю выручки одного продукта от общей выручки, объяснять как что-то работает при помощи схем и простых графиков или показывать, как одна категория влияет на другую, и так далее.
типы сравнения данных
На основе видов сравнения создаются схемы и каталоги визуализаций данных, в которых вам предлагается выбрать подходящий для себя график. Но сложно оперировать таким большим количеством видов сравнения данных — легко запутаться и пойти не туда.

Мы выделили 6 основных (и общих) типов сравнения, которые считаем наиболее популярными. Все остальное — либо производные от этих видов, либо слишком специфичны.
виды сравнений данных

Что нужно для успешной визуализации

параллельные сеты
Параллельные сеты — визуализация выживших на Титанике.
Баланс между прагматичностью и художественностью

Визуализация данных может быть прагматичной или художественной в зависимости от цели и контекста.
Прагматичная визуализация стремится к рациональному и эффективному информированию пользователя о данных, используя визуальный канал для передачи большого количества информации как можно проще и понятнее.

Художественная визуализация выражает более глубокие проблемы или идеи, используя данные как средство коммуникации. Она не обязательно должна быть эффективной или понятной. Может опираться на метафоры или исследование формы.
визуализация
Без контекста это чистое созерцание.
Коммуникация проблемы или вопроса

Визуализация данных должна не только показывать данные, но и передавать «послание». Для этого определите проблему или вопрос, которые требуют решения или ответа, и используйте данные как доказательства или аргументы. Помните о адаптации к уровню знаний, интересам и целям аудитории.
компоненты визуализации
Успешная визуализация
Сплетение целей, визуальных форм, данных и хорошей истории
Хороший дизайн делает понятным и запоминающимся. Великий дизайн делает незабываемым и значительным.

// Дайтер Рамс

«Золотой набор» визуализаций

В течение следующих 20 дней мы будем изучать разные типы визуализаций и графиков. Мы выбрали несколько самых основных, нужных и популярных диаграмм.
Эти типы диаграмм и графиков можно создать практически в любом инструменте для визуализации данных. Некоторые из них используются часто, некоторые более специфичны.

В любом случае, в процессе вашей дальнейшей работы у вас будут формироваться предпочтения в пользу того или иного типа диаграммы, которая вам больше нравится или подходит под ваши задачи.
show me Tableau
Из меню Show Me
День за днем мы будем рассказывать о визах, способах их построения и примерах.

С нетерпением ждем начала нового этапа забега!

ПРАКТИКУЕМСЯ

Предлагаем попрактиковаться в создании разных графиков. Посмотрите, как они сделаны, и попытайтесь сделать такие же. Какой главный визуальный атрибут у каждого графика? Можно ли было показать те же данные лучше?

Датасет

Датасет из бестселлеров Amazon с 2009 по 2019 год. Содержит 550 книг с категориями по жанру.
Задание
  1. Постройте диаграмму Scatter Plot, отображающую распределение книг между рейтингами и количеством отзывов, с детализацией по автору, названию книги и цене.
  2. Отобразите изменение цен по годам в разрезе жанров в виде графика Line Chart.
  3. Детализируйте линейную диаграмму (дублировать из задания 2) по рейтингу (User Rating).
  4. Отобразите цены книг при помощи Bar Chart. Пропишите всю информации о книгах в тултипе, детализируйте по пользовательскому рейтингу и добавьте возможность выбора года для анализа.
  5. Отобразите авторов в виде Bubble Chart, размеры которых отображают количество изданных книг. В тултипе укажите названия книг, их цену и пользовательский рейтинг.

Скачать задание в виде книжки Tableau
Решение задания предыдущего дня
Логика может привести вас от пункта А к пункту Б, а воображение — куда угодно.

Альберт Эйнштейн.

ВДОХНОВЕНИЕ

Полезные ссылки по теме

Пару ссылок на проекты-каталоги различных техник визуализации. Не все, конечно, полезно, а некоторые виды визов даже вредны, но правильный выбор всегда будут диктовать условия, цели и среда применения инструментов.

ДатаВизПроджект

Каталог визуализаций с удобным поиском, категориями и структурой входных данных

Вселенная визуализаций

Отличное взаимодействие Google News Lab и Adioma

400 техник для текста

Потрясающие примеры для неструктурированных потоков

История визуализации

Наиболее полная коллекция артефактов

Видео

Погружение в историю визуализации. Стенфордский экспресс-обзор.

Краткая история визуализаций

A Brief History of Data Visualization

МАТЕРИАЛЫ

Наши артефакты

Делимся ссылкой на отличный постер от Financial Time с набором базовых концепций визуализации.

Наш каталог карточек.

Книги

Задумаемся вместе над компетенциями бизнес-аналитиков. Рассмотрим парочку работ в этой области — книгу Винсента Гранвиля и стандарты BABOK версии 3.
Развивая аналитический талант
Винсент Гранвиль
Гид по знаниям бизнес-аналитика
v3

Итоги этапа

Сегодня мы узнали о маршруте на ближайшие три недели, проверили свой «золотой набор» визов и разобрали необходимые компетенции бизнес-аналитика для будущей прокачки. До завтра всем! Виз-виз урааа!

Бежим Марафон в команде!

С менторством и в компании единомышленников.
Нажимая кнопку, вы соглашаетесь на обработку персональных данных. Мы используем их, чтобы оставаться на связи. Подробнее здесь.