Стремимся не к совершенству, а к гармонии во взаимодействии
– Это условие развития
Неделя 7
Добро пожаловать на неделю 07!

На этой неделе мы рассмотрим как строится работа с интерактивными элементами на дашбордах и отдельных визуализациях. Разберем общие подходы к интерактивности элементов в дата-продуктах и несколько наглядных примеров с лучшими практиками и советами. Затем мы рассмотрим интерактивные возможности Tableau, которые помогут обогатить наши дашборды, и случаи их применения.

Практическое задание этой недели – создание интерактивного дашборда на данных из игры Destiny. Мы подумаем над тем, как сообщить аудитории о ее возможностях исследования данных. В последней части лонгрида мы познакомим вас с исследованием этики визуализации данных.

Мы также продолжим обмен опытом с коллегами, в Телеграм-чате @tableau_chat по темам, актуальным на этой неделе. Ориентируемся на максимальную практичность диалога и на применение лучших практик работы в Tableau.
Так как количество материала на этой странице рассчитано на целую неделю, то лонгрид получился объемным. Воспользуйтесь переходом на основные темы недели ниже.
ЗНАНИЯ
Отбрасываем всё и ощущаем только предмет нашей медитации, настраивая интерактивные элементы на дашборде. Это позволит визуально отвечать на наши целевые вопросы. Учимся проектировать пользовательский опыт с помощью интерактивных элементов Tableau
датайога
Визуальная медитация и интерактивность
Во время визуальной медитации ум пользователя, подобно спокойной реке, движется внутри интерактивного дашборда, максимально погружаясь в объект. Между "Я" пользователя и дашбордом устанавливается связь, при которой происходит максимальное восприятие и, в то же время, взаимодействие с интерактивным объектом. Такому состоянию должна предшествовать фаза концентрации, при которой ум должен сфокусироваться на объекте.

Истинное назначение седьмой ступени ДатаЙоги в том, чтобы научиться концентрироваться на объекте и изучать его, пока о нем не станет известно все. Это достигается целым набором интерактивных элементов на дашбордах, которые максимально поддерживают практику погружения в объект.

ДатаЙога помогает увидеть реальный мир, стоящий за данными, таким, каков он есть на самом деле, не вкладывая в него никакого дополнительного смысла. Это также – возможность чувствовать себя уверенно при работе с любыми данными и избавиться от тяжести мира на своих плечах.
Когда человек постоянно концентрируется на одном объекте, он обретает все более и более глубокое понимание этого объекта
Медитация и интерактивность
Выполняя быстрые присоединения к данным, мы становимся более гибкими. Создавая визуализации, мы обретаем способность управлять и получать ответы на свои вопросы, а также проверять гипотезы. Добавляя интерактивности к своим дашбордам, мы постепенно создаем то, над чем мы не властны. Во взаимодействии с данными появляется спонтанность.
КАК ВЫБИРАТЬ ДАННЫЕ ДЛЯ ВИЗУАЛЬНОЙ МЕДИТАЦИИ

Начинать нужно с чего-то, чему вы доверяете и что знаете очень хорошо. В ДатаЙоге говорится, что начинать нужно оттуда, где вы находитесь, и с того, что вам нравится. В конечном счете выбранный объект медитации не имеет принципиального значения. Важно, чтобы он не мешал фокусировать внимание. Поэтому, выбирайте объект соответствующий вашему темпераменту.
Дашборд – это контакт, интерактив – связь
интерактивность при работе с данными
В статичных, напечатанных на бумаге графиках, визуализация ставила читателя перед фактом – дальнейший анализ существующих данных был невозможен из-за ограничения формата. С переходом визуализаций данных в веб, это ограничение было снято благодаря интерактивности – возможности взаимодействовать с диаграммами и данными на них и получать мгновенный обновленный результат.

Если подходить к вопросу интерактивности продуманно, то результат от созданной интерактивной визуализации данных будет гораздо ценнее и значительнее.

Возможности интерактивности зависят от инструмента, в котором вы, как автор, ведете разработку визуализации. В простых программах вроде Excel возможностей интерактива практически не заложено, зато при программировании визуализаций – вы можете практически все.
Migrations in Motion – Миграция животных
Интерактивность позволяет тут же задавать новые вопросы к данным
С развитием технологий и упрощения доступа к данным, растут ожидания и потребности пользователей. Теперь, например, один и тот же дашборд, может использоваться в нескольких сценариях. Для того, чтобы угодить разным запросам пользователей, при разработке обращаются к интерактивности, так как с ее помощью можно создать действительно разносторонний дашборд, поддерживающий процесс анализа по нескольким сценариям.

Зачем нужна интерактивность?
+ акцентировать внимание
+ показать изменение данных
+ ответить на новые вопросы – дать возможность дополнительного анализа
+ добавить дополнительный контекст
+ показать подсказку
+ вести пользователя по дашборду при помощи подсказок, кнопок, анимаций

А также,
+ сделать простые взаимодействия с визуализацией – скачать, экспортировать, поделиться
+ настроить нужный срез данных при помощи фильтров
+ динамически оповещать об изменениях в данных

... и в целом, облегчать понимание данных.
Чтобы понять, какой способ интерактивности необходим вам – подумайте о специфике ваших данных и особенностях аудитории. Нет необходимости добавлять все интерактивные возможности разом. Ваша задача состоит в упрощении работы с визуализацией, а не в её усложнении.
НАПРИМЕР...

Интерактивное сравнение. Американский ресурс FiveThirtyEight подготовил интерактивный проект с трекером рейтинга одобрения президентов США на протяжении времени их правления. Каждый президент сравнивается с рейтингом одобрения Дональда Трампа. Кстати, проект активный, и данные в нем обновляются и сейчас.

Визуализация рейтингов разных президентов сделана при помощи визуализации миниатюр Small Multiples, которые показывают набор данных в одинаковой форме, но каждая категория разнесена в отдельный блок.

Что здесь добавляет интерактивность?
+ узнать точную цифру рейтинга во всплывающей подсказке при наведении. Ведь данные достаточно высоко детализированы, и к тому же разнесены на разные блоки. Поэтому точность данных в визуальном сравнении без всплывающих подсказок была бы невысокой.
+ сравнить рейтинги нескольких президентов между собой. Выбранная точка на одном графике, тут же отмечается на другом. Из-за этого, мы можем оценить "общую картину" за одно движение мыши. Если бы такой подсветки значений не было, возможно, визуализацию и в целом не стали бы изучать – слишком сложно.
Trump Approval Ratings
Всплывающие подсказки. Та же команда FiveThirtyEight подготовила еще один интерактивный проект к американским выборам 2018 в губернаторы штатов. Статья состоит из нескольких элементов, включая карту и таблицу с разбросом значений. На каждом объекте лонгрида, при наведении на объект, вы увидите всплывающую подсказку – тултип. В тултипах показывается более детальная информация по кандидатам в каждом штате, а также показатели их победы или поражения.

Что здесь добавляет интерактивность?
+ контекст значений. Понятно, что у каждого элемента помимо "итоговой цифры" есть то, из чего эта цифра складывается, ее составные части. Их мы и можем увидить в тултипах в этом исследовании. Помимо данных о кандидатах, показываются цифры по населению штата, принадлежность кандидата к республиканцам или демократам, шансы его выигрыша.
+ глубину исследования. Если человек, который зашел на эту визуализацию, не слишком заинтересован в теме, то ему будет достаточно просмотреть данные на "верхнем уровне", т.е. увидеть итоговые визуализации в статичном режиме – они тоже достаточно информативны. Но если есть цель изучить данные, то, конечно же, нужно воспользоваться всплывающими подсказками, в которых написаны точные цифры прогнозов для всех кандидатов и разброс оценок.
Кроме всплывающих подсказок, на странице проекта есть дополнительный параметр –выбор мо прогнозирования результатов. Обратите внимание, что:
+ параметр расположен в левой части экрана, "перед" самим исследованием, в его начале. Это значит, что аудитория точно его заметит и обратит внимание.
+ есть понятное описание каждой модели: lite, classic, deluxe, которое сопровождается понятными иконками
+ есть подробное описание всех способов для того, чтобы можно было сделать свой выбор

Акцентирование. Еще один пример интерактивной визуализации от The NewYork Times и их проекта о данных Upshot о рекорде игрока в американский футбол Пейтона Мэннинга. Визуализация сравнивает Мэннинга с другими спортсменами в истории лиги, охватывая более 250 защитников с как минимум 30 карьерными тачдаунами с 1930 года. Вся история N.F.L. находится на одной визуализации, и вы можете быстро увидеть, насколько улучшились результаты спортсменов за эти годы.

Для того, чтобы объять такой масштаб, на визуализации показали достаточно большое количество данных. Конечно, некоторые из известных спортсменов подписаны, но остальные подписи на диаграмме не уместились. Для того, чтобы решить эту проблему, авторы добавили подсветку выбранных линий.

Что здесь добавляет интерактивность?
+ возможность сфокусироваться. Для того, чтобы не потеряться в огромном количестве значений, можно навести курсор на один из элементов и увидеть имя игрока. При этом, цвет линии находится на переднем плане и не затемнен, в отличии от других, не выбранных игроков.
Задумываясь об интерактивных возможностях вашей визуализации, начинайте с потребностей аудитории и особенностях ваших данных.

Например,
  • Если вы показываете категорию с большим количеством значений (список спортсменов) – добавьте "подсветку" значений, чтобы акцентировать внимание
  • Если вы показываете данные, где важна точность значений – добавьте всплывающие подсказки, в которых напишите значения показателей и дополнительные данные
  • Если вашей аудитории хочется видеть данные в таблицах – добавьте переключатель вида представления данных и/или кнопку экспорта данных в таблиц
Напишите о своих идеях и "правилах" интерактивности в наш чат в Телеграме, будем рады обсудить ваши подходы.
элементы интерактивности в tableau
Tableau Desktop – инструмент с большим количеством возможностей для интерактива, многие из которых появились за последние несколько версий продукта. Интерактивные возможности можно совмещать и комбинировать для достижения наилучшего результата и понятного алгоритма работы ваших дашбордов. Далее мы посмотрим на интерактивные возможности Tableau.
Фильтры
Это стандартные элементы интерфейса для взаимодействия со значениями данных и определения выборки визуализации. Фильтры могут иметь разную зону "влияния", т.е. распространяться сразу на несколько листов.
Область действия фильтров:
  • На один рабочий лист
  • На несколько рабочих листов / все, которые есть на дашборде
  • Глобально на все рабочие листы, построенные на исходном источнике данных
  • На рабочие листы, построенные на связанных источниках данных, т.е. как Data Blending
Подробнее →

Для того, чтобы сохранять единообразие в работах с несколькими листами / дашбордами, и если это подходит под вашу задачу, делайте нужные фильтры глобальными, т.е. применимыми к нескольким листам сразу. Это более правильная альтернатива повторным добавлением одинаковых полей фильтры на новых рабочих листах; так проще отслеживать выбранный срез данных.
Если в фильтре по категории много значений, то попробуйте добавить кнопки подтверждения выбора – Apply и Cancel.

Подумайте, как будут пользоваться вашими фильтрами. Если пользователи скорее всего будут выбирать одновременно несколько значений, стоит добавить эти кнопки для увеличения скорости работы с данными. Tableau подгрузит все выбранные значения разом, но только после нажатия кнопки Apply, а не после каждой сделанной отметки.

Подробнее →

Если говорить о размещении элементов управления на дашборде, вспомните о модели z-pattern, которая предполагает чтение данных на веб-страницах по форме буквы z. Дашборды – не исключение, ведь уже выработанная привычка "читать" информацию на экране компьютеров относится и к ним.

Люди начинают чтение с верхнего левого экрана и постепенно опускаются вниз слева направо. Верхняя правая точка экрана – вторая по значимости область, в которой обычно и начинается область фильтров и параметров.
Если у вас есть фильтры, которые обязательно должны быть выбраны в начале анализа дашборда – их можно расположить и в левой части экрана. Иллюстрацией такого кейса будет выбор модели прогнозирования из примеров выше, с параметром в виде бургеров.

Такая модель широко распространена при верстке сайтов и лонгридов. Ваши дашборды тоже могут ее использовать, причем не только для расположения фильтров, но и в целом для выстраивания макета содержимого.
Подсветка значений категорий
Хайлайт – или подсветка значений – помогает создать акцент на выбранном пользователем значениях по категории. Подсветка может быть добавлена как отдельный элемент "highlighter" или через экшены (действия) подсветки.

Более того, хайлайтер появляется и при добавлении цветовых легенд по категориям. – пользователь может использовать значения в легенде для подсветки.

Подробнее →
Хайлайт эффективен при:
  • большом количестве значений (особенно на диаграммах рассеяния, линейных диаграммах)
  • для задачи акцентирования внимания: можно добавить динамические подписи данных только для highlighted-отметок
  • для выделения важного элемента от остальной массы: например, наша компания и все конкуренты
Параметры
Параметры – это динамические значения, которые вводит сам пользователь и которые могут затем использоваться в расчетах, фильтрах и элементах контекста. При помощи параметров можно быстро добавлять нужные значения напрямую в вычисления. Параметр – это "контейнер" для данных, который можно прописывать в формулах. При занесении в параметр нового значения, оно сохранится в параметре, а все зависимые от него вычисления пересчитаются.

Параметры могут работать с любым типом данных: с числами, с текстом, датами, булевыми данными.

Подробнее →
Использование параметров безгранично широко. К ним обращаются для того, чтобы пользователь дашборда мог
  • внести свои собственные данные, которые затем будут задействованы на дашборде
  • удобно изменить текущие данные, если параметр выступает как глобальный фильтр (помните, что у параметров область применения это вся рабочая книжка)

Например, на дашборде ниже, параметры используются для того, чтобы пользователь смог выбрать интересующий его срез данных и даже больше: есть параметры для выбор района, а есть три параметра для изменения внешнего вида визуализации.
  • Level of Detail = Building, т.е. детализация на карте соответствует каждому дому.
  • Sort & Size By = Avg Sales Price, т.е. сортировка и размер кружочков на карте выстроены в зависимости от средней цены продажи
  • Color By = Avg Price, т.е. раскраска значений идет в зависимости от средней цены
Посмотрите, как кардинально изменяется визуализация с расчетным параметром для цвета. Реализовать это в Tableau очень легко.
Некоторые из примеров как можно использовать параметры для:
  • выбора ТОП-N категорий
  • фильтра по категории
  • переключении нескольких сетов
  • переключения полей в визуализации
  • изменения расчета переменной
  • измерения плана
  • выбора показателя для сортировки
Мы подготовили примеры по использованию параметров в виду рабочей книжки Tableau, которую вы можете скачать и открыть в Tableau Desktop
Экшены
Экшены это особые действия, при помощи которых можно взаимодействовать с данными на визуализациях. В Tableau есть несколько основных видов экшенов.

Фильтрация. Передача значения на другой объект визуализации. Позволяет интерактивно изменять одни визуализации на основе выбранных значений на других визуализациях.
Подсветка. Подсвечивание элементов на дашборде в разных визуализациях.
Переход по URL-адресу. Название говорит само за себя – при взаимодействии Также, можно комбинировать переход по URL и передачу значения фильтра в URL. Разновидностью URL-действия также является переход по ссылке при нажатии на объект картинки на дашборде
Экшен навигации (new). Переход на другой рабочий лист или дашборд при взаимодействии с элементами указанных визуализации.
Экшен сеты (new). Использование set actions, чтобы позволить аудитории напрямую выбирать отметки в визуализациях и автоматически менять значения в заданном сэте, добавляя их туда. На основе этих действий могут быть построены дополнительные вычисления и визуализационные расчеты.
Экшен параметры (v2019.2). Добавление значения выбранного элемента в параметр по выбору. По сути, является аналогом "динамических параметров", которых не существует в явном виде в Tableau.

Подробнее →
Все экшены имеют схожие настройки по указанию области действия и сценарию использования. Так, экшены могут быть "запущены" тремя способами на визуализации:
  • по клику – необходимо кликнуть левой кнопкой мыши на элемент для запуска действия
  • по наведению – необходимо навести курсор мыши на элемент для запуска действия
  • по всплывающему меню – при наведении или при клике на элемент, всплывает подсказка (тултип), в котором есть кликабельная строка для запуска действия
Экшен сеты и экшен параметры – одни из самых ожидаемых функций в Tableau. Эти экшены позволяют вывести взаимодействие с данными на новый уровень.

На примере ниже, экшен сет формирует выборку стран на карте, которая затем отражается в барчарте справа, показывая долю этой выборки от общей суммы значений. Пользователь сам выбирает, какие страны его интересуют, а последующие настроенные вычисления рассчитывают долю этих стран и визуализируют ее в цвете.
Другой пример. На дашборде ниже, который показывает стоимость жилья в городе, при помощи сет-экшенов рассчитывается отклонение от средней цены выбранной области. Число, отображаемое в правом верхнем углу – это средняя цена дома по выбранным почтовым индексам. Цвет на карте отображает процентную разницу каждого почтового индекса от этого числа – среднего по выборке – где оранжевый означает более дорогой, а синий означает более дешевый.
Подготавливая дашборд к публикации, подумайте какая интерактивность вам действительно необходима. Это могут быть фундаментальные расчеты, которые и составляют саму суть дашборда – как на примерах выше с использованием сет экшенов. А может быть, вам нужна простая фильтрация связанных элементов, чтобы углубиться в контекст. Или же, вам нужно сделать навигацию через несколько дашбордов с разной информацией при помощи экшенов перехода Go to sheet.

На примере ниже, автор сделала схему того, какие переходы должны происходить по определенным кликам на элементы визуализаций и в какой последовательности. Такая схема не позволяет запутаться в логике действий перехода; на нее можно завязать и ссылки на внешние сайты и другие действия, необходимые по задаче. Обратите внимание, что клики могут происходить и по кнопкам, и по элементам визуализаций, и по картинкам.
Логика экшенов / Bridget Cogley
Всплывающие подсказки / Тултипы
Тултипы – это всплывающие окошки, которые появляются при наведении курсора мыши на элемент визуализации и содержат в себе дополнительную информацию. По умолчанию, тултипы дублируют все данные, которые добавлены на диаграмму в кратком виде, чтобы "собирать" все в одном месте. Но они гибко настраиваются под ваш потребности и могут быть изменены.

Подробнее →
Действия, которые возможны в тултипе:

Выбор среза данных через тултип. Позволяет подсветить все значения, которые соответствуют той же категории данных, что и выбранное изначально значение.
Визуализация внутри тултип. Позволяет добавить одну визуализацию в тултип другой визуализации. Когда пользователь наводит курсор на элемент визуализации, во всплывающей подсказке отображаются соответствующие данные из другой визуализации, отфильтрованной по этому элементу.

Используется в тех случаях, когда нужно добавить детализированный вид к текущей визуализации без лишних кликов и переходов; или когда нужно показать референс-данные, например, по выполнению плана по выбранной категории.
Кнопки перехода
Кнопки перехода – относительно новые элементы на дашбордах в Tableau, которые позволяют выстраивать навигацию по нескольким рабочим вкладкам простым кликом, без каких либо условий. Функционально, в кнопку можно загрузить свое собственное изображение вместо стандартного и выбрать любой лист из текущей рабочей книжки.

Подробнее →
Кнопки перехода отличаются от экшенов тем, что работают независимо от визуализации и самих данных в них. Таким образом, переход на другой лист можно осуществить тремя способами:
  1. Используя кнопку перехода Button на дашборде – безусловный переход на один из листов
  2. Используя экшен Go to Sheet – переход из конкретной визуализации на один из листов
  3. Используя экшен Filter – переход из конкретной визуализации + с отфильтрованными данными по клику
  4. Также можно переходить, используя экшен URL на опубликованном дашборде
Extensions API и Javascript API
Для тех, кто хочет еще большей интерактивности, в Tableau есть расширения. Вы можете пользоваться готовыми расширениями из галереи или написать свое при помощи Extensions API.

Например,
  • Создайте расширение с функцией обратной записи, чтобы пользователи могли изменять данные в визуализации, и эти изменения автоматически обновляли исходные данные в базе данных или веб-приложении.
  • Создайте уникальные виды визуализации и взаимодействия, такие как замена фильтров на пользовательский интерфейс
  • Интегрируйте стороннюю функциональность в дашборд

Подробнее →
Для продвинутых пользователей и тем, кому не хватает стандартных функций Tableau, также для добавления нестандартных элементов управления визуализациями и дашбордами, вы можете использовать Javascript API для управления элементами визуализации, настройки перехода между элементами или работы со сторонними системами и сервисами и их интеграции с Tableau.

Подробнее →
Что-то с чем-то вдруг случилось, и чего-то получилось!
Пользователь
ОПЫТ
Практикуемся на представленных датасетах, ищем инсайты с помощью визуальной аналитики, задаем правильные вопросы и проверяем гипотезы. Обсуждаем идеи и подходы с коллегами по Марафону
inspired by DI.FM
На этой неделе мы разбираемся как реализовывать интерактивность в своих дашбордах. Для примера задачи, мы решили проанализировать персональные данные из игры Destiny на PlayStation 4.
Связавшись с порталом destinytracker.com, мы смогли получить выгрузку персональной статистики из игры.

На получившийся дашборд вы можете посмотреть перейдя по ссылке или кликнув на изображение.
Дашборд показывает статистику действий пользователя в игре Destiny.

В игре было три персонажа с разными классами – Хантер, Варлок и Титан, у каждого из которых – свой рейтинг. Сводка по персонажам показана в верхнем части экрана, рядом с названием. Персонажи обозначены тремя иконками. Кликая на них, весь дашборд будет отфильтрован по статистике конкретного героя.

Режимы в игре можно разбить на две основные группы – Player versus Environment (PvE), т.е. игрок сражается против монстров или компьютера; и Player versus Player (PvP) – игру против других игроков. Этот показатель также вынесен на верхнюю часть экрана.

Основной метрикой является отношение K/D – отношений убийств против смертей (Kills/Deaths). Эта метрика повторяется в нескольких местах на дашборде.

В левой части экрана выведен список по активностям в игровом процессе. Здесь тоже добавлены экшены фильтрации, чтобы погружаться в детали каждой активности и смотреть уточненную статистику.

На всем дашборде вы можете заметить небольшие иконки с указательным пальцем. Это call to action – призыв к действию интерактивности. Картинки необходимы, чтобы пользователь узнал о возможности кликать и фильтровать, посмотрев на эти иконки.

Также, на дашборде были использованы экшены-хайлайты (подсветка) и визуализации внутри тултипа.
Структура источника данных
Таблица содержит следующие поля:
  • instanceId - ID сессии
  • Mode - ID режима
  • modeName - формула присваивания имени режима
  • characterType - тип персонажа
  • PvE/PvP - группировка режимов по типу
  • averageKillDistance - средняя дистанция убийства
  • Deaths - количество смертей
  • Kills - количество убийств
  • Overall K/D - итоговое K/D
  • Standing - место в активности
  • Period_start - во сколько активность началась
  • secondsPlayed - кол-во сыгранных секунд
  • minutesPlayed - кол-во сыгранных минут
  • hoursPlayed - кол-во сыгранных часов
Пройдите путь от изучения источника данных до постановки задачи и визуализации интересных инсайтов.
Задания
  • Изучить предоставленные данные или взять для анализа свою аналитику
  • Сделать интерактивный дашборд, задействуя несколько вариантов интерактивности
  • Найти инсайты
  • Поделиться идеями и находками в чате Марафона
Датайога не бывает пассивной. Мы должны глубже проникать в процессы окружающей нас жизнедеятельности, и чтобы делать это хорошо, мы должны работать над собой и быть внимательны в своих действиях
ВДОХНОВЕНИЕ
Вдохновляемся умными исследованиями на темы, которые каким-то образом связаны с визуализацией данных
Визуализации оказывают огромное влияние на то, как данные используются для принятия решений во всех областях человеческой деятельности.
Однако неясно, как это связано с этическими обязанностями: какие у нас есть обязательства, когда речь идет о системах визуализации и визуальной аналитики, помимо наших обязанностей как аналитиков и исследователей данных?

Мы решили изучить работу Майкла Коррела об этической стороне исследования визуализации, полный текст которого на английском языке вы можете скачать ниже.
ИНтерпретация визуализации данных
Легко утверждать, что визуализация является этически нейтральным видом деятельности, потому что мы просто сообщаем данные, а данные – это просто факты о мире. При визуализации данных, мы можем не думать, как эти факты собираются или кто их использует. Мы всего лишь посредники между заинтересованными сторонами и их данными. При условии, что мы не высказали предвзятости или преднамеренного обмана при представлении наших данных, мы выполнили свои обязанности. Тем не менее, данные не являются естественным явлением. Мир не измеряет, не курирует и не копирует данные самопроизвольно.
Немецкий философ Мартин Хайдеггер определяет количественную оценку как отличительный признак современных технологий: превращение вещей (и людей) в «постоянные резервы» ресурсов. Река – это не просто река, которой нужно восхищаться, это определенное количество мегаватт энергии, если она подключена к гидроэлектростанции. Лес – это не просто красивое живописное место, а запас древесного угля и пиломатериалов.

Современные технологические системы полностью переосмысливают то, как мы относимся к окружающему нас миру с точки зрения эксплуатации и использования ресурсов. И люди, конечно, не исключение.

Сбор массовых данных о людях – это способ превратить их в постоянный резерв: доходов от рекламы, создателей контента, солдат. Этот сбор данных и превращение людей в данные обладают огромной политической силой.
Немецкий философ и один из основоположников статистики Готфрид Ахенволл ввел термин «статистика» как «наука о государстве» в своей работе «Конституция нынешних ведущих европейских государств» 1752 года. Сбор необходимой статистики первоначально предполагалось осуществить государством для таких целей, как определение размера налоговой базы и других организационных аспектов. Этот начальный сбор данных ни в коем случае не был аполитичным: правильный набор данных может помочь начать войну.
Посмотрим на пример ниже – данные по количеству кораблей, оружия, и их стоимостях в английском флоте. Эти данные были изначально собраны для цели учета единиц техники, но используются Пейном для аргументации в пользу слабости и хрупкости английского флота и потенциальной мощи американского флота как части аргумента в пользу независимости и революции. Процесс наблюдения за миром и его количественной оценки является политическим актом и заслуживает этического рассмотрения.
Таблица из брошюры Томаса Пейна «Общий смысл» 1775 года
Thomas Paine, "Common Sense"
Не исчезло и централизованное и политическое использование и значение статистики в цифровую эпоху: одним из первых применений вычислительных машин для обработки статистических данных о населении были машины, которые IBM вместе с дочерней компанией Dehomag разработали для нацистского режима, который использовался для ускорения и поддержки окончательного решения еврейского вопроса. Относительная эмоциональная дистанция сбора и визуализации данных (в отличие от управления и отчетности о людях), возможно, способствовала уникальным бюрократическим ужасам Холокоста и тому, что философ Ханна Арендт называет «банальностью зла».
Две визуализации из кампании нацистского режима «Дом Рейха»
"Heim ins Reich" (Home to the Reich) campaign
Кампании Heim isn Reich была призвана содействовать переселению этнических немцев из других частей Европы на вновь завоеванные территории в Польше. Первая карта просто упоминает, что существующее население Польши и евреи будут переселены; вторая карта не упоминает их вообще. Также невидимы исходные границы аннексированного польского государства.
Однако отказ от сбора данных также имеет политические и этические последствия.

В науке, определение выборки респондентов по принципу WEIRD ( Western, Educated, Industrialized, Rich, и Democratic – западные, образованные, индстриализационные, богаты и демократичные респонденты) создает дисбаланс в сборе данных, который может привести к неравным результатам. Например, при тестировании компьютерного зрения, в выборке преобладало количество людей со светлой кожей, из-за чего коммерческие продукты с такой технологией не в состоянии точно определить или смоделировать лица людей с темной кожей.

Отсутствие данных может быть спроектировано и для политических целей: попытка администрации Дональда Трампа добавить вопрос о гражданстве в перепись населения США, вероятно, является попыткой отговорить неграждан от ответа в страхе ответных мер, и, вследствие, направить государственные ресурсы за пределы районов с большим количеством иммигрантов.
Нет такого понятия, как объективный взгляд из ниоткуда: скорее, знание находится в перспективах и ограничено пределами нашего опыта. Следовательно, данные не являются нейтральными и объективными фактами о мире – нет такой вещи, как «необработанные» данные. Данные всегда собираются или обрабатываются кем-то, для какой-то цели. Часто работа по сбору и структурированию данных делается невидимой. Появляющаяся область «науки о критических данных» стремится исследовать, как данные усиливают или бросают вызов системам власти, и «отменять» предположения о том, что сбор большего количества данных неизбежно приводит к повышению эффективности или уменьшению систематической ошибки.

Хорошо продуманные визуализации часто воспринимаются как четкие описания объективных данных. Писательница и культуролог Джоанна Друкер считает это особенно опасным.
... я думаю, что идеология почти всей современной визуализации информации – это анафема гуманистической мысли, антипатичная к ее целям и ценностям. Убедительная и соблазнительная риторическая сила визуализации выполняет настолько мощный контроль информации, что визуализации, такие как Google Maps, воспринимаются просто как представление «как есть», как если бы все критическое мышление было опрометчиво и полностью отвергнуто.
Джоанна Друкер
Другими словами, визуализации часто изображают данные как данность, совокупность фактов о мире, которые не вызывают никаких споров или разногласий. Даже язык, который мы используем для обсуждения и критики визуализации, может отражать неявные предубеждения и неравенства, существующие в обществе в целом.

Исследователи визуализации могут попытаться обойти риторическую мощь диаграмм, разделив визуализации на жанры инфографики (которые предназначены для широкой аудитории и могут быть использованы для убеждения) и статистической графики (которые предназначены для экспертов).

Однако относительно скудные в плане дизайна, т.е. визуализации в стиле статистической графики давно используются и политиками для подкрепления своих аргументов. Например, Рональд Рейган использует диаграмму как часть публичного выступления в поддержку Закона о налоге на восстановление экономики 1981 года, показывающего разницу между планами по сокращению налогов республиканцев и демократов.
Рональд Рейган
Данное исследование представляет некоторые из неотложных этических соображений работы по визуализации, но не является исчерпывающим. В дальнейшем необходимо разработать как новую концепцию для привития правильных ценностей дизайнерам и исследователям визуализации, так и специальные исследования этического воздействия работы визуализации в существующих моральных границах.
ТЕНДЕНЦИИ В ИССЛЕДОВАНИИ ВИЗУАЛИЗАЦИИ

  • Автоматический анализ. Перспектива этих методов заключается в том, что аналитики могут мгновенно обнаруживать важные взаимосвязи в данных, не тратя много часов на изучение тривиальных или неинтересных моделей.

  • Машинное обучение. Методы машинного обучения являются мощными инструментами структурирования и прогнозирования с использованием данных и присутствуют во многих критических областях нашего общества, от финансов до образования. Получающиеся модели часто непрозрачны и не в состоянии изящно разрешить обращения от людей, которые были неправомерно или предвзято классифицированы.

  • Происхождение/Источник. Системы визуальной аналитики становятся все более сложными и важными. Например, большое количество потенциальных действий означает, что становится все труднее четко определить, какие именно шаги предпринял аналитик, чтобы составить конкретную диаграмму или прийти к определенному выводу.

~
ПОЛЕЗНЫЕ ССЫЛКИ
От ... и до...
ПОЛЕЗНЫЕ КНИЖКИ
Сегодня на полке у нас две прекрасные работы ...
Data Visualization Made Simple
KRISTEN SOSULSKI
Одна из самых известных работ по визуализации данных, в которой Кристен исследует роль визуализации данных в принятии решений и обмене информацией, внимательно изучает визуализацию данных, обдумывая передаваемые ими сообщения; а также приводит в примеры интересные кейсы с целью предоставить современное представление использования визуализации данных в разных отраслях.
Information Graphics
Несколько авторов
Книга 1997 года, в которой описывается структура большинства видов визуализации данных, особенности их построения и подходов. Книга насыщена различными примерами графиков и диаграмм с комментариями, на которых полезно набираться опыта и учиться.
~
Итоги седьмой недели

Прошли седьмую ступень Дата Йоги, научились работать с интерактивными элементами в Tableau. Узнали как ведет свои проекты the New York Times и каким лучшим практикам можно у них научиться. Дата-медитация по датасету Destiny позволила найти интересные инсайты и вы поделились ими в комьюнити. Полистали на книжной полке две прекрасные книжки по визуализации данных и изучили полезные ссылки. До встречи в чате или до начала новой темы. Виз виз урррааа!
DATA YOGA CLUB