ДЕНЬ 00
Знакомимся с маршрутом марафона и настраиваем экипировку и рюкзак с необходимыми инструментами
Добро пожаловать на Марафон!
ТЕМАТИКИ МАРАФОНА КРАТКО
Между тем
Что я думаю
Что я хочу сказать
Что мне кажется, что я говорю
Что я говорю
И тем
Что вам хочется услышать
Что вам кажется, что вы слышите
Что вы слышите
Что вы хотите понять
Что вы думаете, что вы понимаете
Что вы понимаете
Есть десять шансов к одному, что возникнут трудности в общении
Но все-таки попробуем...

О маршруте и наполнении этапов
Мы рассчитываем в самом начале Марафона пробежаться по базовой функциональности Tableau и системно рассмотреть работу с ключевыми возможностями продукта за первые 10 дней. Затем в течение 20 дней, мы с вами освоим и обсудим построение около 20 видов визуализаций, которые используются для построения дашбордов и data-историй.

Многие участники интересуются подходами к построению дашбордов, выбором ключевых показателей и метрик и представлением найденных инсайтов в правильном виде для ключевой аудитории. Мы разберем на Марафоне ключевые ошибки при построении дашбордов, чтобы экономить ваше время и энергию для коммуникации с коллегами.

Мы также рассмотрим эстетические аспекты проектирования дашбордов, работу со шрифтами, цветом, композиционными решениями. Поделимся подмеченными из нашей практики фишками и советами.

Для каждого этапа будут представлены датасеты и задания, которые помогут вам закрепить работу с Tableau.

Мы хотим обменяться большим количеством полезняшек в виде интересных ссылок на сторонние материалы, книги, видео, своими собственными постерами и чеклистами, которые будут полезны вам в вашей работе или проектах.

Давайте посмотрим как работать с материалами...
КАК МЫ РАСПОЛОЖИЛИ МАТЕРИАЛЫ
Материалы каждого дня будут расположены в цветных блоках - теории, практики, вдохновения и полезняшки.
ДАВАЙТЕ ОБСУДИМ КЛЮЧЕВЫЕ МОМЕНТЫ ПОДГОТОВКИ
Успех полностью зависит от проделанной подготовки. Продуктивность – не случайность. Это всегда результат стремления к совершенству, разумного планирования и целенаправленных усилий.
Ваш инструментарий
Что такое Tableau, какую версию продукта Вам использовать, и как сделать все настройки для Марафона
Миссия Tableau — помочь людям увидеть и понять данные
Tableau — серия продуктов визуализации и обработки данных, которая используется для создания бизнес-аналитики и визуальной отчетности. Продукты Tableau входят в категорию продуктов «self-service» — они предоставляют весь необходимый инструментарий для самостоятельной работы пользователям.
TABLEAU
Кратко о продукте
О линейке продуктов и что мы будем использовать для Марафона
Что всем так нравится в продуктах Tableau?

+ Интуитивно понятный интерфейс
+ Не требуется специфичных технических знаний, например, SQL
+ Повышается самостоятельность пользователей в работе с данными
+ Интерактивность отчетности
+ Сокращается время подготовки отчетности

ПРИНЦИП РАБОТЫ
Алгоритм работы с данными в Tableau очень простой и состоит из трех основных этапов: выбор источника данных, визуализация данных, публикация результата
Данные могут рассказать важную историю. Они полагаются на то, что вы дадите им громкий и убедительный голос.

// Стивен Фью
МАГИЧЕСКИЙ КВАДРАТ ГАРТНЕРА
Шесть лет подряд Tableau остается в квадранте лидеров среди ключевых игроков рынка бизнес-аналитики. Детали можно посмотреть тут
Как Tableau работает с данными
Tableau Desktop поддерживает множество источников данных: таблицы, статистические файлы, базы данных, многомерные кубы и даже онлайн-источники, включая Google Analytics, Amazon Redshift и Salesforce. При запуске Tableau Desktop, список возможных источников данных отображается на стартовом экране. Файловые типы данных показываются в самом начале, затем перечислены серверы баз данных или последние источники, к которым вы подключались. Вы также можете напрямую вставлять табличные данные из буфера обмена.
Источники данных Tableau Desktop
Данные - новая нефть
В зависимости от источника данных, вы можете выбрать прямое подключение к данным или создание экстракта. При прямом подключении, данные в Tableau будут обновляться при каждом изменении источника. Прямое подключение доступно не ко всем источникам данных в Tableau и не всегда удобно в использовании. Прямое подключение увеличивает нагрузку на вычислительные мощности и может замедлять процесс работы с данными в Tableau. Альтернативой является использование экстрактов.

Экстракт — это одномоментный сжатый снимок имеющихся данных в источнике, который хранится локально на компьютере и подгружается в память программы. При создании экстракта, его можно оптимизировать, применив фильтры и агрегацию. Тем самым снизится объем данных и повысится скорость работы. Обновление экстракта может происходить каждые 15 минут. При этом, можно выполнять как полное обновление экстракта с нуля, так и инкрементальное обновление, которое добавляет только новые строки.

Для работы с экстрактами используется технология Data Engine — это поколоночная in-memory СУБД, использование которой существенно ускоряет работу с аналитическими запросами для больших источников данных. В версии 10.5 текущий Data Engine был заменен на еще более эффективную in-memory технологию Hyper.

Оптимальный выбор способа подключения источника данных между Live и Extract зависит от особенностей базы данных и коннектора, частоты обновления, скорости работы, сложности запросов и объема данных.
Окно подключения источника данных

После подключения к источнику, открывается экран настройки источника данных: вкладка DataSource. Это промежуточный этап перед началом работы с визуализацией данных.
На этом экране можно:
  • объединить несколько таблиц с данными (join)
  • сделать union (сцепление нескольких таблиц)
  • выбрать тип подключения Live/Extract
  • настроить типы полей
  • переименовать поля
  • скрыть ненужные поля
  • добавить фильтры на уровне источника данных
Интерфейс вкладки DataSource
Как Tableau присоединяется к источникам данных можно посмотреть на официальном видео.
Как Tableau работает с источниками данных (английский язык)
Официальное видео
Tableau поддерживает создание джойнов (joins) данных и юнионов (unions).

Джойны
Соединения таблиц в практике работы с источниками данных необходимо очень часто. Tableau предоставляет полный набор способов соединений. Для эффективной работы необходимо запомнить и в дальнейшем различать различные типы соединений.

Посмотрите на объяснение типов джойнов ниже.
Юнионы
Когда вы создаете джойны, вы комбинируете две или больше таблиц, добавляя столбцы. Когда вы создаете юнион, вы комбинируете таблицы с данными, добавляя строки, то есть новые значения тех же столбцов. Чтобы сделать юнион, у вас должны быть данные одной внутренней структуры. Вы можете создавать юнион между таблицами Excel, Google Sheets, JSON и CSV. А также между таблицами в базах данных Amazon Redshift, Google BigQuery, HP Vertica, Microsoft SQL, MySQL, Oracle, PostgreSQL.
Пример юниона
Сохранение результатов

Tableau позволяет сохранить выполненную работу, выбрав для этого файл определенного типа. Пользователь сам должен определить какие данные ему следует сохранить для последующей работы.
Форматы сохранения файлов Tableau
Tableau Prep — новый продукт для подготовки данных

При проведении анализа данных, 80% времени занимает их подготовка, и лишь 20% - их визуализация и дальнейшая аналитика. Чаще всего данные в «сыром» виде не пригодны для загрузки в системы аналитики и дальнейшего анализа: почти всегда они требуют процедур по очистке данных.

Эту задачу решают ETL-инструменты — от англ. Extract, Transform, Load — но, как правило, они дорогие и требуют хорошего уровня подготовки. Tableau решает сделать ETL-инструменты доступными и понятными; может быть даже ориентированными на начинающих пользователей, которые хотят быстро решать свои ежедневные задачи.

Название нового ETL-продукта от Tableau — Tableau Prep. Интерфейс Tableau Prep внешне похож на Tableau Desktop. Поэтому процесс адаптации к новому продукту у текущих пользователей можно назвать простым.
Ваша Стратегия Обучения
Как вы привыкли развивать свои способности, с какой скоростью строите работу с материалами, какой вид контента или коммуникации предпочитаете - все это влияет на конечный результат
Стратегические просчеты не могут быть компенсированы тактическими средствами.
Визуализация данных одна из наиболее быстро развивающихся областей Аналитики и Науки о Данных. Она дает возможность представить данные в таком виде, чтобы даже не подготовленный человек, не аналитик смог понять это. Объединение таких эстетических элементов как Цвет, Текстовые подписи выполненные различными видами Шрифтов создают произведения искусства которые в тоже время передают аналитические выводы и озарения которые в свой черед помогают принимать бизнес решения.

Так как объемы данных продолжают расти, мы нуждаемся в людях которые не только могут визуализировать большие объемы данных, но и выстраивать полноценную коммуникацию с различными типами аудитории на основе историй и презентаций.

Марафон – это наша попытка дать бесплатную возможность погрузиться в основы визуализации данных с помощью Tableau.

Как показывает практика для людей новых и не знакомых с Tableau выстроить единый путь обучения не представляется возможным. Все люди разные, и разнятся их навыки, жизненый опыт, подходы к решению задач… Но то, что объединяет всех, это желание максимально эффективно инвестировать свое время в получение новых знаний и навыков. В своей практике обучения мы увидели разные подходы и хотели бы поделиться с вами своими наблюдениями и выделить типы ресурсов, которые смогут помочь именно ВАМ.
О доступных ресурсах
Итак, ресурсный пул таков:

НАБОРЫ ОТ TABLEAU: очень эффективным является ознакомление на самой ранней стадии работы с продуктом с короткими видео, которые подготовлены по тематикам самой компанией Tableau. По ходу марафона мы будем делать отсылки к материалам Tableau чтобы у вас была возможность более детально самостоятельно исследовать изучаемые вопросы. Также очень хорошо помогает работа со структурированной Базой Знаний вопросов и ответов, а также с бессмертным набором онлайн документации, которая позволяет быстро находить ответы на вопросы. Описание только функциональности Tableau Desktop занимает более 1000 страниц, и не каждый практик Tableau работает со ВСЕМИ функциями и возможностями продукта. Поэтому, мы будем с вами двигаться в Марафоне по тем темам, без которых сложно выстроить системную работу. Мы освоим их в первую очередь.

РАЗБОР РАБОТ ДРУГИХ СПЕЦОВ: у Tableau существует совершенно потрясающие сервисы для комьюнити специалистов по всему миру, где люди из различных стран, отраслей и функциональных подразделений бизнесов, а также некомерческих организаций могут делиться своими работами. У большинства работ есть возможность загрузить на свой компьютер Рабочую книгу в которой были сделаны визуализации и разобрать все элементы для понимания механизмов, подходов и используемых данных. Мы подобрали для Вас примеры интересных работ, на основе которых вы сможете улучшить свои навыки проектирования визуализаций

БЛОГИ и ПАРТНЕРСКИЕ РАЗРАБОТКИ: с Tableau работают тысячи партнеров по всему миру, и в их чисто входят как крупнейшие системные интеграторы, так и талантливые эксперты по визуализации данных, фрилансеры и дата журналисты, которые делятся своими наработками и открытиями по использованию Tableau. Лучшие блоги будут доступны для вас из наших подборок. Отслеживание публикуемых там статей и материалов даст вам возможность применять проверенные методы в вашей профессиональной сфере.

КНИГИ: мы считаем что это один из наиболее системных форматов для обучения работе с Tableau, хотя и не столь оперативный как блоги. Каждая книга по Tableau это работа не одного года и иногда целых коллективов людей. Все книги сильно отличаются по аудитории, на которую рассчитаны, по сферам применения, по подаче материала и множеству других параметров. Мы подобрали для Вас библиотеку книг из открытых источников для персонального некоммерческого использования. Будем рады поделиться своими комментариями и рецензиями, а также сделать ссылки на наиболее интересные и практичные работы.

ТРЕНИНГИ: сколько бы вы ни читали статей, общение с живым специалистом позволит вам соединить все точки вместе, системно взглянуть на ваш опыт и разработать следующие шаги для повышения мастерства. Вы можете выбрать как онлайн форму обучения с обратной связью на таких площадках как Coursera, Udemy или Pluralsight, так и очные формы проводимые как самой компанией Tableau (например групповые, индивидуальные, или во время ежегодных конференций) так и партнерами (например Interworks, InformationLab, DataYoga).

Остальное вам даст ПРАКТИКА, ПРАКТИКА, ПРАКТИКА... Берите свои данные, открытые данные или спросите о задачах визуализации данных у своих коллег и пробуйте делать шаги самостоятельно... Хорошим подспорьем являются различные инициативы типа MakeoverMonday
ПРАКТИКА И ЗАДАНИЯ
В голубом разделе мы будем преодолевать водные препятствия и выполнять задания чтобы вы смогли закрепить свои знания и навыки
Как подготовиться к Марафону технически?
У разных продуктов из системы Tableau разный список источников для подключения. Профессиональная версия Tableau Desktop имеет больше всего источников данных. В версии Tableau Desktop Personal можно подключаться к гораздо меньшим источникам - тут отсутствует подключение к серверам и многомерным кубам. Источники данных в бесплатной версии Tableau Public включают в себя только таблицы и текстовые файлы, а также подключение через Web Data Connector.
По ходу Марафона для выполнения заданий и практической работы с программным продуктом Tableau, вам понадобится одна из версий. Выбирайте на свое усмотрение.
жорж:
Нужно ли мне инсталировать Tableau Desktop (15 дней полнофункциональная тестовая версия) или Tableau Public (бесплатная версия с ограничениями по работе с источниками данных и вариантами сохранения)?
DataYoga:
Для выполнения всех заданий Марафона вам достаточно будет бесплатной версии Tableau Public
Установка Tableau Desktop
Бесплатная версия на 14 дней с полным функционалом. После истечения пробного периода, технически вы можете начать новый пробный период
1
Для инсталяции продукта идем на сайт Tableau в раздел Releases
2
Скачиваем самую свежую версию 2018.2 по кнопке Download Desktop 2018.2
3
Запускаем установочный файл на ПК, далее по инструкции
4
При первом запуске вам будет предложено заполнение анкеты. Заполните обязательные поля и продукт будет готов к использованию
Установка Tableau Public
Public - полностью бесплатная версия Tableau Desktop, но с некоторыми ограничениями. В Паблике нельзя сохранять результаты своей работы на ПК - только в свой профиль на сайте public.tableau.com. Этого будет достаточно для целей курса, но вы всегда можете скачать версию Tableau Desktop, как более удобную.
1
Зайдите на сайте Tableau Public
2
Введите свой email в окне на стартовой странице и нажмите кнопку Download the App
3
Вам также нужно создать аккаунт на сайте Tableau Public через окошко в правом верхнем углу: Sign In. В появившемся окне в самом низу выберите Create one now for free, чтобы зарегистрироваться.
Легкий бриз и ваши размышления перед Марафоном
Несмотря на то что сегодня день 00, без ментальной практики и небольшого задания на размышление мы не хотели бы чтобы вы заканчивали этот день. В качестве небольшой разминки перед Марафоном мы предлагаем вам поразмышлять о видах визуализаций которые вы находите вокруг себя, или применяете в своем бизнесе, или сталкиваетесь в медиа источниках. А на примере так называемых "мусорных визуализаций" мы попробуем рассмотреть какие элементы, из которых состоят графики и диаграммы, мешают нашему восприятию важной для нас информации.
Junk charts
Chartjunk относится ко всем визуальным элементам в диаграммах и графиках, которые не нужны для понимания информации, представленной на графике, или отвлекающей зрителя от этой информации. Маркировки и визуальные элементы можно назвать "мусором", если они не являются частью минимального набора визуальных средств, необходимых для сообщения информации понятным образом.
Примеры ненужных элементов, включают в себя тяжелые или темные линии сетки, ненужный текст, чрезмерные, сложные или неуклюжие шрифты, орнаментированные оси диаграммы, лишние изображения или значки в графах данных, 3D графики, а также шумные фоны. Все это затрудняет чтение диаграмм и отвлекает от данных.
Размышление о junk charts - примеры
Что для себя вы находите привлекательным в работах? Что отталкивает в них? Какие элементы остаются непонятными и противоречивыми?
Диаграмма №1
  • Искажение пропорций
  • Не считывается размерность данных
  • Последний год, который представляет собой прогноз, визуально не отличается от факта
Диаграмма №2
  • Неравномерные периоды времени слева
  • "Половинки" человечков - неудачный способ кодирования данных через такую фигуру
  • Таблица сбоку никак не завязана на диаграмму
Диаграмма №3
  • 3D бары, искажающие реальное соотношение величин
  • Неясное цветовое кодирование баров (синий/голубой), где цвет ничего не означает
  • Лишнее визуальное оформление
Диаграмма №4
  • Неудачная визуальная метафора для показа частей целого
  • Шрифт написан в разные стороны, что затрудняет чтение
  • Лишняя детализация цифр
  • Неясная размерность показатеоя
Диаграмма №5
  • Лишняя визуальная метафора
  • Перегруз графиками: бары, линии, цифры наверху
  • Сотые части показателя, которые можно исключить и показать только целые %
ВДОХНОВЕНИЕ
В зеленом разделе мы будем собирать для вас вдохновляющие видео или потрясающие работы ведущих исследователей и визуализаторов, чтобы вы могли узнать освящаемые темы с максимальной глубиной.
Полезные ссылки по теме
Для первичного вдохновения от Tableau
Видео
Для воодушевления, балансировки и расширения сознания
TED
Information is Beautiful
David McCandless рассказывает о применении визуализации в разных сферах дата журналистики. Смотреть с русским транскриптом
МАТЕРИАЛЫ
В желтом разделе мы будем собирать для вас все полезняшки и артефакты которые вы можете скачать для собственного использования и которые помогут вам самостоятельно проработать дополнительные аспекты работы с данными или построения визуализаций
Наши Артефакты
Помогут Вам лучше усвоить и вовремя вспомнить основные элементы методик, подходов, последовательностей действий, проверенных практик
Эти два постера помогут вам рассмотреть подробнее ключевые элементы процесса визуализации в Tableau. На них вы также найдете элементы, разговор о которых у нас еще состоится в последующие дни. Накапливайте артефакты Марафона чтобы лучше и эффективнее погрузиться в мир визуализации, в мир Tableau.
Книги
То что нужно для хорошего отдыха между точками маршрута.
По ходу Марафона, мы добавим описание и линки на многие потрясающие книги и издания, изучение которых поможет вам лучше увидеть и понять ваши данные.
Иоханнес Иттен. Искусство Цвета
Книга написана на основе наблюдений художника за цветом в природе и произведениях искусства
Мы долго думали как поступить с набором книг который мы рекомендуем участникам наших корпоративных курсов для дальнейшего изучения Tableau и мы решили поделиться библиотекой до начала Марафона. Почему? Считаем что не у всех участников хватит сил и энергии добежать до конца, а вот использование продукта Tableau скорее всего будет востребовано. Поэтому, какую бы стратегию вы не выбрали для своего развития и профессионального роста, хороший набор полезных артефактов вам в любом случае пригодится.
Итоги этапа
Программное обеспечение установлено, подготовлено и настроено, датасеты ждут VizSQL запросов , стратегия обучения вырисовывается своими контурами, продукты Tableau в своей линейке понятны, но не до конца. Ждем наступающего дня чтобы добежать до базовых визуальных концепций продукта Tableau. Смотрим видео чтобы привыкать к новой терминологии. До встречи. Виз виз урааа!!!
~
DATA YOGA CLUB