ДЕНЬ 04
Про отсечение лишнего
СЕГОДНЯ

Ну вот, наконец-то и использование фильтров - Для чего они необходимы? Где происходит обработка фильтров? Почему это имеет значение? Фильтры для Измерений, Метрик, Дат. Быстрые фильтры и их форматирование. Лучшие практики использования фильтров.

... ЧТОБЫ СФОКУСИРОВАТЬ НА ГЛАВНОМ
Фильтрация данных - это быстрый и простой способ найти подмножество данных и работать с ними в определенном диапазоне. В отфильтрованных данных отображаются только строки, соответствующие заданным условиям, а ненужные строки исключаются.

Использование фильтров сужает количество данных для отображения и это необходимо для концентрации только на самом главном.
РАЗБИРАЕМСЯ
В том, как фильтровать данные и оставлять самое необходимое
Фильтры
При помощи фильтров мы выбираем нужный для нас срез данных. Отсекаем ненужное, концентриуем внимание, выбираем только то, что подходит. Фильтры упрощают работу с данными.

Фильтры в Tableau находятся на полке Filters. Поля добавляются туда, как и на другие области рабочего экрана. Затем задаются условия для фильтрации. Условия могут быть как простыми, так и составными - могут даже включать в себя вычисления и логические проверки.

Кстати, при работе с многомерными кубами использование фильтров обязательно. С их помощью вы определяете срезы куба, на которых хранятся данные. Без фильтров вы просто не сможете их получить.
Работа с фильтрами
Простые техники
Виды фильтров
Какие бывают и в чем особенности
Алгоритм фильтрации в Tableau простой: указывается либо условие для выборки значений, либо выбираются конкретные значения из общего списка.

В зависимости от типов полей, можно выделить:
  • фильтры для дискретных категорий
  • фильтры для количественных данных
  • фильтры для дат

Фильтры для дискретных категорий
Добавляем дискретное поле в полку Filters. Выбираем нужные значения из списка. По умолчанию, выбранные значения оставляются на визуализации, а все невыбранное - исключается. Но можно сделать наоборот и поставить галочку Exclude. Тогда, все, что будет выбрано в фильтре - будет исключено. Exclude полезно, если неподходящие значения проще "отметить" в списке, т.к. их гораздо меньше, чем подходящих.
Переключаясь по вкладкам, можно задавать условия для выборки значения, выбирать Топ лучших или худших. Все добавленные ограничения будут действовать одновременно. На первой вкладке видны все условия, которые вы применили.

Больше:
Онлайн справка Tableau
Дискретные фильтры
Несколько вариантов на разных вкладках
СОВЕТ
При большом количестве значений пользуйтесь поисковой строкой для выбора нужных значений.
Фильтр для количественных данных
При добавлении непрерывного поля в фильтры, выбирается диапазон значений. При этом можно задать только верхнюю или только нижнюю границу.

Больше:
Онлайн справочник Tableau
Фильтры на непрерывных значениях

СОВЕТ
На четвертой вкладке Special вы можете выбрать опцию для показа только Non-Null Values. Это исключит строчки без данных - Null-значения.
Фильтр для дат
Добавляем поле типа "дата" в фильтры. Можно выбрать один из нескольких вариантов фильтрации: по относительной дате (Relative Date Filter), по диапазону дат (Range Date Filter), по дискретным датам.

Фильтр по относительной дате - одна из самых удобных фишек Tableau. Выбирайте сколько последних дней/недель/месяцев (или часов?) вы хотите оставлять в данных. Например, график должен всегда показывать 9 последних дней. Relative Date фильтр привязывается к текущей дате, и вы каждый день будете видеть выбранный диапазон дат относительно текущего дня.

Больше:
Онлайн справочник Tableau
Использование полки для фильтров
Варианты
Интерактивные фильтры
Дополнительные техники
Порядок применения фильтров
Tableau - многоуровневый продукт, в котором на каждом уровне происходит что-то свое. Фильтры применяются последовательно друг за другом в следующем порядке, от первого к последнему:
  1. Фильтры на экстракте (при создании экстракта - среза на источнике данных)
  2. Фильтры на источнике данных (на экране Data Source)
  3. Контекстные фильтры ("любой фильтр по полю можно сделать контекстным, подняв его приоритет)
  4. Фильтры на измерения
  5. Фильтры на меры

Фильтр на источнике данных
Фильтр источника данных позволяет исключить из работы часть данных на уровне подключения. Например, исключить из таблицы определенные строки - ненужный временной интервал или ненужные категории. При создании экстракта отфильтрованные на этом уровне данные не загружаются для дальнейшей работы, что ускоряет работу.

Контекстный фильтр
Применяется первым, после фильтров источника. По итогам применения контекстного фильтра формируется датасет, к которому применяются уже все остальные фильтры. Если таблица получится небольшой - это ускоряет быстродействие.
Контекстный фильтр выделяется серым цветом на полке фильтров.


Больше про порядок операций:
Онлайн справочник Tableau
Где Tableau фильтрует данные
Уровни фильтрации
Область применения фильтров
Вы можете задавать поведение каждого фильтра в отдельности и область их применения: указывать, на какие листы должен распространяться фильтр. Фильтры называются глобальными, когда они влияют на все рабочие листы в книжке.

Области применения фильтров:
  • к текущему листу
  • к выбранным вручную листам
  • ко всем листам на этом источнике
  • ко всем листам на связанном источнике (Data Blending)
Фильтры
Дополнительные темы
Быстрые фильтры
Quick Filters
Для быстрого взаимодействия с фильтрами, в Tableau есть быстрые фильтры (quick filters). Быстрые фильтры добавляются через контекстное меню стандартных фильтров: через опцию "Show filter". Они используются в качестве элемента управления визуализацией, т.к. их добавляют на рабочую область листа или дашборда для удобства пользователей. В этом случае, не нужно редактировать фильтры в области Filters. Это можно делать через быстрые фильтры. И самое главное - это может сделать ваш пользователь самостоятельно.
Внешний вид быстрого фильтра зависит от настроек и типа фильтруемой переменной.

Больше про быстрые фильтры:
Сайт Tutorial Gateaway
Быстрые фильтры
Справа добавлено два быстрых фильтра: по Региону и по Году
ПРАКТИКУЕМСЯ
Продолжаем разбирать проекты
В этот день мы добрались до фильтров. Без них, любой график в Tableau не сильно отличается от аналогичного в powerpoint.
Как известно из теории фильтры могут быть применимы к Dimensions и Measures, могут быть адаптированы и отредактированы.
Для прохождения ответственного задания необходимо построить линейный график всех зарегистрированных проектов и собранных денег (Usd Pledged).

Сегодня есть олимпиадный вопрос со звездочкой.
О датасете
Датасет такой же, как и в предыдущем дне.
Проекты опубликованные на Kickstarter с 2009 по 2016 (не все проекты)

Скачать датасет
Задание
1. Когда и сколько успешных проектов было зарегистрировано в категории "Театр"?
2. Когда в категории "Игры" среднее значение собранных фондов было максимальным?
3. Сколько проектов было со статусом failed в категории "Дизайн" и сколько они собрали фондов в период между мартом 2012 и мартом 2014?
4. Когда из зарегистрированных проектов в Великобритании в категории "Музыка" и "Танцы" было максимальное количество провальных (failed) проектов, и сколько фондов для них собрали?
5. * Найдите проекты, зарегистрированные в США, в категории "Комиксы", когда запрос на финансы оказался меньше, чем собранных фондов, но проект не состоялся (canceled, failed, suspended)?

Скачать задание в виде книжки Tableau
Решение задания предыдущего дня
ВДОХНОВЕНИЕ
Полезные ссылки по теме
Продолжаем знакомить с лучшими ресурсами по изучению Tableau, а также собираем материалы помогающие взглянуть на визуализацию данных с разных сторон.
Видео
Сегодня Мэтт Каттс попробует вдохновить нас своим примером и убедить пробовать делать что-то новое в течение 30 дней, что позволит новому навыку стать вашей привычкой, как ... наверное, и использование фильтров в Tableau, хотя кто-то может и предпочтет сэты, но об этом в другой день.
Попробуйте новое в течение 30 дней
... как растить новые навыки
МАТЕРИАЛЫ
Книги
Любая тема для новичков заслуживает внимания уже даже тем, что делается попытка объяснять сложные вещи простыми словами. А в нашем контексте пробежать мимо больших данных никак не получится.
Большие данные для Новичков
Vince Reynolds
Итоги этапа
Ну вот мы и научились одному из ключевых навыков работе с информационным потоком - фильтрации. Искусство это нужно поддерживать, поэтому не будем уходить от этого ежедневного навыка и попробуем закрепить его серией практических заданий. Как только фильтры войдут в привычку можно переставать бояться даже самых больших данных.

Осмысляем день и готовимся к вспоминанию всевозможных арифметических операций - мы подбираемся все ближе к теме - Calculations.

До завтра все. Виз виз ура!
~
DATA YOGA CLUB