Читать онлайн "Графики, которые убеждают всех [litres]" - Богачев Александр Андреевич - RuLit

В зависимости от цвета волос (качественное свойство) мы изменяем цвет точек. Цвет точек, соответствующих актерам-брюнетам, сделаем черным. Точке, соответствующей актеру-блондину (он всего один – Дэниел Крейг), присвоим оранжевый:

Добавим подпись для оси X. В легенде объясним значения цветов. По ней читатель сможет раскодировать информацию:

Проведем линию от ноля до точки, соответствующей количеству фильмов. Так будет удобнее сопоставлять актера и количество фильмов, в которых он сыграл.

Мы наглядно увидели, как образуется визуализация данных. И сразу же познакомились с двумя задачами, которая она может решать: графически представлять данные и удобно их сравнивать. В нашем случае сравнение данных происходило за счет того, что все точки стояли на расстоянии, пропорциональном количеству фильмов.

Есть еще одна задача для визуализации: она может обеспечивать ранжирование данных – сортировку по определенному принципу (от большего к меньшему, по алфавиту и так далее). Никогда не стоит пренебрегать этой возможностью. На самом деле наши значения сейчас тоже ранжированы: актеры расположены в хронологическом порядке. Нагляднее будет, если разместить их по убыванию значений:

Определенная комбинация выбранного объекта и свойств образует вид визуализации: столбиковую диаграмму, линейный график и т. п. У нас получилась диаграмма, которая называется lollipop – леденцовая, своеобразный гибрид столбиковой и точечной. Она позволяет сфокусироваться на сравнении между собой окончаний линий, а не размеров столбиков. Ее можно использовать вместо столбиковой.

Эффективность вида визуализации как инструмента донесения сообщения определяется:

• Однозначностью считывания – понятностью. Когда человек быстро понимает, какие именно объекты и их свойства и как именно кодируют числовые значения.

• Тем, насколько удобно и точно он позволяет человеческому глазу раскодировать графические образы обратно в числовые значения.

• И, наконец, самое главное – тем, насколько тип визуализации подходит выбранным данным.

Именно последний пункт в значительной мере определяет эффективность донесения вашего сообщения.

Стоит избегать двойного кодирования, когда одно и то же свойство объекта кодируется сразу несколькими способами – например, длиной и цветом. Это вводит в заблуждение и сразу неоправданно повышает сложность визуализации:

В первом случае количество фильмов закодировано только длиной столбика. Во втором – еще и степенью яркости цвета самого столбика. В этом нет необходимости.

Существует огромное количество геометрических фигур и их визуальных свойств. А число их комбинаций и вовсе стремится к бесконечности. Однако базовых типов визуализации данных совсем немного. Давайте посмотрим на них.

Типы сравнения

Как вы помните, в третьей главе «Формулируем сообщение» мы говорили о том, что ваши находки по результатам анализа данных формулируются в терминах повышения, снижения, влияния одних переменных на другие, характера распределения значений, описания тренда или значений, которые выбиваются.

Можно выделить несколько основных видов взаимоотношений между данными, соответствующих возможным видам сообщений:

1. В основе почти всех взаимоотношений между данными, которые мы можем визуализировать, лежит сравнение. Чаще всего с помощью визуализации данных мы пытаемся понять, какие из значений больше или меньше других и в какой степени.

Понятно, что почти все виды визуализации данных (кроме, может быть, связей) позволяют сравнивать: наглядно видеть, какие числовые значения больше, а какие меньше. Однако первый тип фокусируется именно на сравнении.

Если при этом отсортировать значения, чаще всего от большего к меньшему, то к сравнению добавляется функция ранжирования. Мы получаем возможность ответить на вопрос «на каком месте?».

Основные слова в сообщении для этого типа визуализации – «больше, чем», «меньше, чем», «равно», а также указание на место (при ранжировании).

Примеры сообщений:

Больше всего в 2018 году подорожало пшено – на 38 %.

АФК «Система» занимает третье место по выручке среди системных интеграторов России.