3 вопроса, чтобы задать себе в следующий раз, когда вы увидите график, диаграмму или карту Члены оперативной группы Белого дома по коронавирусу ссылаются на вводящую в заблуждение таблицу в ходе брифинга для прессы AP Photo / Алекс Брэндон

Со времен росписи на стенах пещер люди представляли информацию через рисунки и изображения. В настоящее время специалисты по визуализации данных знают, что представлять информацию визуально помогает людям лучше понять сложные данные, Проблема заключается в том, что визуализация данных также может привести к неверному представлению о том, сделаны ли изображения небрежно или намеренно вводят в заблуждение.

Возьмите, например, гистограмму, представленную на 6 апреля пресс-брифинг членами Целевой группы Коронавируса Белого дома. Он называется «Тестирование COVID-19 в США» и иллюстрирует почти 2 миллиона тестов на коронавирус, выполненных до этого момента. Президент Трамп использовал график, чтобы поддержать его утверждение, что тестирование было «идет быстрыми темпами«. Основываясь на этом графике, многие зрители, вероятно, забрали один и тот же вывод, но он неверен.

На графике показано общее совокупное количество тестов, выполненных за месяцы, а не количество новых тестов в день.

Если вы построите график количества новых тестов по дате, вы увидите, что количество тестов COVID-19, проведенных в период с марта по апрель, действительно увеличивалось во времени, но не быстро. Этот случай является одним из многих, когда важная информация не была правильно понята или не была должным образом передана.


графика подписки внутри себя


исследователь связи опасности и рискаЯ много думаю о том, как люди интерпретируют диаграммы, графики и карты они встречаются ежедневно.

Показывают ли они случаи COVID-19, тенденции глобального потепления, зоны цунами высокого риска или использование коммунальных услуг, способность правильно оценивать и интерпретировать цифры позволяет вам принимать обоснованные решения. К сожалению, не все фигуры созданы равными.

Если вы можете обнаружить подводные камни фигуры, вы можете избежать плохих. Рассмотрите следующие три ключевых вопроса в следующий раз, когда вы увидите график, карту или другие визуальные данные, чтобы вы могли уверенно решить, что делать с этим новым фрагментом информации.

Что эта фигура пытается мне сказать?

Начните с чтения заголовка, просмотра этикеток и проверки подписи. Если они недоступны - будьте очень осторожны. Метки будут на горизонтальной и вертикальной осях на графиках или в легенде на картах. Люди часто упускают их из виду, но эта информация имеет решающее значение для помещения всего, что вы видите в визуализации, в контекст.

Посмотрите на единицы измерения - в днях или годах, градусах Цельсия или Фаренгейта, числах, возрасте или как? Равномерно ли они расположены вдоль оси? Многие из последних кумулятивных графов случаев COVID-19 используют логарифмическую шкалу, где интервалы вдоль вертикальной оси разнесены неравномерно. Это создает путаницу для людей незнаком с этим форматом.

Передача «Шоу Рейчел Мэддоу» от 12 марта включала график с немаркированными числами и хитрой горизонтальной осью.

Например, график из «Шоу Рейчел Мэддоу »на MSNBC, показали случаи коронавируса в Соединенных Штатах в период с 21 января по 11 марта. Единицами по горизонтали по оси X являются время (в формате месяц-день), а по вертикали по оси Y являются предположительно кумулятивным числом случаев, хотя это не указывает.

Основная проблема с этим графиком заключается в том, что периоды времени между последовательными датами неравномерны.

На пересмотренном графике с правильно распределенными датами во времени и диагнозами коронавируса, нанесенными в виде линейного графика, вы можете более четко увидеть, что экспоненциальный рост в темпе заражения действительно выглядит так. Для добавления 30 случаев потребовалось первые 33 дней, а для добавления 584 - только последние четыре.

То, что может показаться незначительной разницей, может помочь людям понять, как быстро экспоненциальный рост может зашкаливать, и, возможно, изменить то, как они воспринимают важность его ограничения.

Как используются цвет, форма, размер и перспектива?

Цвет играет важную роль в том, как люди интерпретируют информацию. Выбор цвета может заставить вас заметить определенные узоры или обратить внимание на определенные аспекты графики.

3 вопроса, чтобы задать себе в следующий раз, когда вы увидите график, диаграмму или карту Орегонская склонность к оползням. Управление геологии и минеральной промышленности штата Орегон

Рассмотрим две карты, отражающие восприимчивость к оползням, которые абсолютно одинаковы, за исключением обращенных цветовых схем. Ваш глаз может быть обращен к более темным оттенкам, интуитивно видя те области как с более высоким риском Посмотрев на легенду, какой цветовой порядок, по вашему мнению, лучше всего отражает информацию? Обращая внимание на как используется цвет, вы можете лучше понять, как это влияет на то, что выделяется для вас и что вы воспринимаете.

Форма, размер и ориентация элементов также могут влиять как вы интерпретируете фигуру.

запутанная круговая диаграмма данных о занятости В каких отраслях работают колорадцы? Полушария

Круговые диаграммы, подобные этой, показывающие распределение занятости по региону, общеизвестно трудны для анализа. Обратите внимание на то, как трудно определить, какая категория занятости самая высокая или как они занимают место. Клинья круговой диаграммы не организованы по размеру, слишком много категорий (11!), Трехмерная перспектива искажает размеры клинов, а некоторые клинья отделены от других, что делает сравнение размеров практически невозможным.

Гистограмма является лучшим вариантом для информативного отображения и помогает показать, в каких отраслях работают люди.

Откуда поступают данные?

снимок экрана опроса Twitter о производительности Трампа Опрос, опубликованный в «Lou Dobbs Tonight», требует от зрителей проголосовать в Твиттере об эффективности Трампа Fox Business Network

Источник данных имеет значение с точки зрения качества и надежности. Это особенно верно для партизанских или политизированных данных. Если данные собираются из группы, которая не является хорошим приближением к населению в целом, то это может быть предвзятым.

Например, 18 марта ведущий Fox Business Network Лу Доббс опросил свою аудиторию с вопросом: «Как бы вы оценили лидерство президента Трампа в борьбе нации против вируса Ухань?»

 

Представьте себе, если бы только республиканцы задавали этот вопрос и как бы сравнивались результаты, если бы задавались только демократы. В этом случае респонденты были частью группы, которая выбирала себя и уже решила посмотреть шоу Доббса. Опрос может рассказать только о мнениях этой группы, а не о людях в США, например.

Затем учтите, что Доббс дал только положительные ответы в своих вариантах с множественным выбором - «превосходно, отлично или очень хорошо» - и ясно, что эти данные имеют тенденцию к предвзятости.

Выявление предвзятости и неправильных методов сбора данных позволяет вам решить, какая информация заслуживает доверия.

Продумывай то, что видишь

Во время этой пандемии информация появляется час за часом. Потребители СМИ ежедневно завалены фактами, диаграммами, графиками и картами. Если вы можете потратить некоторое время, чтобы задать себе несколько вопросов о том, что вы видите в этих визуализациях данных, вы можете уйти с совершенно другим выводом, чем вы могли бы иметь на первый взгляд.Беседа

Об авторе

Карсон Макферсон-Круцкий, кандидат геологических наук, Университет штата Айдахо

Эта статья переиздана из Беседа под лицензией Creative Commons. Прочтите оригинал статьи.