Одураченные статис­тикой: как могут обмануть линейные графики
Статистика
5K
Сгенерированное изображение — Лев Переулков / Midjourney

Одураченные статис­тикой: как могут обмануть линейные графики

4
Аватар автора

Алексей Смагин

ведет курс по визуализации данных

Страница автора

В прошлом материале рубрики «Одураченные статистикой» мы разобрали, как работает визуализация данных и как недобросовестные авторы графиков могут нарушать базовые правила построения диаграмм, чтобы искажать восприятие.

В этот раз углубимся в манипуляции, которые могут встречаться в линейных графиках — одном из самых распространенных видов графиков.

Для чего используют линейные графики

Такие диаграммы обычно применяют, чтобы продемонстрировать, как показатели меняются со временем. Важная их особенность — оси здесь не только можно, но и часто необходимо строить не от нуля. Сравните, как выглядят два графика ниже, которые показывают динамику численности населения России. В первом случае кажется, что с 2001 по 2015 год население практически не менялось. Во втором — заметно, как оно снизилось с 2001 по 2010.

Когда мы смотрим на такие графики, важно понимать, какую мысль хочет донести до нас автор. Во многих случаях изменение величины нельзя сопоставлять с ее размером. Падение численности населения, заметное в масштабе от нуля, было бы настоящим бедствием. Однако даже изменение на 100 тысяч человек здесь важно для понимания демографических тенденций.

Источник: Росстат
Источник: Росстат

Почему важно соотношение сторон диаграммы

Еще одна возможность визуально «приукрасить» изменение величины — растянуть график по горизонтали или по вертикали. Вот два варианта визуализации изменения цены биткоина за месяц. В одном случае создается впечатление, что курс цифровой валюты сильно упал, а в другом изменение не кажется таким уж внушительным.

Если график имеет нестандартные пропорции и сильно вытянут по ширине или высоте, это повод лишний раз задуматься, не хотят ли от нас что-то скрыть. Хорошим ориентиром всегда будут числовые значения: они точно дадут понять, стоит ли внимания изменение величины.

Источник: Investing.com
Источник: Investing.com

Как обманывают, используя двойные оси

Один из часто встречающихся способов запутать читателя — использование двойной шкалы на вертикальной оси. График Financial Times буквально кричит о том, что коренное население США сокращается. В подтверждение мы видим синюю линию, число приезжих, которая пересекает красную — коренное население. Лишь внимательный читатель заметит, что у каждой линии на графике своя ось — и синяя к концу периода достигает 40,5 млн, в то время как красная падает незначительно, с 169,8 до 168,3 млн.

Кроме того что график Financial Times выглядит как некрасивая манипуляция, вывод в заголовке слишком смелый: по этим данным действительно видно, как растет количество приезжих, но число местных при этом практически не меняется.

Источник: Financial Times
Так выглядит более честная версия этого графика. Источник: Бюро статистики труда США

В примере FT для одного показателя использованы разные оси, но один масштаб. На графике с двойными осями любые две линии можно представить так, что смысл высказывания полностью исказится. Одну линию можно изобразить таким образом, что все колебания будут казаться очень большими, а другую, напротив, сжать — чтобы изменения были не видны.

Чтобы «разгадать» график с двойными осями, лучше всего посмотреть на обе: проверить, как они соотносятся друг с другом и насколько сильно изменилась каждая из величин. Так вы сможете получить более правильное представление о данных.

Например, так мог бы выглядеть график, если бы его автор решил доказать, что число приезжих в США стабильно. Источник: Financial Times
Например, так мог бы выглядеть график, если бы его автор решил доказать, что число приезжих в США стабильно. Источник: Financial Times

Как обманывают, используя «удобный» временной период

Иногда, чтобы подтвердить свою идею, авторы инфографики выбирают подходящий временной период — например, такой, на котором показатель все время растет. Вернемся к примеру с населением России: даже с 2001 по 2024 год показатель численности населения ведет себя по-разному: c 2001 по 2006 — падает, с 2007 по 2022 — растет, потом снова падает.

Недобросовестный автор мог бы взять фрагмент этого изображения с 2007 по 2022 год, заявив, что население страны увеличивается.

В таких ситуациях особенно сложно уличить автора в манипуляции. Подозрение могут вызывать только косвенные признаки:

  1. Слишком явный тренд — показатель либо все время растет, либо только падает.
  2. Маленький временной период — например, на основе данных о числе преступлений за три месяца делается вывод о росте преступности в целом.
  3. Нет данных за последнее время. Например, в статье 2018 года публикуют график, где последняя информация — за 2014 год.
Источник: Росстат
Источник: Росстат

Как накопительный эффект всегда демонстрирует рост

Есть тип величин, которые не могут убывать со временем. Например, общее число проданных Айфонов, число выполненных за год задач, количество погибших от оспы. Визуализация таких данных может выглядеть эффектно и впечатляюще — как, например, число тестов на коронавирус в примере ниже из презентации Дональда Трампа.

Смотря на такие графики, важно помнить, о чем хочет рассказать вам их автор. Сам по себе рост количества тестов не говорит о том, что их стали делать больше. Даже если темпы тестирования замедлятся, такой график все равно будет показывать рост, так как проявляется накопительный эффект.

Источник: ABC News
Источник: ABC News

Что стоит помнить про линейные графики

  1. Цель линейного графика — показать, как меняется величина со временем, а не сравнивать значения. Поэтому оси таких графиков часто строят не от нуля — чтобы изменения не казались слишком незначительными.
  2. Если вы увидели слишком узкий или слишком маленький по высоте график — возможно, от вас пытаются что-то скрыть. Проверьте числа — действительно ли изменение такое серьезное, как оно выглядит.
  3. Двойные оси могут искажать восприятие данных. Если на графике с несколькими осями линии пересекаются, это не обязательно значит, что одна величина стала больше другой. Лучше посмотреть на оси и убедиться, что вы правильно понимаете визуализацию.
  4. Иногда авторы графиков могут подбирать нужный временной отрезок, чтобы доказать свой тезис. Если тренд вызывает подозрение, стоит проверить, за какой период показаны данные.
  5. Если на графике показывают сумму каких-то величин, полезно помнить, что она всегда растет и такой график не говорит о скорости ее роста.

Жизнь россиян в цифрах: что едят, сколько работают, куда ездят и на что тратят деньги. Подписывайтесь, чтобы не пропустить самое интересное: @t_stata

Алексей СмагинСталкивались с похожими манипуляциями? Расскажите об этом:
  • ПумпончикИспользую «удобный» временной период на графиках с данными по фондовому рынку :)2
  • Владимир ЮрьевичЧасто про цены акции такие манипуляции. Читаешь - там акция показала сегодня необычайны рост - смотришь и правда - рост. Обращаешь внимание на масштаб цены, а там 2 копейки разницы😄4
  • DombeyНа военной кафедре (РИСИ) много лет висела на стенде несвежая диаграмма с удельными весами родов войск, в которых служат бывшие студенты. От нечего делать сложил и получилось, если правильно помню, 114%. Меня не проведешь.2
  • Алексей СмагинDombey, а может быть такое, что один человек служил в войсках двух типов?) Тут надо разбираться, как были визуализированы данные Если при помощи пайчарта, то так нельзя, конечно!2
  • ПумпончикАлексей, часто обращаю внимание на ошибки товарищей в диаграммах. А мне отвечают, что я душнила! :(1
  • Ярослав ГавриловМне кажется у Горбунова есть правило 45⁰, если вдруг видишь такой угол линейного графика - ищи манипуляцию0