LXXI. Гадание на костях. Лгуны с чистыми руками
Сегодня у Жреца был выходной. Все клиенты были перенесены на завтра. Это было время размышлений. Примерно раз в месяц он устраивал себе подобное. Жрец обдумывал новые приемы и тактические ходы, которые позволяли бы ему еще эффективнее делать свое дело.
Он изучал статистику и пытался еще более проникнуться техникой лжи. Но Жрец не забывал и про темные силы, перед которыми он благоговел. Они давали ему силы и энергию. Прямо сейчас его особо интересовала тема...
Лгуны с чистыми руками
Говорят, что статистика — самая большая лгунья в мире. Чушь! Лгут люди. Цифры не лгут. Чтобы обман состоялся, нужен не только обманщик, нужен тот, кто будет обманываться. Предлагаю сопротивляться. Для этого наш следующий пост (если быть точнее, то серия постов в рамках этой рубрики), про способы лгать при помощи статистики. Поверьте, вас уже не раз обманывали. Давайте сделаем так, чтобы следующий раз не случился.
Мы будем не только развенчивать мифы (это любой дурак сможет, будем честными). Мы пойдем дальше — мы предложим решения, которые, надеюсь, устроят самого взыскательного читателя. Но обо всем по порядку.
Эти богатские россияне!
Не одного меня, наверное, раздражали победные отчеты Росстата о том, что средняя зарплата в России достигла рекордных 35,4 тыс. рублей (на январь 2017 г.). Жители других стран могут подставить название родных им органов приукрашения действительности с их данными.
Каждый год эта цифра разная, но непременно раздражающе нереальна. Даже если лично вы получаете больше, то уверен, вокруг вас достаточно бабушек и дедушек, которые получают много меньше, потому что не относятся к судейско-прокурорскому сословию. Посмотрев на членов своей семьи, прикинув средний доход, с трудом веришь в цифры Росстата, и хочется послать орган отчетный на детородный.
Между тем Росстат не лжет. Это реальная, действительная цифра. Как ни больно мне это признавать. Тем не менее, обман присутствует. В заблуждение можно вводить даже правильными данными, если умело пользоваться незнанием аудитории. Лучше всего это видно на примере средней зарплаты.
Как вы уже догадались, характеризовать массив зарплат по стране характеристикой «среднее арифметическое» — не самая лучшая идея. Как показала практика, у нас столько миллиардеров, что они своими сверхдоходами вполне могут поднять уровень средней зарплаты на приличный уровень. При том, что большинство по прежнему будет жить в не самых лучших условиях.
Если это плохо укладывается в голове, рассмотрим пример. В конторе работает 10 человек: начальник, который получает 10 миллионов, и 9 сотрудников, получающих по 1000 рублей. В среднем они получают по миллиону на брата (округлим для простоты). Но эта цифра, несмотря на то, что она с математической точки зрения точна — бессмысленна. Зарплата в 1 миллион не имеет отношения ни к начальнику, ни тем более к работникам. Вот так работает обман среднего арифметического.
Банкир с женой, фламандский мастер
Критикуешь — предлагай
И как нам быть? А очень просто. Среднее арифметическое — не единственная мера среднего, которая существует в математике и статистике. Не единственная и не лучшая, как мы только что убедились. Есть две другие, пользоваться которыми гораздо честнее.
Медиана
Медиана это такое значение, которое делит множество всех зарплат выстроенных по убыванию (или возрастанию) пополам. То есть половина людей получают меньше, половина больше. В случае с российскими зарплатами, медиана на 2015 год была в районе 25 тысяч. Если посмотреть на эту цифру критическим взором, то она уже гораздо ближе к реальности, чем средняя в 34 000 за тот же 2015 г. (берем данные за один и тот же год для чистоты сравнения). То есть половина населения России получает меньше 25 000. Уже теплее, но тоже как-то радужно. Может статистика предложит нам еще более адекватный показатель? Предложит.
Мода
Мода, как понятно из названия — самый частый показатель. Зарплата, которая встречается чаще всего. Понятно, что в случае зарплат удобнее работать с интервалами, а не с конкретными цифрами. Установить какой-то шаг, например, 1000 рублей и смотреть, сколько людей получают от 2 до 3 тысяч, от 3 до 4, от 4 до 5 и т.д. Так вот, если смотреть на этот параметр, то в 2015 году мода зарплат пришлась на интервал 12–13 тысяч руб. И вот в эту цифру я уже охотно верю. Сюда попадают и пенсионеры, и врачи с преподавателями (во всяком случае, некоторые из них).
Нелегкий выбор чиновника
Как мы видим, все три цифры совершенно честны. 12500 — мода, 25000 — медиана и 34000 — среднее арифметическое. Можно выбирать любую. Как вы думаете, какую именно цифру выберет чиновник, которому надо отчитаться перед вышестоящим начальством и сохранить свое теплое место? Конечно, он обратит внимание на 34 000 рублей, потому что это очень приятная и «сытая цифра».
Ведут ли себя так исключительно чиновники? Конечно нет. Работодатель, который на собеседовании с честными глазами говорит, что средняя зарплата в организации составляет 85 000, идет тем же путем.
О чем бы вам ни рассказывали — рублях, долгах, доходах, квадратных метрах, травмах, числе страховых случаев… помните, есть и две другие характеристики. Неплохо было бы их знать.
Исключения? Их есть у нас!
Бывают случаи, когда все три характеристики совпадают И тогда нет разницы, какой из них пользоваться. Это бывает тогда, когда величина изменяется по нормальному закону. Это когда какое-то среднее значение встречается чаще всего, а чем дальше от него отклоняются другие случаи, тем реже они встречаются.
Если людей с ростом 170 см больше всего (это и есть среднее), то 169 и 171 см встречается немного реже, 168 и 172 еще реже и так далее. Люди в 120 и 220 см (по 50 см в обе стороны от средних 170) встречаются исчезающе редко. На графике это выглядит как симметричная горка.
Для таких величин мода, медиана и среднее арифметическое — совпадают. Но зарплаты и квадратные метры жилья явно распределены не по нормальному закону. Если вы не знаете, по какому закону распределено то, чем вы интересуетесь, не страшно. Требуйте медиану и моду — совпадут, значит нормальное.
Выводы:
Как только вам предлагают что-то заманчивое и говорят «средняя чего-то там» — знайте, вас обманывают. Прям вот чтобы рефлекс был: услышал «среднее арифметическое» — напрягся. Мягко поинтересуйтесь другими величинами. Они должны быть. Если их вам не говорят, спросите, как узнать. Если все равно не говорят, велика вероятность, что их просто скрывают.
Полные отчеты статистических организаций должны содержать все эти данные. Они их как правило и содержат. Другое дело, на них стараются не обращать внимание нервного читателя. Но они есть. Ищите их. Не дайте усыпить себя красивой цифрой.
Для самых терпеливых — бонус. Как считаем?
Для самых терпеливых, которые продрались через все сложности, раскроем еще один секрет недобросовестных статистов. Есть старая байка о том, что на вопрос «сколько будет дважды два?» старый бухгалтер отвечал: «а мы продаем или покупаем?».
Математика не лжет, но можно поработать с исходными данными. Например, статистику смертности можно скорректировать, если исключить оттуда пропавших без вести, выделить их в отдельную статью — «ну откуда мы знаем, может у них все хорошо, чего вы разволновались»? А итоговая цифра получится не такой страшной.
Или там, чтобы исключить тех же богатеев, можно сказать «а вот эти товарищи у нас имеют двойное гражданство, мы их для чистоты статистики учитывать не будем». Ну и всякое другое иезуитство. Помните: орган, который ведет подсчеты, как правило, может сам устанавливать правила (простите за каламбур). И этот орган их устанавливает так, как удобно ему. И никакого нарушения закона — он чтит уголовный кодекс. Они не скрывает эти данные, но и не афишируют. Поэтому помимо самих чисел, полезно читать саму легенду — на основании чего они составлялись, что входило и что не входило в исследуемое понятие. Иногда открываешь для себя преудивительнейшие вещи!
Будьте внимательны, не дайте себя обмануть!
В этот самый момент Жрец понял, что ему стоит включить в свой арсенал. Ему оставалось только ответить на один вопрос: Если свойство (пусть будет размер груди) изменяется по нормальному закону, то какое количество женщин, окажется в пределах нормы?
И помните, первый правильно ответивший в чате Scintillam будет щедро вознагражден (10 золотых). А комментарий, понравившийся больше всего, не останется незамеченным. Автор этого комментария получит 10 золотых. Также напоминаем, что три лучших автора, кто напишет в тег chaos-legion в течении этой недели, получат по 50 золотых.
Автор: @nikonov
Контакты
Чат Легиона Хаоса в телеграм: Scintillam
Почтовый ящик для желающих стать авторами: vpchaoslegion@gmail.com
Личка в телеграм: varwar и mamasetta
Тег: chaos-legion