Выборы и немного математики. Часть 4. Нормальность распределения
По теории вероятности независимые наблюдаемые величины должны подчиняться нормальному распределению (оно ещё называется распределение Гаусса), этот график ведёт себя примерно вот так:
Например, тесты на коэффициент интеллекта IQ показывали такое распределение респондентов:
Средний рост людей:
Аналогично ведут себе показатели при голосованиях большого количества жителей при честном подсчёте:
Получаются почти идеальные кривые Гаусса.
Попробуем посмотреть, как это происходило в России. Имея данные голосовавших на президентских выборах 18 марта в Костроме и Кемерове, я решил проверить, что говорит статистика о честности непосредственно подсчёта голосов (спасибо @netfriend за подсказки с Excel).
Я сделал распределение процента за двух кандидатов и явки для города Кемерова (230 участков), на выборах Президента России, смотрите что получилось:
Перед нами та самая пресловутая "пила Чурова", когда данные рисуются частью комиссий как угодно. Множественные пики, отсутствие симметрии... Особенно наглядно это видно на графике "явка". Никакого пика и намёка на нормальное распределение голосов и явки.
А вот как выглядит сравнительно честный подсчёт в Костроме:
Почти идеальное, близкое к нормальному распределение.
Грудинин, тоже всё почти хорошо, есть пара участков справа, на которых я подозревал фальсификацию, о них я писал в предыдущих материалах.
А вот с явкой всё не так хорошо, хотя нормальное распределение прослеживается (за исключением аномальных точек, о которых я уже говорил). Но вот два пика с седловиной между ними никак не укладываются в обычный порядок вещей. У нас нет двух разных районов с различным поведением жителей. Возможно, такое расслоение может быть по участкам спальных районов/районов старинной застройки. Компактно расположенные многоэтажки дают много избирателей в близкое к ним помещение для голосования, частный сектор, сталинки/бараки дают второй пик с меньшим процентом явки. Но это только моё предположение, возможно тут какие-то другие причины и небольшие манипуляции...
Слишком ломанная кривая вероятна из-за не такого большого количества участков (111, а не 230 как в Кемерово), и нужно было нормировать не по полпроцента явки, а хотя бы по проценту. Но даже в этом случае двух пиков всё равно не избежать и это вызывает вопросы.
Уже после того как была написана эта статья, я наткнулся на выступление Сергея "Киндерсюрприз" Кириенко, который сейчас отвечает за внутреннюю политику в Администрации Президента.
Он назвал лженаучным попытки с помощью нормального распределения проверять честность выборов, но одновременно рассказал, что в Москве результаты последних выборов соответствовали почти идеальной кривой Гаусса.Таким образом он хотел подчеркнуть, что в этом регионе голоса считали честно, а там где нормального распределения нет - якобы его и не должно быть. Сергей Владиленович к сожалению не рассказал, почему это лженаучно, так что пока что я буду верить учёным и специалистам по статистике, а не кремлёвским чиновникам.
Источники:
https://en.wikipedia.org/wiki/Gaussian_function
http://www.kostroma.izbirkom.ru/
http://www.kemerovo.izbirkom.ru/
https://www.rbc.ru/politics/28/03/2018/5abba7789a7947535df8ddd2?utm_source=fb_rbc#0_5___1355_0
https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%8D%D1%84%D1%84%D0%B8%D1%86%D0%B8%D0%B5%D0%BD%D1%82_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82%D0%B0
http://gardenweb.ru/antropometricheskie-dannye
http://euromaidanpress.com/2016/09/21/statistical-method-measures-voting-fraud-of-russias-pro-putin-party/