PDA

Просмотр полной версии : Как правильно подвести итоги голосования



элтека
28.12.2011, 10:14
Как правильно подвести итоги голосования


Светлана Локоткова

Прямой вброс бюллетеней — устаревший и не очень эффективный способ коррекции результатов выборов: его легко заметить, а затем выявить при проверке контрольных соотношений. Основным методом уточнения итогов голосования сейчас становится переписывание протоколов избирательных комиссий — это проще, быстрее и эффективней. Но, к сожалению, "корректоры" не учитывают элементарных математических законов, которые сводят всю их работу на нет. Партия, обеспечивающая стабильность страны и спокойствие общества, получает необходимые для этого голоса. Но само общество подвергается ненужной нервотрепке: люди переживают, что их обманули, что держат за "стадо баранов" и т.д.


Мы постараемся восполнить этот пробел, тем более, что правила корректировки результатов голосования просты и понятны любому обладателю хотя бы 60 баллов ЕГЭ по математике.


Сначала разберем типичные примеры некорректной коррекции. Для наглядности возьмем последние выборы в Думу одного крупного российского города (с населением больше 10 млн человек), прошедшие.


Ситуация там сложилась такая. На более чем 10% участков явка составила 90%, на 5% — и вовсе 100%. А общий показатель явки в городе — около 60%. Не слишком правдоподобно выглядели и внутридневные данные. На 10 утра средняя явка составила 5,6%, при этом на некоторых участках на этот час были зафиксированы данные о 13-20% проголосовавших. С вечерними часами тоже получилось не все статистически — и чисто по-человечески — гладко. На 85 участках явка за последний час выросла более чем на четверть. На одном из участков даже так: на 19.00 явка 55%, а на 20.00 — внезапно все 100%.


Были подозрительные отклонения и в другую сторону. В одном из округов на всех открытых участках к 17.00 явка с точностью до десятых долей оказалась равной 57%.


И уж совсем поразительная ситуация сложилась на одном из участков, находившемся по объективным причинам под пристальным вниманием наблюдателей и прицелом телекамер: с 17 до 19 часов явка там снизилась с 41% до 39%. Это от волнения, конечно. Но впредь таких промахов лучше не допускать.


От простого — к сложному. Отложим по оси абсцисс явку в процентах, а по оси ординат — процентную долю сторонников партий от общего списочного состава. Если придут все 100% избирателей, получим точку с абсциссой 100% и ординатой — итоговым результатом партии. Пришли все избиратели — получи, партия, свои, допустим, 60% от списочного состава. Пришла половина избирателей — принесла своей партии 30% голосов от списочного состава. В идеале зависимость итога голосования от явки в такой системе координат описывается наклонной прямой, проходящей через начало координат и точку с абсциссой 100% и ординатой, равной итоговому значению партии. И это для любой партии. На практике в РФ получается иная картину. При росте явки увеличивается лишь доля голосов, поданных за одну из партий. Математически подкованных граждан такая картина очень раздражает: они хотят, чтобы, согласно тезису Собянина-Суховольского, предложенному еще в 1990-е годы как критерий точного подсчета голосов, вероятность прихода избирателей на участок не зависела от политических предпочтений этих самых избирателей.

http://s49.radikal.ru/i126/1112/17/37f854c139a4.jpg (http://www.radikal.ru)
И еще один момент. Если по оси абсцисс отложить явку в процентах, а по оси ординат — количество избирательных участков, показавших такую явку, то — с учетом массовости эксперимента — математики ожидают увидеть нечто похожее на так называемое "гауссово", или "нормальное" распределение. И они очень нервничают, когда его не обнаруживают. "Король математики" Иоганн Карл Фридрих Гаусс, хоть и не первый открыл этот распространенный в природе закон, но настолько тщательно его исследовал — еще в конце XVIII века, — что график распределения с тех пор часто называют гауссианой. Кстати, Гаусс любил говорить, что математика — царица наук, а теория чисел — царица математики.


Так вот, выборы в Думу того самого крупного российского города, мягко говоря, разочаровали фанатов Гаусса. На графике 2 показаны распределения избирательных участков по явке избирателей, проголосовавших за одну из партий, по явке избирателей, проголосовавших за другие партии, и по общей явке. Особенно умиляет одинокий пик у той самой партии возле стопроцентной явки.


Для объяснения столь необычной формы распределения избирательных участков по явке власти обычно используют тезис, что страна неоднородна и есть территории, где высоки одновременно и явка и уровень голосования за одну кандидатуру власти (например, сельская местность). Тем не менее, на выборах в немаленькой Польше, где тоже есть сельская местность (см. график ниже), картина разительно отличается от российской и гораздо больше соответствует как здравому смыслу, так и Гауссу.
http://s57.radikal.ru/i158/1112/ac/c70095dae060.jpg (http://www.radikal.ru)
Подведем итог претензий математиков: они чересчур раздражаются, когда избиратели одной партии ведут себя на выборах совершенно иначе, чем поклонники всех остальных партий — как вместе взятых, так и по отдельности. Им не нравится, что первые почему-то приходят на избирательные участки не по закону нормального распределения, а по своим особым законам, имеют особую склонность к голосованию на участках с высокой явкой, а также в первые и последние часы голосования.


Чтобы не допустить излишней напряженности, которую математики сразу после выборов начнут нагнетать в обществе своими выкладками, сформулируем несколько обещанных правил для "корректоров".


Первое. Закон больших чисел. Он утверждает, что эмпирическое среднее достаточно большой конечной выборки из фиксированного распределения близко к теоретическому среднему этого распределения. Это означает, что конечный итог голосования на каждом участке не должен чересчур сильно отличаться от данных предварительных опросов населения этого участка, а также от данных "экзит-поллов". Допустимая ошибка на значениях 35-40% — около 0,5%, на 9-10% — около 0,3%, на значениях 3,5-5% — около 0,2%. При таких отклонениях достоверность окончательных итогов в сравнении с предварительными данными опросов уложится в красивые 99,9% и не вызовет претензий у чересчур внимательных наблюдателей-статистиков.


Второе. Центральная предельная теорема. На самом деле это целый класс теорем, но "корректорам" их варианты ни к чему. Достаточно лишь понимать общее для этих законов правило: сумма достаточно большого количества слабо зависимых случайных величин, имеющих примерно одинаковые масштабы, имеет распределение, близкое к нормальному (оно же — распределение Гаусса, см. график 3).


Третье. Ошибка игрока (она же — ложный вывод Монте-Карло). Судя по всему, "корректоры" об этой теории хорошо осведомлены, однако неверно ее трактуют. Она заключается в ошибочном понимании случайности событий, когда человек не осознает, что вероятность желаемого исхода не зависит от предыдущих исходов случайного события. Например, в случае с подбрасыванием монеты может выпасть 10 "решек" подряд. Некоторые почему-то считают, что при следующем броске вероятность выпадания орла будет больше. Но такой вывод ошибочен. Вероятность выпадения следующего орла или решки по-прежнему 1/2. Поэтому "корректоры" смело добавляют в протоколы по 10 подряд сторонников одной партии. Нужно, однако, разграничивать понятия: вероятность выпадания "орла" или "решки" в каждом конкретном случае и вероятность выпадания "решки" десять раз подряд. Последняя будет равна 1/1024=0,00098.


Похожую ошибку "корректоры" совершают, подравнивая результаты голосования по участкам. Слишком похожие цифры на разных участках — вплоть до десятых — вызывают вполне обоснованные математические подозрения, поскольку вероятность такого события исчезающе мала. Если разброс будет составлять хотя бы 5-7%, особо дотошных статистиков это может несколько успокоить.


Четвертое. Свойства натурального ряда чисел, частный случай аддитивности. Сумма двух любых натуральных чисел больше каждого из этих чисел. Это означает, что количество избирателей, проголосовавших за ту или иную партию, с течением времени не может уменьшаться в абсолютном выражении (в относительном — может).


Пятое. Свойства процентов. Нужно запомнить хотя бы одно — правило 100%. Доля голосов, отданных за ту или иную партию (как и доля избирателей, принявших участие в голосовании), не может превышать 100%. Даже если та или иная партия очень нравится главе администрации района. И даже если только она объективно способна обеспечить стабильное развитие страны — все равно за нее не могут отдать свои голоса 101% или даже 100, 01% избирателей. Закон математики суров, но это закон.


И напоследок. Практически все способы коррекции имеют определенные пределы, которые сверху ограничены реальной явкой избирателей: чем она больше, тем сложнее на выходе продемонстрировать правильные итоговые результаты, поскольку с повышением явки снижается влияние коррекции. Наиболее комфортный для "корректоров" уровень реальной активности избирателей — порядка 10%: и выборы вроде бы состоялись, и возможности для корректировки с соблюдением всех законов математики почти безграничны.
Подробнее: http://www.kommersant.ru/doc/1828511

элтека
28.12.2011, 15:34
Так или почти так, как здесь представлено, прошло голосование 4 декабря. Графики показывают оценку явку избирателей по времени в каждом часовом поясе и по стране в целом.


http://c2.kommersant.ru/ISSUES.PHOTO/NAUKA/2011/009/map_free.jpg (http://c2.kommersant.ru/ISSUES.PHOTO/NAUKA/2011/009/map_max.jpg)
Увеличить (http://c2.kommersant.ru/ISSUES.PHOTO/NAUKA/2011/009/map_max.jpg)


Кривая явки в каждом часовом поясе предполагалась гауссовой с обрезанными в моменты начала и конца голосования хвостами (и учтенным дефектом нормировки). Параметры распределения, положенные неизменными по стране, подогнаны под детальные данные по явке на выборах в Мосгордуму 2005 года (полуширина 3,20 часа, положение максимума 14,01 часа местного времени, точность согласования с данными Москвы-2005 не ниже 3% по среднеквадратичному отклонению).


Далее региональные кривые объединены с учетом числа избирателей в часовых поясах и сдвига времени (площадь под каждой региональной кривой — доля избирателей часового пояса в их общем числе, площадь под суммарной кривой — единица)


Из графика хорошо видно, что и ход, и итоги голосования практически полностью определяются в московском часовом поясе.
Подробнее: http://www.kommersant.ru/doc/1828521