Статистическое исследование результатов российских выборов 2007-2009 гг.

27.10.2009 / № 40 / с. 2 / Сергей Шпилькин / Наука и общество / 118 комментариев

Избирательная система РФ в цифрах

Общее количество зарегистрированных в РФ избирателей составляет около 100 млн человек (величина варьирует от одних выборов к другим, причем не всегда понятным образом).

Общее количество избирательных участков в стране составляет немного менее 100 тыс. Таким образом, в среднем на один избирательный участок приходится примерно 1000 человек. Типичный размер избирательного участка в городах — 1500-2500 избирателей, в сельской местности — несколько сотен. Существуют «закрытые» участки (военные части, больницы, тюрьмы, суда торгового флота), в которых обычно немного избирателей и высокая (до 100%) явка.

Участковые избирательные комиссии (УИК) подчинены территориальным избирательным комиссиям (ТИК); их в РФ примерно 2750. При проведении голосований по мажоритарной системе формируются избирательные округа: в небольших субъектах Федерации — по одному, в крупных — по несколько; на выборах в Госдуму 2007 г. их было 153 в РФ, в том числе 10 в Москве, на выборах в Мосгордуму 2009 г. — 17 (в Москве).

Начиная примерно с 2003 года (с выборов в Государственную Думу 4-го созыва) все результаты выборов с детализацией вплоть до избирательных участков публикуются на сайте ЦИК www.izbirkom.ru.

Введение

Тема статистического анализа результатов выборов вновь стала популярной в связи с недавними выборами в Мосгордуму. Как и после федеральных выборов 2007-2008 года, отношение к самой идее статистического анализа выборов неоднозначное. Некоторые эксперты вообще высказываются в том духе, что неспециалистам в эту тему соваться не стоит. Так, вице-президент Центра политической конъюнктуры Виталий Иванов говорит: «Не надо математикам со своими моделями лезть в политику, анализировать выборы, придумывать какие-то свои версии. Это просто смешно, когда математик рассуждает о выборах. Давайте еще биолога спросим! Или узнаем, что по поводу результатов выборов думает физик-ядерщик! У них, наверное, тоже найдутся идеи, как высчитать, какой на самом деле должен быть результат. Я считаю, всерьез обсуждать здесь нечего!» (www.polit.ru/news/2009/10/19/mathematics.html).

У автора по этому вопросу другое мнение. Пока для результатов выборов не введена какая-либо специальная суверенная арифметика, любой человек имеет право анализировать эти результаты и делать свои выводы. На самом деле статистические подходы к анализу результатов выборов в России используются с начала 1990-х годов, с тех самых пор, как появились свободные выборы. Среди основополагающих работ на эту тему (большая подборка ссылок на различные материалы приведена в (1)) можно отметить исследования А.А. Собянина и В.Г.Суховольского (2). В настоящее время исследованиями на эту тему занимаются М. Мягков, П. Ордешук и Д. Шакин (3), У. Мебейн (4), А. Любарев и А.Бузин (5). После федеральных выборов 2007/2008 года также вышла статья председателя ЦИК В. Чурова с соавторами (6), оппонирующая книге Мягкова, Ордешука и Шакина и публикациям автора настоящей статьи в Livejournal. Хороший обзор результатов недавних выборов с точки зрения теории вероятностей написал А. Шень (7).

В этой статье я хотел бы предложить вниманию читателей результаты своих исследований статистики выборов, начатых после выборов в Государственную Думу РФ в декабре 2007 г. Материалом для исследования являются исключительно данные голосований по избирательным участкам, территориальным комиссиям, округам и субъектам Федерации, полученные с сайта Центризбиркома (см. врезку). По сути каждые выборы представляют собой гигантский эксперимент, дающий огромный (N~10⁶ чисел для федеральных выборов, ~10⁵ чисел для выборов в Москве) полный (без пропусков) структурированный массив данных. При этом количество отсчетов данных N настолько велико, что этот массив можно разбивать на большое количество подкатегорий, и каждая из этих категорий будет по-прежнему содержать статистически значимое количество отсчетов данных. Эта работа не строгое статистическое исследование, а скорее поиск «срезов» данных, позволяющих выявить интересные особенности выборов.

Статистические особенности результатов российских выборов 2007-2009 гг.

Первой и наиболее заметной особенностью выборов последних лет является зависимость результатов голосования от явки.

Для наглядности начнем сразу с конкретных примеров.

Рис. 1. Голосование избирателей за партии на выборах в Государственную Думу РФ 2007 г. Данные по избирательным округам субъектов РФ

Рис. 2. То же самое голосование, данные по территориальным избирательным комиссиям

Рис. 3. Голосование избирателей за кандидатов на выборах Президента РФ 2008 г. Данные по субъектам Федерации

Рис. 4. Голосование избирателей за партии на выборах в Московскую городскую думу 2009 г. Данные по избирательным участкам

На рис. 1-4 приведены диаграммы распределения голосов за различные кандидатуры (партии — на выборах в представительные органы, кандидатов — на президентских выборах) на думских выборах 2007 г., президентских выборах 2008 г. и выборах в Мосгордуму 2009 г. на различных уровнях детализации данных. На всех графиках по оси абсцисс отложена явка в процентах, а по оси ординат — процентная доля избирателей, проголосовавших за данную кандидатуру, от общего числа зарегистрированных избирателей (списочного состава) на избирательных участках с такой явкой (явка округляется вниз до целого числа процентов).

Все четыре диаграммы, несмотря на то, что относятся к разным выборам и имеют разную степень детализации, обладают общими особенностями.

При малых явках имеется более или менее выраженный участок, где результаты разных кандидатов растут пропорционально друг другу (точки ложатся на прямые, проходящие через начало координат). Это означает, что при изменении явки количество голосующих за все кандидатуры растет пропорционально, а процентные доли сторонников разных партий среди пришедших на выборы остаются постоянными.

При дальнейшем росте явки количество голосующих за все кандидатуры, кроме кандидатуры власти, остается постоянным, а все дополнительные голоса, возникающие от прироста явки, отходят к кандидатуре власти.

Наконец, при высоких явках доли голосов за все кандидатуры, кроме кандидатуры власти, начинают падать, а все потерянные ими голоса вкупе с дополнительными голосами от роста явки отходят к кандидатуре власти.

Поведение a) соответствует так называемому «правилу Собянина-Суховольского», предложенному еще в 1990-е годы в качестве критерия честного подсчета голосов на выборах (см. (1)). Оно возникает, например, если вероятность прихода избирателей на участок не зависит от их политических предпочтений.

Поведение b) можно объяснить различными способами. Одно возможное объяснение: избиратели оппозиционных кандидатов демонстрируют на выборах высокую активность и в большинстве случаев приходят на выборы все до одного, а избиратели кандидатуры власти пассивны, и их доля среди пришедших голосовать меняется в широких пределах. Другое объяснение: начиная с некоторой явки, весь прирост явки и все дополнительные голоса, поданные за партию власти, являются результатом вброса, приписок или административного давления (последний вариант в некотором смысле смыкается с первым объяснением — если избиратели кандидатуры власти ходят на выборы из-под административной палки).

Наконец, поведение с) может быть объяснено, например, тем, что избирательные участки с высокой явкой находятся в местностях или местах, где за кандидатуру власти голосуют охотно, а за остальных кандидатов — мало и редко. Другое возможное объяснение — отъем голосов у «прочих» кандидатов и приписки в пользу кандидатуры власти.

Чтобы понять, какие из этих механизмов больше соответствуют действительности, обратимся к другим особенностям статистики голосований.

Распределение избирательных участков по явке

Хотя явка не является официальным отчетным параметром и не фигурирует в итогах выборов, публикуемых избирательными комиссиями, неформально к ней относятся очень внимательно. Это дает порой весьма неожиданные результаты.

На рис. 5 приведено распределение избирательных участков по явке на думских выборах 2007 г. По оси абсцисс отложена явка в процентах, по оси ординат — количество избирательных участков, показавших такую явку (с округлением вниз, до ближайшего целого числа процентов).

Рис. 5. Выборы в Государственную Думу РФ 2007 г. Распределение избирательных участков по явке

Первое, что бросается в глаза, — это необычная форма распределения в целом. Помимо основного максимума в районе 55%, распределение имеет «плечо» со стороны больших явок и резкий пик вблизи 100%. Хотя пик у 100% в основном обусловлен небольшими избирательными участками, общее число избирателей, проголосовавших на участках со 100%-ной явкой, составляет ни много ни мало 1,5 млн человек! Для объяснения столь необычной формы распределения избирательных участков по явке обычно используется тезис, что страна неоднородна и существуют территории, для которых характерны высокая явка и одновременно высокий уровень голосования за кандидатуру власти (например, сельская местность). Такая мысль проводится, например, в статье В. Чурова с соавторами (6); там же фактически признается наличие «регионов особой электоральной культуры» (читай — несвободного волеизъявления), где явка и процент голосования за властную кандидатуру могут доходить до 100%. Насколько справедлива эта аргументация — вопрос спорный; для сравнения приведем распределение избирательных участков по явке на выборах в немаленькой стране Польше (рис. 6). Здесь распределение разительно отличается от российского и гораздо больше соответствует здравому смыслу.

Рис. 6. 2-й тур выборов Президента Польши, 2005 г. Распределение избирательных участков по явке

Однако у распределения на рис. 5 есть и вторая замечательная особенность: пики на значениях явки 60, 70, 75, 80, 85, 90, 95%. Появление таких пиков нелегко объяснить статистическими механизмами, но очень просто — человеческой психологией и стремлением показать «красивые» цифры в отчете. Это означает, что явка на выборах была предметом манипуляций и отчетным параметром, а сами результаты выборов по крайней мере частично сформированы административным воздействием. Более того, манипуляции не возникают сами по себе «снизу» — значит, было как минимум «молчаливое согласие» между теми, кто их непосредственно реализовал (на уровне избирательных участков), и теми, кто их принимал (на уровне территориальных избирательных комиссий и выше).

Рис. 7. Выборы Президента РФ 2008 г. Распределение избирательных участков по явке

На президентских выборах 2008 г. странности распределения избирательных участков по явке только усилились (рис. 7). Начальный пик вообще пропал, а «плечо» превратилось в «плато» с мощными пиками на красивых значениях явки.

Чтобы лучше понять механизм появления подобных распределений, сделаем следующее. Разделим явку на две составляющие: явку избирателей, голосующих за кандидатуру власти, и явку избирателей, голосующих за других кандидатов, и посмотрим на распределения избирательных участков по этим двум показателям. Если вклад обеих составляющих явки в «странности» распределения по полной явке одинаков, мы можем ожидать, что распределения по обеим составляющим будут подобны, если нет — будут различия. На рис. 8 приведены соответствующие графики для президентских выборов 2008 г. (распределение по полной явке то же, что и на рис. 7).

Итак, распределение участков по явке избирателей, проголосовавших за «другие» кандидатуры, похоже на обычное нормальное распределение, за исключением добавочного «плеча» на малых явках, которое естественно связать с вышеупомянутыми «регионами особой электоральной культуры». В то же время распределение по явке избирателей, проголосовавших за Дмитрия Медведева, выглядит в высшей степени нетривиально. Возникает ощущение, что механизмы, управляющие явкой избирателей Дмитрия Медведева, с одной стороны, и избирателей других партий — с другой, радикально различаются. Подобная картина наблюдается и на других выборах. Для примера, на рис. 9 приведены аналогичные распределения для выборов 2009 г. в Мосгордуму. Картина та же: распределение по явке избирателей «остальных» партий похоже на обычное гауссово, а распределение по явке избирателей «Единой России» не похоже вообще ни на что разумное.

Рис. 8. Выборы Президента РФ 2008 г. Распределения избирательных участков по явке избирателей, проголосовавших за Дмитрия Медведева, по явке избирателей, проголосовавших за другие кандидатуры, и по общей явке

Рис. 9. Выборы в Московскую городскую думу 2009 г. Распределения избирательных участков по явке избирателей, проголосовавших за «Единую Россию», по явке избирателей, проголосовавших за другие кандидатуры, и по общей явке

Зависимость статистических характеристик выборов от способа голосования

Предшествующее рассмотрение наводит на мысль, что голосование за кандидатуру власти и голосование за остальные кандидатуры управляются разными механизмами. К счастью, наша избирательная система дает возможность практически «чистой» проверки этого предположения. Эта возможность связана с комплексами автоматической обработки избирательных бюллетеней (КОИБ), которыми оборудуется часть избирательных участков. Очень удобна в этом смысле Москва, где КОИБами на выборах последних лет оснащается около 30% участков. При этом КОИБы распределяются по районам города достаточно широко и бессистемно и каждый раз по-новому, так что можно считать, что контингенты избирателей на участках с КОИБ и без них одинаковые (единственное исключение — «закрытые» участки, где КОИБы не ставятся, но в Москве на таких участках избирателей немного).

Сравним результаты голосований в Москве на участках с КОИБ и без. На рис. 10 приведены распределения избирательных участков Москвы по явке на выборах в Государственную Думу РФ 2007 г.

Рис. 10. Выборы в Государственную Думу РФ 2007 г. Распределение избирательных участков г. Москвы по явке

Распределения схожи между собой и похожи на нормальное (гауссово), хотя для участков без КОИБ есть «хвост» в сторону высоких явок. Однако численные результаты выборов ощутимо различаются:

	Явка	Доля голосов за «Единую Россию»
Участки с КОИБ	52,6%	49,7%
Участки без КОИБ	56,3%	56,1%

Таким образом, наличие КОИБ снижает явку и почему-то долю голосов за «Единую Россию».

На президентских выборах 2008 г. различие между двумя типами участков значительно усилилось.

Рис. 11. Выборы Президента РФ 2008 г. Распределение избирательных участков г. Москвы по явке

Распределения выглядят так, будто вообще относятся к разным территориям. Распределение участков с КОИБ еще сохраняет колоколообразную форму, хотя и обзавелось изрядным «хвостом» к высоким явкам. Участки же без КОИБ распределены по какому-то самобытному закону. При низких явках просматривается сходство с участками без КОИБ, но затем начинаются замечательные пики на «круглых» и «полукруглых» значениях с кульминацией на 80%-ной явке. Результаты голосования тоже различаются существенно:

	Явка	Доля голосов за Д.Медведева
Участки с КОИБ	56,1%	65,9%
Участки без КОИБ	70,1%	73,6%

Рис. 12. Выборы в Московскую городскую думу 2009 г. Распределение избирательных участков Москвы по явке

И в довершение картины — выборы в Мосгордуму в 2009 г. Распределения участков с КОИБ и без опять радикально различаются. Результаты голосования тоже различаются, но не так сильно, как на предыдущих выборах. Такое ощущение, что КОИБы «приручили»:

	Явка	Доля голосов за «Единую Россию»
Участки с КОИБ	33,2%	67,4%
Участки без КОИБ	36,1%	67,5%

Количественная оценка аномалий

Из предыдущих двух глав видно, что с точки зрения статистики выборов избиратели кандидатуры власти и избиратели всех остальных кандидатов на российских выборах последних лет ведут себя совершенно по-разному: приходят на избирательные участки не по закону нормального распределения, а по своим особым законам, имеют особую склонность к голосованию на участках с высокой явкой, по-разному голосуют на участках с автоматическими сканерами бюллетеней и без них.

Вообще говоря, науке известны подобные явления. Самый известный пример — жидкий гелий, ведущий себя при температуре ниже температуры фазового перехода как смесь двух компонент — нормальной и сверхтекучей, которая отличается совершенно экзотическими свойствами: способна протекать через мельчайшие щели, утекать из сосуда по капиллярной пленке и т.п. Избиратели кандидатур власти своими экзотическими привычками во многих отношениях напоминают сверхтекучую компоненту жидкого гелия: например, склонность голосовать при высокой явке является несомненным аналогом бозе-конденсации. Этот вопрос несомненно заслуживает дополнительного изучения, хотя и выходит за рамки данной статьи.

Если же отбросить фантастические гипотезы, самым разумным объяснением такого поведения избирателей, голосующих за кандидатуры власти, представляется то, что часть голосов за такие кандидатуры получена в результате манипуляций — от административного давления вроде «не будете голосовать как надо — отключим газ (не привезем дров, закроем магазин, уволим по статье)» до вбросов и приписок. Тогда возникает вопрос: можно ли, опираясь только на статистические данные, определить, чему равна эта часть голосов (назовем ее аномальной составляющей голосов за кандидатуру власти, в противоположность нормальной, полученной в результате свободного волеизъявления граждан)?

Понятно, что в общем случае задача неразрешима: если статистические данные выборов подделаны полностью и не имеют никакого отношения к реальным результатам голосования, восстановить реальные результаты невозможно. С другой стороны, некоторые признаки (постоянство долей голосов за «прочие» партии при изменении явки на рис. 1-4, подобие распределений участков при низких явках на рис. 11) показывают, что в официальных результатах голосования есть реальная составляющая. Попробуем определить «нормальную» и «аномальную» части голосов за кандидатуры власти, используя эти реальные данные как эталон.

В связи с этим можно высказать несколько наводящих соображений. Мы видели, что голосование за разные партии существенно зависит от явки. Кроме того, очевидно, что простое вбрасывание/приписывание голосов за кандидатуру власти (самый простой вид манипуляции) на конкретном избирательном участке приводит к смещению этого избирательного участка вместе со всеми его данными (и реальными, и фальсифицированными) в сторону более высоких явок. В результате на низких явках должны оставаться участки с нефальсифицированными данными. Далее, можно предполагать, что голоса вбрасываются только за кандидатуру власти, а у остальных кандидатур они остаются неизменными либо, при более злостных манипуляциях, отбираются. Поэтому можно попробовать использовать в качестве эталона данные участков с невысокой явкой, а также данные голосований за «прочие» кандидатуры.

В соответствии с этими соображениями исследуем распределения голосов за разные кандидатуры в зависимости от явки на избирательном участке. На рис. 13 показано такое распределение для думских выборов 2007 г. По оси абсцисс отложена явка в процентах, по оси ординат — суммарное количество голосов за различные кандидатуры на участках с данной явкой (явка округляется вниз, до ближайшего целого, т.е. голоса суммируются по интервалам в 1%). Дополнительно показано распределение суммы голосов за все партии, кроме «Единой России».

Может ли российский электорат состоять из двух частей, настолько отличающихся по поведению, как избиратели кандидатов от власти и прочих кандидатов? Вообще говоря, науке известны подобные явления. Самый известный пример -жидкий гелий, ведущий себя при температуре ниже температуры фазового перехода как смесь двух компонент — нормальной и сверхтекучей, которая отличается совершенно экзотическими свойствами: способна протекать без трения через мельчайшие щели, утекать из сосуда по капиллярной пленке и т.п. Избиратели кандидатур власти своими экзотическими привычками во многих отношениях напоминают сверхтекучую компоненту жидкого гелия — например, склонность голосовать при высокой явке является несомненным аналогом бозе-конденсации. Этот вопрос несомненно заслуживает дополнительного изучения.

Из рис. 13 видно, что распределения по явке голосов за все партии, кроме «Единой России», с хорошей точностью подобны (это подтверждается, если нормировать их на суммарное распределение голосов «прочих» партий: полученные нормированные распределения практически постоянны в широком диапазоне явок), и только распределение голосов за ЕР ведет себя по-другому. При этом при невысоких явках (где-то до 55%) оно также подобно распределению голосов за «прочие» партии и лишь затем начинает отклоняться вверх от общей тенденции. Естественно предположить, что это отклонение и представляет собой «аномальную» часть голосов за ЕР, а «нормальная» часть голосов за ЕР должна быть распределена подобно распределениям голосов за все остальные партии. Сформулируем это предположение математически. Представим распределение голосов за ЕР в виде: (все голоса за ЕР) = С * (голоса за все партии без ЕР) + (аномальная часть голосов за ЕР), где С — подгоночный коэффициент, подбираемый так, чтобы при невысоких явках (где, как говорилось выше, должны оставаться только «честные» участки) аномальная часть была по возможности близка к нулю. Эмпирическим путем выясняется, что такое представление действительно возможно.

Рис. 13. Выборы в Государственную Думу РФ 2007 г. Распределение голосов за партии по явке

Рис. 14. Выборы в Государственную Думу РФ 2007 г. Разделение голосов за «Единую Россию» на «нормальную» и «аномальную» части

Видно, что голоса за ЕР действительно удается разделить так, что «нормальная» часть подобна распределению голосов за другие партии, а «аномальная» часть близка к нулю ниже определенного значения явки (примерно 52%). Выше этой пороговой явки аномальная часть начинает резко и устойчиво расти. Понятно, что выбор подгоночного коэффициента С сопряжен с некоторым произволом; в данном случае он выбран так, чтобы аномальная часть была везде положительна.

Рис. 15. Выборы в Государственную Думу РФ 2007 г. Разделение голосов за КПРФ на «нормальную» и «аномальную» части

Для контроля методики полезно попытаться разделить на «нормальную» и «аномальную» части голоса какой-либо другой партии, которую мы не подозреваем в применении административного ресурса. На рис. 15 приведено такое разделение для голосов за КПРФ на тех же думских выборах 2007 г. Видно, что «аномальная» составляющая голосов, если и присутствует, интегрально значительно меньше, чем у ЕР, что задним числом оправдывает наш подход.

Теперь, имея разделение голосов за «Единую Россию» на «нормальную» и «аномальную» части, можно задаться вопросом: какими были бы результаты думских выборов 2007 года в отсутствие «аномального» вклада в голосование за ЕР? Для показанного выше разделения количество «нормальных» голосов за «Единую Россию» составляет 30,7 млн, «аномальных» — 13,8 млн. Отбросив «аномальные» голоса за ЕР, получим следующие гипотетические результаты выборов:

	Официально	С коррекцией
Явка	63,7%	51,0%
КПРФ	11,6% (57 депутатов)	14,5% (72 депутата)
ЛДПР	8,1% (40 депутатов)	10,1% (51-52 депутата)
СпРос	7,7% (38 депутатов)	9,7% (48-49 депутатов)
ЕР	64,3% (315 депутатов)	55,7% (278 депутатов)

Таким образом, «Единая Россия» при гипотетическом «скорректированном» голосовании по-прежнему имела бы в парламенте большинство, но уже не конституционное. Естественно, скорректированные результаты зависят от выбора подгоночного коэффициента в разделении на «нормальную» и «аномальную» части, однако варьирование этого коэффициента в разумных пределах, при которых «аномальная» часть голосов на рис. 13 остается близкой к нулю при явках ниже порога, изменяет количество мандатов ЕР в Думе не более чем на ±1%, так что оценку можно считать корректной.

Таким же образом можно разделить на «нормальную» и «аномальную» части голо са за Дмитрия Медведева на президентских выборах 2008 г. (рис. 16):

Рис. 16. Выборы Президента РФ 2008 г. Разделение голосов за Д. Медведева на «нормальную» и «аномальную» часть

Такое разделение дает 37,8 млн «нормальных» и 14,8 млн «аномальных» голосов за Медведева; гипотетические скорректированные результаты выборов выглядят следующим образом:

	Официально	С коррекцией
Явка	69,7%	55,9%
Богданов	1,3%	1,6%
Жириновский	9,35%	11,65%
Зюганов	17,7%	22,1%
Медведев	70,28%	62,96%
Недействительные бюллетени	1,36%	1,69%

Наконец, разделим на «нормальную» и «аномальную» части голоса за список «Единой России» на недавних выборах в Мосгордуму:

Рис. 17. Выборы в Мосгордуму 2009 г. Разделение голосов за «Единую Россию» на «нормальную» и «аномальную» части

Скорректированные итоги выборов выглядят следующим образом:

	Официально	С коррекцией
Явка	35,3%	22,0%
ЛДПР	6,13%	9,82%
Патриоты России	1,81%	2,90%
Единая Россия	66,24%	45,95%
КПРФ	13,30%	21,29%
Справедливая Россия	5,33%	8,54%
Яблоко	4,71%	7,54%
Недействительные бюллетени	2,48%	3,97%

Можно отметить, что скорректированные оценки явки и процента голосов за «Единую Россию» лучше согласуются с числами, которые дают различные наблюдатели, чем официальные результаты.

Заключение

При всех недостатках современной российской выборной системы у нее есть несомненное достоинство — открытость данных. Надеюсь, эта статья и изложенные в ней подходы привлекут к анализу выборной статистики общественный интерес.

Автор хотел бы выразить благодарность всем читателям блога podmoskovnik.livejournal.com за многочисленные плодотворные обсуждения, а также А.Е. Любареву и А.Ю. Бузину, посвятившим автора-дилетанта в историю вопроса.

Литература

1. www.vibory.ru/disc-mat.htm

2. Собянин А.А., Суховольский В.Г. Демократия, ограниченная фальсификациями: Выборы и референдумы в России в 1991-1993 гг. М., 1995 www.hrights.ru/text/sob/

3. M. Myagkov, P. Ordeshook, D. Shakin, The Forensics of Election Fraud: Russia and Ukraine, Cambridge University Press, 2008; см. также http://vote.caltech.edu/drupal/files/working_paper/vtp_wp63.pdf

4. Mebane, Walter R., Jr., and Kirill Kalinin 2009. «Comparative Election Fraud Detection». www.umich.edu/~wmebane/apsa09.pdf

5. Бузин А.Ю., Любарев А.Е. Преступление без наказания. Административные технологии федеральных выборов 2007-2008 годов. Группа Компаний «Никколо М», Панорама, 2008

6. Чуров В.Е., Арлазаров В.Л., Соловьев А.В. Итоги выборов. Анализ электоральных предпочтений. www.cikrf.ru/newsite/illuziya/itogi_160908.jsp

7. Шень А. Выборы и статистика: казус «Единой России» (2009). http://alexander.shen.free.fr/elections.pdf Некоторые массивы выборных данных, использованные в статье, размещены на сайте Независимого института выборов, на странице www.vibory.ru/elects/UIK.htm

С автором статьи можно связаться по электронной почте [email protected] или через его блог podmoskovnik.livejournal.com

P.S.

Когда верстался номер, пришло сообщение о том, что на участке № 192 в Хамовниках, где голосовал глава «Яблока» Сергей Митрохин с семьей и где по официальным результатам не было подано ни одного голоса за «Яблоко», в соответствии с решением Хамовнического суда был произведен пересчет бюллетеней. В результате пересчета среди 87 бюллетеней, ранее засчитанных КПРФ, было найдено 16 бюллетеней за «Яблоко», 3 бюллетеня за ЛДПР и 1 за «Патриотов России». Среди 29 бюллетеней за «Справедливую Россию» было найдено 2 недействительных. Среди 904 бюллетеня за «Единую Россию» неправильно подсчитанных обнаружено не было.

Таким образом, среди 116 бюллетеней, поданных за оппозиционные партии, оказалось 22 неверно учтенных, а среди 904 бюллетеней за ЕР — ни одного. Нетрудно подсчитать, что вероятность такого события, в предположении, что при изначальном подсчете все бюллетени учитывались одинаково тщательно и пересчет выполнен точно, составляет (116!*998!)/(94!*1020!), т.е. примерно 2,5 на 10 в минус 22-й степени. Российская избирательная система еще раз подтвердила, что для нее нет непреодолимых препятствий в теории вероятностей.

Сергей Шпилькин, независимый исследователь

См. также Выборы-2011

118 комментариев

Антон:

30.05.2011 в 21:12

Довольно интересно, но научный подход требует провести сравнение с заведомо честными выборами в других государствах. Одной картинки про Польшу явно недостаточно.

Ответить
1. Виктория:
  
  16.06.2011 в 13:26
  
  Хорошая логика. Если станет известно, что у соседей грязь и беспорядок, Вы перестанете убираться в своем доме?
  
  Ответить
  1. Максим:
    
    23.11.2011 в 17:35
    
    Ну если я правильно понимаю Антона, речь не о том, что грязь и беспорядок у них в доме, а в том что в первоначальных статистических данных может быть аномалия, которая может быть обнаружена только сравнением статистики в других странах, и которую невозможно обнаружить в рамках одной системы.
    
    Ответить
2. Андрей:
  
  01.09.2011 в 17:25
  
  Интересно, а почему примера Польши с нормальными т.е. ПРИРОДНЫМИ гаусовскими распределениями голосов Вам ЯВНО мало?
  
  Ответить
  1. Антон:
    
    04.09.2011 в 21:26
    
    Нужно провести аналогичное исследование по другим странам, с подробным рассмотрением различных партий и кандидатов. Мало одной страны, мало одного графика. Почему? Потому что пример с Польшей вполне мог быть не подтверждением правила, а нарочно подобранным исключением.
    Так, например, критики указывают, что рост явки происходит в основном за счёт избирателей партии власти, так как они менее активны и их сложнее заставить прийти на выборы. Отсюда и появление «аномальной» части распределения. Рассмотрение других стран позволило бы точно показать, как оно на самом деле.
    Критики указывают на пренебрежение некими законами социологии, влияющими на распределения. Если бы эти законы действительно действовали бы, они действовали бы везде. И рассмотрение других стран это показало бы или опровергло.
    
    Ответить
    1. Владимир:
      
      29.11.2011 в 16:13
      
      В Польше распределения гауссовы т.е. польским оленеводам не привозят урны для голосования на пастбища. Может и армия у них поменьше. И польские солдаты наверное в городе голосуют, как и все остальные жители. А какая явка у нас на избирательном участке в вч? Берусь предположить, что что-то около 100%. А за кого будут голосовать военные? Неужели против правительства?! Трудно себе представить такое правительство у власти.
      
      Ответить
      1. Сергей Шпилькин:
        
        02.12.2011 в 10:59
        
        Кстати, как раз военные (небольшие участки со 100%-ной явкой) голосуют далеко не на 100% за ЕР, там очень много голосов за КПРФ и ЛДПР. 100% явка и 100% за ЕР — это гражданские участки где-либо в Башкирии и Дагестане.
        
        Ответить
    2. Александр:
      
      02.12.2011 в 10:40
      
      Читал недавно статьи про статистику на выборах в Канаде и США, там тоже нормальные гауссовы распределения. Но это ладно более интересно то, что на выборах в 90-х в России тоже статистические данные вполне логичны. То есть такие графики как показаны не согласуются не только со здравой логикой, Европой и Америкой, но и с самой же Россией ещё 15 лет назад…
      
      Ответить
      1. gvk:
        
        16.12.2011 в 22:00
        
        Очень интересно, где Вы взяли полные данные о выборах в России в 90-91 гг?
        Или где Вы видели гауссовы кривые об этих выборах, подобные тем что привел ув. Шпилькин.
        Очень интересно!!!
        
        Ответить
    3. Сергей Шпилькин:
      
      02.12.2011 в 11:03
      
      http://esquire.ru/elections — еще несколько зарубежных графиков. Польша была взята потому, что у них данные выложены одним массивом, по наводке Чурова, похвалившего сайт польского ЦИК. Если знаете еще страны, где есть данные по участкам одним массивом — буду благодарен за ссылку.
      
      Ответить
    4. Сергей Шпилькин:
      
      02.12.2011 в 11:12
      
      И вот еще дали ссылку на хорошую визуализацию по Украине: http://texty.org.ua/mod/datavis/apps/elections2010/
      
      Ответить
      1. Владимир:
        
        03.12.2011 в 17:36
        
        Пользуясь этой ссылкой легко понять откуда могут появиться не гауссовские распределения: постройте, например, суммарный график для Киева и Тернопольской области. Исходные распределения похожи на гауссовские. Сумма не гаусс, точно. Это совсем не означает что в суммарном распределении обнаружены фальсификации. Просто активность избирателей разная, а предпочтения у них могут быть тоже разные. Так и в Москве, отличия от нормальных распределений могут говорить скорее о социальном расслоении жителей , а не о фальсификациях. Почти очевидно, что жители Кутузовского проспекта и , скажем, Бирюлева голосуют с разной активностью и за разные партии. Возвращаясь к Польше — национальность одна, страна маленькая, разделения восток-запад или юг-север нет, и там очевидно большие избирательные участки и все особенности просто усредняются.
        
        Ответить
        
        Anton:
        
        04.12.2011 в 12:05
        
        «постройте, например, суммарный график для Киева и Тернопольской области. Исходные распределения похожи на гауссовские. Сумма не гаусс, точно»
        
        Сам-то смотрел? Нормальный Гаусс.
        
        Ответить
        
        Владимир:
        
        06.12.2011 в 11:25
        
        Если у Вас трудности с украинским языком, то на самом деле алгоритм очень простой: выбираете мышкой район из списка слева и жмете кнопку «Показати». Для построения суммы выберите несколько строк слева. «Усi» – это усе. Сброс выделения– кнопкой «Жодного». Вот и все.
        
        Ответить
        
        Ден:
        
        07.12.2011 в 0:01
        
        Ну что за ересь «Сумма не Гаусс»! Из того, что прощелкал, везде, кроме ЗВО, чудное нормальное, Гауссовское распределение явки, в том числе и суммарное. Если это не нормальное распределение, то я уж и не знаю что Вам нужно…
        
        Ответить
        
        smb:
        
        09.12.2011 в 3:20
        
        Владимир хочет сказать, что если посмотреть явку в сумме по Киеву и Тернополю, то можно увидеть нечто подобное нашей явке. Однако, для получения таких графиков, должны существовать какие-то резко различные группы избирателей (в данном случае Киевляне были сильно менее активны, чем жители Тернополя), что например географической отдаленностью и как следствие разными политическими взглядами. Если же посмотреть суммарную явку по всей Украине, то она вполне Гауссова, т.к. резко различных групп избирателей нет, а есть плавные изменения в их активности на выборах в зависимости от местоположения в стране. Соответственно, и по России такого тоже быть не должно, однако оно наблюдается.
        
        Ответить
        
        Владимир:
        
        09.12.2011 в 18:42
        
        smb, а может такие группы есть. Они уже обнаружены Шпилькиным и его коллегами. Посмотрите их новые рисунки http://oude-rus.livejournal.com/544601.html и http://oude-rus.livejournal.com/544227.html .Видны три группы участков: в «городах» участки около 2000чел. и ЕР имеет 30% в среднем. На «селе» есть еще огромное число участков с менее 500 избирателями, где у ЕР 50-60%. И есть еще 3-я группа малых участков, где у ЕР 90-100% (села на Кавказе?). И как видно из рисунков имеется корреляция результатов голосования за ЕР с размером УИК, и корреляция размера УИК с явкой. Именно многочисленные малые участки расположены в «аномальной» части распределения по явке. Вполне можно интерпретировать полученные ими распределения как различие «город» — «село». Сравнивать при этом Россию с Польшей или Швецией просто смешно. Есть еще 3-я группа -Кавказ. А можно игнорировать все группы и пытаться объяснять все особенности суммарных распределений фальсификациями, как то и делает автор статьи. Более того, общее число избирателей на этих малых участках не велико. Если бы автор строил распределение УИК по явке с весом, пропорциональным числу избирателей, «аномальная» часть заметно уменьшилась бы. Почему он так не делает? Труднее будет демонстрировать «нечестность » выборов?
        
        Ответить
        
        Роман:
        
        12.12.2011 в 5:36
        
        Так, на всякий случай — в числе прочих, автор приводит анализ распределений, сделанных на основе статистических данных по выборам в МОСКВЕ. Город/село?
3. Андрей:
  
  08.12.2011 в 17:36
  
  Вот тут графики по Мексике, Болгарии и Швеции, кроме Польши
  http://esquire.ru/elections
  
  Ответить
Dmitry Paskal:

19.06.2011 в 1:27

Прочёл с интересом, спасибо!

Ответить
Андрей:

01.09.2011 в 17:23

Отлтчная статья!!! Большое спасибо. Сам увлекаюсь подобными исследованиямии статистическими зависимостями. Живу в Украине, поэтому конечно интересуют больше «свои» выборы. Думаю при ближайших выборах воспользуюсь Вашим примером и постатаюсь провести подобное стат. исследование.

Очень интересно было бы провести такое исследование и в отношении последних украинских выборов в Президенты 2010 года, когда Ющенко с позором провалился и во 2-м туре Янукович победил Тимошенко. У нас также все данные открыты т.ч. статистику получить легко.

Заранее предвижу трудность (но может быть в ней и интерес?!) — разделение Украины по полит. предпочтениям ещё и в географической плоскости. И поэтому имело место «аномальное голосование» за Януковича на востоке и такое же аномальное за Тимошенко на западе. Вероятно из-за этого вброшенные голоса вычислить будет трудно. Однако надо сказать, что на западе значительно больше мелких (по численности) округов. Плюс территориальное расположение округа известно. Вероятно это поможет провести дисперсию.

Возможно и автору самому захочется разобраться в украинских «аномалиях», всё-таки наша политико-географическая 2-х-полюсность значительно интереснее Российского ЕдРёности.

Ответить
1. Сергей Шпилькин:
  
  07.11.2011 в 3:50
  
  Я тут не специалист. Вот несколько ссылок по Украине:
  http://texty.org.ua/pg/article/devrand/read/14798/Matematyka_javky_blyzko_400_tysach_golosiv_u
  http://vasylchenko.ucoz.ru/photo/
  http://trim-c.livejournal.com/20913.html
  
  Ответить
  1. Андрей:
    
    01.12.2011 в 16:49
    
    Большое спасибо за ссылки. Чем ближе выборы, ваши и наши, тем актуальнее такие исследования.
    
    Авторы одной из этих статей сделали просто прекрасный и наглядный сайт, на котором графики строятться онлаин. Хорошо бы чтобы и у Вас такое было :)(по наступающим выборам)
    http://texty.org.ua/mod/datavis/apps/elections2010/
    
    Можно воочию посмотреть работу админресурса в «вотчинных» областях каждого из кандидатов (Тимошенко — на западе, Януковича — на востоке), тогда как в Харьковской области (и других центральных обл-х) получился вполне «честный» гауссиан!!!
    
    Кстати, появился новый метод статистического анализа выборов — метод Шпилькина: «Для того, щоб оіцнити кількість “нерегулярних” голосів, можна використати т.з. метод Шпилькіна.»
    
    Поздравляю Вас!!! :)))
    
    Ответить
    1. Сергей Шпилькин:
      
      01.12.2011 в 17:22
      
      Спасибо за ссылку!
      
      Ответить
Андрей:

01.09.2011 в 18:23

Замечание — графики в таком качестве, что ничего не прочитаешь. В pdf также. На сайте хорошо бы вешать gif — и четко и малого размера, а в pdf графики должны быть векторными!

Ответить
Владимир:

04.09.2011 в 20:19

Большое спасибо автору. Правда и без статистических анализов давно понятно, что выборы у нас нечестные. Удивительно, что информация для статистики доступна. Скоро закроют, скорее всего. Расширить исследования на другие государства, безусловно полезно. Хорошо, если автор найдет на это время и возможности. Жаль, что не каждый читатель поймет публикацию. Хорошо бы для неискушенных в статистических анализах давать понятные и популярные выводы. Еще раз спасибо.

Ответить
Евгений:

22.09.2011 в 0:14

Даже после разделения голосов ЕдРа на нормальное и ненормальные составляющие, мне кажется, остались завышенные числа проголосовавших за партию власти. Сумма нормальных распределений будет тоже нормально распределённым. Поэтому возникает вопрос: могут ли какие-либо способы подтасовки результатов тоже иметь нормальное распределение? Ну, например, вброс совершался на избирательных участках случайным образом, без централизованных одинаковых указаний. И второй вопрос: можно ли такие подтасовки отделить с помощью статистического анализа?

Ответить
1. Сергей:
  
  09.12.2011 в 19:29
  
  дадада, особенно с разным матожиданием которые :)
  
  Ответить
Евгений 2:

22.09.2011 в 19:33

А где взять исходные данные? Тут http://www.izbirkom.ru я их почему-то не нашел…%(
Хотелось бы пересчитать. А то тут цифирок и графиков много, вдруг где случайно ошиблись…

Ответить
1. Zakas:
  
  13.10.2011 в 19:34
  
  Выбираете период, выбираете тип выборов и вперед
  
  Ответить
2. Сергей Шпилькин:
  
  07.11.2011 в 3:33
  
  Можно взять готовые массивы данных на stat.golos.org
  
  Ответить
Евгений:

13.10.2011 в 13:57

Уберите дурацкую букцвицу из таблиц! Пляшущие цифры очень трудно распознаются.

Ответить
1. Максим Борисов:
  
  07.11.2011 в 1:17
  
  Буквицы убраны, графики заменены на картинки лучшего разрешения. По ссылкам на них открываются графики с оригинальным разрешением.
  
  Обсуждения есть еще на
  http://www.echo.msk.ru/blog/echomsk/631692-echo/
  и в др. местах
  
  Ответить
Anonymous:

28.11.2011 в 23:13

С какими весами нужно сложить зелёный и оранжевый графики на http://trvscience.ru/uploads/Fig_8_0000.jpg, чтобы получить синий?

Ответить
1. Алексей:
  
  29.11.2011 в 2:19
  
  Сперва научись графики строить, а потом выходи в люди позориться.
  Да, с голосами на выборах лажа, но это же не повод рисовать на картинках чушь и называть это распределением.
  
  Ответить
  1. NickName:
    
    30.11.2011 в 1:15
    
    А что вы называете сложением?
    
    Информации в жёлтом и зеленом графике не достаточно чтоб получить синий.
    
    Пусть у вас есть три участка и две партии A и Б, имеется два участка и на каждом 4 избирателя.
    
    Рассмотрим два вариант голосования
    1) на первом участке два человека проголосовала за партию A и два человека за партию Б, на втором за обе партии по 1 голосу двое других не явилось.
    
    2) на первом участке двое за партию A, один за партию Б. На втором участке один за A и два за Б.
    
    Желтый и зелёный график будут одинаковыми на 1 участке явка за партию А — 50%
    на 1 участке явка за партию A — 25%. То же самое про партию Б.
    
    Но синий график будет разный.
    
    В первом случае 1 участок явка — 100%, 1 участок — 50%.
    
    Во втором случае 2 участка с явкой 75%.
    
    Ответить
Loss-less Data:

30.11.2011 в 0:02

Эта статья попала в последний «Эскваер», да? В любом случае — мои поздравления, хороший материал, чистый и простой взгляд на вещи :) Я думаю известный мсье из ЦИКа вас уже недолюбливает (представляю как он потрясал-бы бородой после ознакомления со статьей) . Скоро владение калькулятором будет вызывать подозрение, установка R на компьютер — преступлением, а министерство правды либо закроет нафиг росстат совсем, любо будут чесать репу как-же исковеркать данные так, чтоб эти любители ничего оттуда не смоли вытянуть.

Ответить

Добавить комментарий Отменить ответ

Оценить:

Статистическое исследование результатов российских выборов 2007-2009 гг.

118 комментариев

Добавить комментарий Отменить ответ

ТрВ № 5 (349) за 2022 г.: 10 фактов о Юрии Лотмане

10 фактов о Юрии Лотмане. К 100-летию со дня рождения

Работа помогает от уныния и стресса

Торова победа

Как Россия потеряла форум математики

Фиаско Роскосмоса

Литеры Z и V на страницах истории

Как рушится международное научное сотрудничество

При чем тут климат

Евгений Кунин: «Заявления российских госСМИ о биооружии на Украине не просто бред, а заведомая ложь»

Вся наша жизнь — задачи по оптимизации

Время вспахано плугом