Вполне возможно, что число российских граждан, слышавших, что есть такое замечательное распределение Гаусса, после выборов возросло в несколько раз. Интересно, что научный подход против фальсификации выборов взяло на вооружение гражданское общество в виде отдельных ученых-энтузиастов и множества образованных обитателей Сети. Научный истэблишмент пока молчит. Он молчит уже давно и надежно.
Массовое использование научных понятий чревато вульгаризацией и излишней категоричностью. Поэтому полезно привести ряд уточнений и оговорок.
Строго говоря, распределение избирательных участков по явке не обязано быть гауссовским даже в случае честных выборов. Чистый гаусс возникает, когда явку определяет много независимых факторов, среди которых нет сильно доминирующего над всеми остальными (работает центральная предельная теорема). Распределение по явке без фальсификаций также может иметь «толстый хвост» или даже быть двугорбым, если в стане существует некая демографическая патология, поляризация типа двухкомпонентного населения — одни ходят на выборы не очень охотно, другие — в подавляющем большинстве, вторые любят власть, первые — нет. Первые доминируют на одном подмножестве избирательных участков, вторые — на другом.
Может ли такая демографическая поляризация исказить распределение Гаусса настолько, что получится «распределение В. Чурова» (см. статью С. Шпилькина в этом номере, стр.2-4)? Именно такой гипотезой некоторые аналитики в соавторстве с Чуровым [1] пытались объяснить аномалии, подмеченные Сергеем Шпилькиным для результатов предыдущих выборов [2].
Патология в распределении Чурова по явке настолько велика, и корреляция между явкой и результатами «Единой России» столь чудовищна, что демографическая гипотеза должна легко подтверждаться анализом тех же данных: разделим участки на те, что в основном в квазигауссовском пике, и те, что в чуровском хвосте, — и обязательно увидим демографию в их территориальном распределении! Кое-что действительно проглядывает: феодальный Кавказ действительно на 100 %, еще Чукотка… Село больше голосует за ЕР. Но доминирует хаос: и в городах, и в весях картина одна и та же — везде распределение Чурова, лишь меняется соотношение между пиком и хвостом. В пределах Москвы — то же самое, в пределах одного спального района Москвы — то же самое: на одном участке малая явка и малый результат у «Единой России», на соседнем — высокая явка и высокий процент у «Единой России». Это что за демография такая?
Все становится на свои места, если мы рассортируем участки не по географии, а по обстоятельствам работы участковых комиссий. В своей статье Сергей Шпилькин показывает, что наличие автоматических сканеров бюллетеней (КОИБ) подавляет чуровский хвост в несколько раз. То есть «дисциплинированная» провластная демографическая компонента не селится в районах, где участки оборудованы КОИБами. Еще сильней эта компонента избегает участков, на которых были независимые наблюдатели (см. данные «Гражданина Наблюдателя» http://nabludatel.org ).
Пожалуй, хватит измываться над «демографической гипотезой». Гипотеза о массовых фальсификациях без всяких натяжек объясняет данные и к тому же подкрепляется массой независимых свидетельств. Так что, несмотря на уточнения и оговорки, Гаусс все равно рулит в первом приближении. Учет демографического вклада в корреляцию между явкой и результатом ЕР, будучи выявлен, может подправить оценки Шпилькина, но никак не отменить факта массовых фальсификаций, принципиально меняющих исход выборов. Без них «Единой России» было бы далеко до простого большинства.
Хорошо, что оружием народного авангарда, поднявшегося против власти жуликов и воров, становится статистический анализ, а не булыжник. Всё-таки времена меняются к лучшему. Однако этот самый статистический анализ еще не доведен до логического конца, и не проведен достаточный ликбез.
Предстоит еще много работы, чтобы картина стала абсолютно ясной, чтобы вклад демографии был выделен отдельно, вклад фальсификаций — отдельно. Нужна общая база данных по выборам со свидетельствами наблюдателей от разных общественных объединений и партий, со списками нарушений и обращений в суд, с результатами статистического анализа разных экспертов. Это нужно не только для выведения власти на чистую воду. Пробуждающийся интерес людей к рациональным аргументам, в частности к статистике, уведет нас подальше от средневековья. Глядишь, и науку будут чуть больше уважать.
Ваше слово, товарищ Гаусс!
И с наступающим Новым годом!
Борис Штерн
1. Чуров В.Е., Арлазаров В.Л., Соловьев А В. «Итоги выборов. Анализ электоральных предпочтений» www.isa.ru/proceedings/images/documents/2008-38/6-22.pdf
2. Шпилькин С. Математика выборов. ТрВ-Наука, №21(40N), 27 октября 2009 г. http://trv-science.ru/2009/10/27/pdf40
Пушка Гаусса — орудие пролетариата!
Будучи сам учёным, я удивляюсь ангажированности и непрофессиональности рассуждеий статьи. Интересно, как уважаемый автор объясняет ещё бОльшую корреляцию между явкой и процентом голосов на выборах в парламент Великобритании (а также отсутствие там нормального распределения)? Данные смотрите, например, здесь:
http://eruditor.ru/k/?15
Большое спасибо за самую разумную статью про электоральную статистику декабря! Поражают передергивания странных людей, пытающихся убедить нас, что гипотеза демографической неоднородности может объяснить все наблюдаемые ужасы. Ещё больше поражают люди, которые тыкают нам в нос разброс по явке в Великобритании, скоррелированный с голосами в пользу различных партий. Вот тут как раз гипотеза демографической неоднородности и различия в активности избирателей вполне может сработать. Но на мой взгляд вопрос о честности выборов неактуален. Все, кто в своих суждениях руководствуется разумом и фактами и так понимают, что выборы были ОЧЕНЬ грязными. Чего стоят хотя бы данные проекта «Гражданин наблюдатель», которые бревном в глазу должны бы засесть у Чурова, потому что объяснить различие в 15 и более процентов в данных по участкам, где выборы были проконтролированы, и теми, где контроля либо не было вообще, либо он был обезврежен (всё в рамках Москвы), просто невозможно никак иначе, кроме как массовыми фальсификациями. Итак, мыслящие люди и так всё понимают, а те, кто думать либо не умел, либо разучился, не могут быть переубеждены разумными доводами. Грустные глазки Медведева и налитое ботоксом (с) лицо Путина, сопровождаемые словами о том, что выборы прошли честно, для них сильнее любых доводов разума. К сожалению.
Автор начал за здравие (ожидался научный подоход), а кончил за упокой (эмоциональное бездоказательное вредное лжеморализаторство).
«Троицкий вариант», ай-ай-ай! Гоните мракобесов в шею. Или вы общественно-политическая пролиберальная газета? Опубликуйте реальный разбор ситуации — и такой разбор получит множество читателей.
Гаусс-мегагаусс…все это с точки зрения российской юрисдикции не стоит и выеденного яйца, поскольку НЕТУ никаких объективных доказательств. Такими псевдо-научными рассуждениями наука лишь дискредитирует себя в глазах Народа-Броненосца.
Вопрос, о котором говорится в статье, гораздо интереснее, чем может казаться. Доступ к результатам выборов открыт, каждый желающий волен экспериментировать с ними, как пожелает. Помнится, на заре развития радиотехники именно любители обнаружили дальнее распространение коротких волн. Возможно, анализ выборов тоже выявит важные закономерности.
Но с терминологией надо бы обращаться поаккуратнее. Одно дело — обсуждение в узком кругу, там поймут, и другое дело — на общем обозрении. Вцепятся в ошибку и раздуют муху до слона такого размера, при котором надутый слон лопнет, забрызгав зрителей своим содержимым.
Лучше было бы не эксплуатировать «Гаусса». Это мина замедленного действия. Выборы полностью дискретны, нормальное распределение — непрерывно. Чтобы связать данные выборов с любым непрерывным распределением, потребуется переход, который будет весьма скользким: например, придётся принять, что при любом увеличении числа избирателей никогда не возникает структурной неустойчивости. Мол, если в деревне проголосовало 10 человек за ЕР и 5 человек за КПРФ, то, будь в этой деревне 15 млн. человек, было бы 10 млн. голосов за ЕР, 5 млн. за КПРФ и по-прежнему ни одного (!) за остальные партии. Ведь сомнительно.
Различие непрерывность/дискретность — одна из «мелочей», в которых может скрываться дьявол. Потребуется осторожность. В остальном идея исследования электоральной статистики выглядит перспективно.
а существует нормальное распределение для дискретного случая?
В дискретном случае эту роль играет биномиальное распределение. Собственно, нормальное получается из него по теореме Муавра-Лапласа, так что они родственны. Но у биномиального (в случае выборов) ситуацию описать легче. Имеется большой-большой район, скажем, 60% за ЕР и 40% за КПРФ. Народу очень-очень много, так что даже если миллион или миллиард проголосует все за ЕР, оставшихся всё равно остаётся 60%/40%. (Если народу мало, то проценты будут меняться. Подправленное с учётом этого биномиальное распределение называется гипергеометрическим.)
Вопрос получается такой. Если проголосуют все, то результат ясен, 60%/40%. А какой будет результат, если рассматривать группы по 10 человек? Ответ: в среднем на 10 человек будет 6 голосовавших за ЕР и 4 за КПРФ. А группы в целом будут встречаться такие (формула простая, но в HTML не оформится) :
ЕР—-КПРФ—Вероятность
0 10 0,0001
1 9 0,0016
2 8 0,0106
3 7 0,0425
4 6 0,1115
5 5 0,2006
6 4 0,2508
7 3 0,2150
8 2 0,1209
9 1 0,0403
10 0 0,0060
То есть, группы, где ровно 6 ЕР и 4 КПРФ будут встречаться в среднем каждая четвёртая (1/0,25), группы 5ЕР/5КПРФ — каждая пятая, группы 2ЕР/8КПРФ — в среднем 1 из 100 рассмотренных, а группа, где все 10 голосов за КПРФ встретится (в среднем) один раз из 10000. Чем больше группа, тем меньше шансов получить отклонение, заметно отличающееся от 60%/40%.
Единственное известное мне исключение — расхождение экзит-пола по Москве и официальных результатов 2011. Если считать, что выборка экзитпола делается из той же генеральной совокупности избирателей, что пришли голосовать, то шансы получить менее 30% вместо 50% не превосходят единицы из миллиарда. Так что мы имеем уникальный случай за всю историю человечества. Волшебство в чистом виде.
У меня вопрос:
Я всегда считал, что распределение Гаусса справедливо для естественных процессов. Но выборы — честные они или нет — к таковым в любом случае не относятся! Ведь распределение Гаусса не универсально, есть бимодалные и мультимодальные распределения, смещания моды в ту или иную сторону и т.п. На выборах как раз это и должно проявляться!