«Двугорбая Россия»: дискуссия об анализе статистики по выборам в Госдуму

От редакции: Мы публикуем отзыв эксперта на статью «Двугорбая Россия» и комментарий автора.

 

Владислав Суховольский, докт. биол.наук, профессор, Федеральный исследовательский центр РАН, Красноярск
Владислав Суховольский, докт. биол.наук, профессор, Федеральный исследовательский центр РАН, Красноярск

В № 214 газеты «Троицкий Вариант — Наука» от 4 октября 2016 была опубликована статья эксперта Сергея Шпилькина, в которой анализируются итоги прошедших выборов в Государственную Думу РФ и утверждается, что в ходе этих выборов имели место значительные фальсификации в пользу одной из участвовавших в выборах партий [1].

Мне представляется, что я имею право прокомментировать эту статью и ее выводы. Дело в том, что я тот человек, который в 1990 году придумал те методы статистического анализа результатов голосований, которые сейчас используются для выявления фальсификаций. Г-н Шпилькин, перечисляя работы по теме статистического анализа результатов голосований, регулярно начинает их с нашей монографии (Собянин А. А., Суховольский В. Г. Демократия, ограниченная фальсификациями. М.: Проектная группа по правам человека, 1995). Второй в списке г-на Шпилькина обычно идет монография американских политологов, один из авторов которой М.Мягков — наш бывший сотрудник.

Если г-н Шпилькин читал нашу монографию (а насколько я знаю, он делал это), то он должен был знать, что использованный в его статье тест на явку — лишь один из целого набора статистических тестов на фальсификации, предложенный нами. Этот тест необходим, но недостаточен для утверждения о существовании фальсификаций. И для точного и достоверного вывода о наличии фальсификации желательно проверить данные голосования с использованием ВСЕХ возможных тестов.

Еще один простой тест на фальсификации для страны с достаточно однородным электоратом заключается в анализе связи логарифма числа голосовавших за партию или кандидата и логарифма места, занятого этой партией (кандидатом). Если всё честно, то связь между этими величинами описывается прямой линией. Хочу привести несколько примеров из практики голосований в разных странах в последние годы (рис. 1–3).

 

Рис. 1. Парламентские выборы в Турции в 2015 году
Рис. 1. Парламентские выборы в Турции в 2015 году

 

Рис. 2. Парламентские выборы в Финляндии в 2015 году
Рис. 2. Парламентские выборы в Финляндии в 2015 году

 

Рис. 3. Праймериз в Нью-Гэмпшире (штат с достаточно этнически однородным населением) в 2016 году
Рис. 3. Праймериз в Нью-Гэмпшире (штат с достаточно этнически однородным населением) в 2016 году

 

Как видно, со странами, где никто не кричит о фальсификациях, всё нормально: и ранговое распределение голосов за партии или кандидатов линейно в двойных логарифмических координатах, и коэффициент детерминации R2 очень близок к единице (прошу извинения за статистический жаргон, но я надеюсь, что читатели «Троицкого варианта» эти вещи знают). Если же имели место фальсификации, то условие линейности не выполняется и точки, характеризующие политическую партию (кандидата), в пользу которых совершались фальсификации, будут «отскакивать» от прямой, а коэффициент детерминации будет уменьшаться.

Как же выглядит ранговое распределение голосов, поданных за все партии, участвовавшие в выборах 2016? На рис. 4 и 5 приведены эти распределения, построенные по официальным данным ЦИК и по данным гипотезы г-на Шпилькина.

 

Рис. 4. Распределение голосов на выборах в Государственную Думу РФ в 2016 году (официальные данные)
Рис. 4. Распределение голосов на выборах в Государственную Думу РФ в 2016 году (официальные данные)

 

Рис. 5. Распределение голосов на выборах в Государственную Думу РФ в 2016 году (гипотеза С. Шпилькина)
Рис. 5. Распределение голосов на выборах в Государственную Думу РФ в 2016 году (гипотеза С. Шпилькина)

 

Как видно из рис. 4, лишь одна точка — данные по ЛДПР (третье место) — «отскакивает» от теоретической прямой. Заметим, что в случае фальсификаций в пользу «ЕР» точка, характеризующая ее результаты, должна была лежать существенно ВЫШЕ теоретической прямой. Если же отбросить данные для ЛДПР, то для распределения по остальным данным коэффициент детерминации R2 составит 0,983 (то есть практически 1!).

Распределение же, построенное на основе гипотезы г-на Шпилькина, существенно хуже описывается теоретической моделью. Более того, из этого графика следует, что фальсификации производились против (!) «ЕР». Ну уж в это я не верю (я думаю, и все нормальные люди тоже). Второе объяснение наблюдаемого вида распределения на рис. 5 — что-то не так с гипотезой С. Шпилькина.

Что же случилось, в чем причина наблюдаемых отклонений? В массовой фальсификации за ЛДПР? Можно рассмотреть различные гипотезы, объясняющие отклонения на рис. 4 без использования гипотезы о наличии фальсификаций. Но, наверное, газета не лучшее место для сложных статистических выкладок.

Хочется сказать только одно. В медицинской этике есть одно внешне очень простое правило для врачей: «Не навреди!» Речь идет о том, что врач не всегда может помочь больному, но он обязан проводить лечение так, чтобы больному не стало хуже. Представляется, что такое же правило должно стать нормой для людей, занимающихся количественной политологией. Мне представляется, что только после детального анализа результатов голосований на всех уровнях (федеральном, региональном, территориальном и т. п.) можно выступать с корректными выводами (мы в свое время анализировали даже на уровне отдельных избирательных участков, а их в РФ около 100 тыс.!). И еще: нужно понимать, что все избиратели голосовали одновременно и на выборах по федеральному списку, и на выборах по одномандатным округам, и при массовых фальсификациях результатов выборов по партийным спискам нужно одновременно фальсифицировать и результаты выборов по одномандатным округам — иначе не сойдется явка на тех и других выборах. Значит, нужно проверять все результаты. Понятно, за пару дней и даже за пару недель такой анализ не выполнить — это кропотливая и очень занудная работа. Но она необходима. В противном случае, если глобальные выводы делаются на основе произвольно выбранного критерия, избирателей «залечат» и они будут полагать, что все выборы в нашей стране всегда фальсифицируются. А это, по всей видимости, далеко не так — приведу лишь один пример (рис. 6).

 

Рис. 6. Результаты выборов в Государственную Думу РФ в 2011 году по Владивостоку (КПРФ — 26,86%, «ЕР» — 23,32%, «СР» — 20,42%, ЛДПР — 19,37%)
Рис. 6. Результаты выборов в Государственную Думу РФ в 2011 году по Владивостоку (КПРФ — 26,86%, «ЕР» — 23,32%, «СР» — 20,42%, ЛДПР — 19,37%)

Я вовсе не утверждаю, что никаких фальсификаций на прошедших (и предыдущих) выборах не было. Вполне возможно, что они были, и даже много. Но я совершенно точно уверен в том, что глобальные выводы о наличии фальсификаций нельзя делать на основе одного простого теста. Нужно всё же уважать науку, которой ты занимаешься.

  1. Сергей Шпилькин. Двугорбая Россия // ТрВ-Наука. № 214 от 4 октября 2016 года. http://trv-science.ru/2016/10/04/dvugorbaya-rossiya/

 

Редакция попросила Сергея Шпилькина прокомментировать отзыв Владислава Суховольского.

 

Сергей Шпилькин, независимый исследователь выборов
Сергей Шпилькин, независимый исследователь выборов

Книга А.А.Собянина и В.Г.Суховольского (далее «С-С») «Демократия, ограниченная фальсификациями: выборы и референдумы в России в 1991–1993 годах», изданная в 1995 году [1], — важная фундаментальная работа, положившая начало исследованиям статистики выборов в России. Некоторые из подходов, предложенных в этой книге, остаются актуальными и по сей день. Например, «диаграмма Собянина — Суховольского», т.е. диаграмма рассеяния для результатов кандидатов по участкам в координатах «явка — результат кандидата» (исходно у С-С «явка — доля проголосовавших за кандидата от всех зарегистрированных избирателей») остается одним из самых наглядных и простых способов оценить общую ситуацию с голосованием в стране в целом или в отдельном регионе. В некотором смысле я даже рад, что не был знаком с этой книгой в 2007 году, когда меня заинтересовали результаты выборов в Государственную Думу, — иначе я, скорее всего, не стал бы углубляться в данные до уровня участков, сочтя, что всё интересное уже понято и найдено. Разумеется, эта книга не может не занимать одно из первых мест в любом списке литературы по статистическому анализу выборов. Поэтому я очень рад, что один из авторов этой книги В.Г.Суховольский откликнулся на мою заметку в ТрВ-Наука № 214, написанную по итогам думских выборов 18 сентября. Однако с тезисами, высказанными в этом отклике, я, к сожалению, согласиться не могу.

В.Г.Суховольский упрекает меня в том, что я пренебрегаю предложенным в его с А.А.Собяниным книге критерием «честности» выборов, предполагающим наличие линейной зависимости между логарифмом процента голосов за кандидата и логарифмом места, занятого этим кандидатом (= ранга кандидата в ранжированном по убыванию результатов списке). Согласно С-С, эта «…численная закономерность носит общий характер и описывает ситуацию „свободной конкурентной борьбы“ за распределение конечного количества каких-либо условных „благ“» (глава 7). По сути, как отмечают С-С, эта закономерность представляет собой частный случай т.н. закона Ципфа — Парето. При этом авторы заявляют, что «выполнение уравнения (1) для выборного процесса означает, что существует „свободная конкуренция“ всех кандидатов, имеющих возможность беспрепятственно объяснить свои политические взгляды и политическую платформу избирателям».

И сам описанный выше критерий, и выводы, которые на его основании делает в своем отзыве В.Г.Суховольский, представляются мне сомнительными. Во-первых, критерий не выдерживает чисто технической «проверки на вшивость»: он с большой вероятностью не выполняется в ситуации, когда кандидаты, занявшие на выборах первое и второе места, показывают близкие результаты. За примером далеко ходить не надо: возьмем первый тур выборов президента Франции в 2012 году (тогда первое место с результатом 28,63% занял Франсуа Олланд, а второе с результатом 27,18% — Николя Саркози). Как легко видеть, зависимость очень далека от предполагаемой линейной.

Рис. 1. Первый тур президентских выборов во Франции (2012)
Рис. 1. Первый тур президентских выборов во Франции (2012)

Во-вторых, согласно С-С, сам критерий основывается на предположении о свободной конкуренции всех кандидатов в информационном пространстве. Если это предположение можно было принять в качестве «нулевого приближения» в первые годы выборов в Российской Федерации (достаточно вспомнить, что на выборах 1993 года в Государственную Думу проправительственный блок «Выбор России» проиграл ЛДПР, заняв второе место), то считать нынешнюю ситуацию в России свободной конкуренцией кандидатов с равным доступом к информационным ресурсам более чем странно.

В-третьих, как справедливо отмечает В.Г.Суховольский, «глобальные выводы о наличии (добавлю от себя — и отсутствии) фальсификаций нельзя делать на основе одного простого теста». Действительно, наличие фальсификаций на выборах в России было неоднократно продемонстрировано в многочисленных анализах, основанных на гораздо более подробных данных, чем результаты голосования за кандидатов по стране в целом, — см., например, [2, 3, 4, 5, 6, 7], и анализ, приведенный в моей заметке, надо рассматривать в этом контексте.

И последнее замечание общего характера, относящееся не только к этой дискуссии, но и к другим апелляциям к «закону Ципфа». Оно касается использования коэффициента детерминации R2 как показателя качества регрессии. Глядя на эффектные значения R2 на графиках в отзыве В.Г.Суховольского, надо помнить, что в норме при регрессии в качестве «нулевой гипотезы» предполагается, что объясняемая переменная независима от объясняющей. Однако это не так в нашем случае, когда объясняемая переменная — это результат партии, а объясняющая — ее номер в ранжированном списке. Если взять ряд случайных числовых значений и упорядочить его по убыванию (или возрастанию), номер величины в упорядоченном ряду (ранг) будет, очевидно, коррелирован с ее значением. Например, как показано в [7], ряды (a1……an) и (rank a1…… rank an), где a1……an — значения нормально распределенной случайной величины, при nкоррелированы с r. Поскольку логарифм ранга, в свою очередь, коррелирован с рангом, а логарифм величины — с величиной, то, даже если мы возьмем для результатов партий (a1……an) просто случайные значения, мы «задаром» получим некоторую ненулевую величину R2 для зависимости между результатом партии и логарифмом его ранга. Более того, при удачном выборе типа случайной величины эта «даровая» часть может быть очень существенной. Как показывает численный эксперимент, если взять в качестве ai величины, обратные равномерно распределенной в интервале (0, 1) случайной величине, и n = 12 (количество партий, учитываемых В.Г.Суховольским на его графиках для думских выборов 2016 года, — две последние в рейтинге он почему-то исключает из рассмотрения), то вероятность получить для рядов (ln rank a1…… rank ln an) и (ln a1…… ln an) коэффициент детерминации R2 > 0,97 (как на рис. 4 у В.Г.Суховольского) для случайно выбранных таким образом «результатов партий» составляет 15% (поскольку все числа стоят под логарифмом, заботиться о приведении суммы «результатов» к 100% не нужно). На мой взгляд, это еще один повод задуматься о том, является ли корреляция логарифма результатов кандидатов с логарифмом занятого местом сколько-нибудь содержательным фактом.

 

Литература

  1. Собянин А.А., Суховольский В.Г. Демократия, ограниченная фальсификациями. М.: Проектная группа по правам человека, 1995. http://hrights.ru/text/sob/
  2. Kobak D., Shpilkin S., and Pshenichnikov M.S. Integer percentages as electoral falsification fingerprints // Ann. Appl. Stat. 2016. 10 (1). P. 54–73. https://arxiv.org/abs/1410.6059
  3. Kobak D., Shpilkin S., and Pshenichnikov M.S. Statistical anomalies in 2011–2012 // Russian elections revealed by 2D correlation analysis. 2012. arXiv:1205.0741v2. https://arxiv.org/abs/1205.0741
  4. Enikolopov R., Korovkin V., Petrova M., Sonin K., Zakharov A. Field experiment estimate of electoral fraud in Russian parliamentary elections // Proceedings of the National Academy of Sciences 110 (2). P. 448–452. http://www.pnas.org/content/110/2/448.full
  5. С.В. Мухлеж на выборах: проверка в два счета // ТрВ-Наука. № 141 от 5 ноября 2013 года. http://trv-science.ru/2013/11/05/mukhljozh-na-vyborakh-proverka-v-dva-scheta/
  6. С.В. Про арифметику и немножко про выборы // ТрВ-Наука. № 99 от 13 марта 2012 года. http://trv-science.ru/2012/03/13/pro-arifmetiku-i-nemnozhko-pro-vybory/
  7. Овчинников Б. 18 честных городов // ТрВ-Наука. № 98 от 28 февраля 2012 года. http://trv-science.ru/2012/02/28/sto-vosemdesyat-chestnykh-gorodov/
  8. Stuart A. The correlation between variate-values and ranks in samples from a continuous distribution // British Journal of Mathematical and Statistical Psychology. 1954. 7(1). P. 37–44.

30 комментариев

  1. С.Шпилькин захотел натянуть многомерную сову на трехмерный глобус — и натянул конечно, кто бы сомневался!
    Чего не сделаешь ради сиюминутной известности.

    Все эти сферические кони в вакууме, наподобие «свободной конкуренции кандидатов с равным доступом к информационным ресурсам «, вызывают только недоумение и сожаление.
    Ладно бы теоретизировали себе для души, вдохновляемые невидимой рукой рынка, да заради научного любопытства. Но когда такие выводы вываливаются в СМИ с явным контекстом «власть снова всех обманула, чтобы остаться у власти», то это просто желтушные набросы заради одного лишь заголовка.

    А ссылки [2, 3, 4, 5, 6, 7] после всех разборов этой якобы «борьбы за чистоту выборов» и читать не хочется, извините.

  2. В последнем абзаце вместо [7] должно стоять [8].

    По отзыву, печально наблюдать, как бывший новатор в науке через 20-25 лет стал консерватором.

  3. 1. «Этот тест необходим, но недостаточен для утверждения о существовании фальсификаций. И для точного и достоверного вывода о наличии фальсификации желательно проверить данные голосования с использованием ВСЕХ возможных тестов.»

    Хотелось бы объяснить непосвящённым читателям — указанная проверка неосуществима. В принципе. И совершенно непонятно, как такой уважаемый эксперт как Суховольский этого не знает и как не менее уважаемый эксперт — Шпилькин — ему на это не указал. Общеизвестно, например, что проверку генераторов псевдослучайных чисел всегда проводят на ограниченном числе тестов. И никогда нельзя утверждать с абсолютной достоверностью, что указанная последовательность является истинно случайной, даже если она выдержала все тесты. А вот если она один хотя бы один из тестов не выдержала, то она случайной не является. Прошедшие выборы некоторые из тестов провалили.

    2. Оба автора по совершенно непонятной причине уверены, что в описанной ситуации можно статистически неопровержимо доказать наличие фальсификаций. Это опять же в принципе невозможно. Для этого нужно доказать исходные гипотезы о наличии или отсутствии корреляций, что в данном случае исключено.

    —————
    Максимум, что можно здесь извлечь из статистического анализа — в высшей степени правдоподобные подозрения, требующие дальнейшей проверки сугубо сыскными методами. А для этого вывода приведённых Сергеем Шпилькиным данных более чем достаточно. И, естественно, участники предстоящих выборов должны извлечь уроки на будущее и хотя бы набрать наблюдателей, пусть даже из других регионов и не слишком квалифицированных.

    Если они уже и на это не способны — песенка демократии в нашей стране спета. Будем ждать нового 1905 года.

    1. Уважаемый Ash,

      Если возможно, поясните, пожалуйста, какие именно «некоторые из тестов» были провалены результатами прошедших выборов.

      1. Например, без всяких вычислений понятно, что выборки для различных регионов не могут принадлежать к одной генеральной совокупности. Более подробно написано здесь.
        http://trv-science.ru/2016/10/04/dvugorbaya-rossiya/#comment-78130
        http://trv-science.ru/2016/10/04/dvugorbaya-rossiya/#comment-78142

        Одного этого абсолютно достаточно, чтобы направить в эти регионы следственные комиссии. Делать же математически точные заключения только на основании статистических данных в этом случае нельзя.

      2. Я вот делал для одного коллеги в 2014 году подборку о прошлых выборах, можно использовать.

        Статьи в Интернете

        А.Шень. Выборы и статистика: казус «Единой России» (2009)
        http://alexander.shen.free.fr/elections.pdf

        Статья С.Шпилькина (с исправлениями и дополнениями)
        http://podmoskovnik.livejournal.com/65386.html

        И другие его записи
        http://podmoskovnik.livejournal.com/
        по метке: статистика

        Выборы в Москве: 1996-2012. О преемственности и причинности (в 5 частях)
        http://nonenoun.livejournal.com/3772.html

        Подборка постов А.Киреева о думских выборах
        http://kireev.livejournal.com/761600.html

        Его же много постов о последних выборах.
        http://kireev.livejournal.com

        Исследования «Корбулона» (критерии — по недействительным бюллетеням, последней цифре и др. )
        http://corbulon.livejournal.com/
        по метке: выборы

        Статьи в «Троицком варианте» (в обратном хронологическом порядке)

        Мухлёж на выборах: проверка в два счета
        http://trv-science.ru/2013/11/05/mukhljozh-na-vyborakh-proverka-v-dva-scheta/

        Выборы в Москве: какими же были настоящие итоги?
        http://trv-science.ru/2012/07/03/vybory-v-moskve-kakimi-zhe-byli-nastoyashhie-itogi/

        Про арифметику и немножко про выборы
        http://trv-science.ru/2012/03/13/pro-arifmetiku-i-nemnozhko-pro-vybory/

        Выборы-2011
        http://trv-science.ru/2011/12/06/vybory-2011/

  4. Помимо указанного С.Шпилькиным примера с выборами во Франции, теперь можно добавить и выборы в США, где два основных кандидата получили близкие результаты, и это там не в первый раз. Можно также вспомнить Украину в 2004 году, где близкие результаты получили Янукович и Ющенко. И так далее. Так что нельзя это считать за критерий. Да и по сути он сомнителен, смахивает на мистику чисел.

    1. 1. У С. Шпилькина имеется ещё одна причина не поддаваться на критерий Суховольского (КC). Ведь КС даже по данным ЦИК намекает, что у ЕР как бы украли 10 мегаголосов, как видно из картинки, ссылка на которую дана в предыдущем комментарии. Там я учёл не 12, а 14 партий. (Пытался выложить картинку здесь, но не получилось. Просветите, это здесь в принципе невозможно?) А на «скорректированных» данных Шпилькина ЕР бы «ограбили» ещё больше. Все ваши контрпримеры здесь неуместны — вы ведь это сами понимаете? — и ничего не говорят о валидности методов Шпилькина и КС. Как писала Вентцель, существует конкурс им. Чайковского и существует музицирование в семейных кругах. Речь ведь не о свойствах датчиков случайных чисел.
      2. Корпускулы в Чернобыле и Фукусиме ведут себя совсем не так, как в пробирке. Не говоря уж о людях на выборах. Особенно при избирательной системе, унаследовавшей у немецкой склонность явки влиять на парламентский вес конституционных субъектов федерации. На этот раз Москва в ГД, к примеру, недополучила больше мест, чем Бавария в Бундестаге. А Татарстан получил больше лишних мандатов, чем федеральная земля Нижняя Саксония. Статью об этом ещё не выложил, но вот вам явка на выборах в Ил Тумэн, где часть улусов сама себя высекла. Округа там примерно равны по людности, и валидные голоса понимайте как явку.
      http://maxpark.com/static/u/article_image/15/07/22/tmpID010i.jpeg

      1. Я, честно говоря, не понимаю, что и зачем вы пишете. Есть не один, а множество критериев, указывающих на нарушения на выборах: распределение процентов голосов, зависимость процентов голосов от явки, метод последней цифры, метод доли недействительных бюллетеней и др. Все это активно обсуждалось, выше приведены ссылки. В данном случае Суховольский выбирает один-единственный метод, который НЕ указывает на нарушения, причем самый странный, сомнительный и мистический, и говорит, будто это опровергает все остальное. Делает он это, по-видимому, из соображений, далеких от науки и от собственных идеалов 1990 года. Вот и все. В остальном, в оценке того, как следует воспринимать результаты критериев, я полностью согласен с комментарием Ash.

        1. 1. Для матриц сопряжённости, отвечающих полномасштабным выборам, ни один точный или асимптотический критерий не подтверждает однородность партийных вкусов избирателей всех «штатов» или округов ни при какой приемлемой вероятности ложных тревог. Это я видел на сотнях выборов в десятках стран. Ещё хуже должно быть при детализации до избирательных участков. (Как и при сравнении тысяч лицеев и ПТУ по успешности на батарее ЕГЭ.)
          2. Я не хочу сказать, что все элементарные неподтверждения однородности НЕОДНОРОДНЫХ ВЫБОРОВ ничего не выявили. «Дребезг контактов» — это хорошо. Но никто не показал, что обсуждаемая здесь двугорбость НЕОДНОРОДНЫХ ВЫБОРОВ обусловлена фальсификациями. Дело не только в разной психологии селян, горожан etc.
          Если Карякин переиграет Карлсена (или наоборот), никто не станет победителя журить за тактику. Так почему тогда кое-кому не нравится, что умные чеченцы, например, переигрывают глупых питерцев и москвичей по представительному КПД за счёт форсированной явки, разгадав особенность избирательной системы. Которую Вы упустили в предыдущем моём комментарии. И которую не наблюдателям лечить, а конструкторам машины выборов. На вход которой поступают расклады голосов. Здесь почему-то называемые итогами выборов.
          3. Раз нельзя вставлять картинки, ставлю точку

          1. Два пояснения к комментарию.
            К пункту 1. Выборы в Заксобрание СПб, как я понял, не подозреваются на этот раз в фальсификациях. Давайте убедимся в независимости предпочтений избирателей от номера округа по критерию хи-квадрат. Вот легальный расклад партсписочных голосов по окружным партийным ячейкам.
            14996 5478 4287 4333 5797 2594 1133 337
            16440 4508 4564 4716 7283 2866 1157 370
            30666 3105 3569 3274 5247 1920 809 265
            18043 5100 5273 6483 6628 5309 1248 414
            22896 6426 7078 6577 7719 5171 1535 444
            23511 4701 4915 3955 5398 4953 1123 318
            26864 5781 5365 4956 5012 5229 1176 405
            20190 5935 5406 4704 4495 5156 924 463
            24791 6669 6256 5035 5085 4900 1259 567
            24491 8110 6446 6045 4311 4907 1075 429
            19343 5755 5600 4628 4437 3830 1120 329
            16837 6625 5848 5393 5429 6656 1313 375
            18773 5730 6063 5460 5266 5847 1279 397
            15609 5106 5155 4497 4189 5611 1063 389
            16581 5849 5196 6560 4390 3729 1010 429
            18004 5991 5072 5433 4169 5706 950 452
            21113 7029 5270 4736 4590 4420 854 368
            20733 5674 5721 4430 3611 5533 844 393
            25789 8218 7786 5730 3418 4254 920 414
            14731 4805 4798 4989 5161 4194 963 406
            18199 4666 5220 5813 5085 3685 979 218
            16679 8513 5689 6223 3407 3650 769 313
            21046 7207 5675 6871 3829 4110 994 360
            22317 8350 7089 5111 3851 4341 775 473
            19128 7331 5197 6005 2435 3443 667 283
            Статистика хи-квадрат здесь равна X2 = 35878, число свободы df = 168. Надеюсь, софт ваш справится с вычислением достигнутой вероятности ложных тревог, а не выдаст нуль.
            Может быть, кому-нибудь не лень выполнить аналогичную проверку для избирательных участков на любых самых честных парламентских выборах в любой стране?
            .К пункту 2. На несоразмерность представительства субъектов федерации РФ и ФРГ влияет не только явка. Но и явка тоже, как видно из этой картинки:
            http://maxpark.com/static/u/article_image/16/11/29/tmprCJIfs.jpeg

          2. «…умные чеченцы, например, переигрывают глупых питерцев и москвичей по представительному КПД за счёт форсированной явки, разгадав особенность избирательной системы….И которую не наблюдателям лечить, а конструкторам машины выборов.»

            Умные башкиры тоже кое-что разгадали. Например: «Если нет наблюдателей, то и ходить не нужно».

            «В результате, если участок 61 и 63 давали явку в 67%, то на этом участке, где были наблюдатели, иностранные корреспонденты, явка была в этом селе – 22,7%. Просто он считал по головам. Если «Единая Россия» на соседних участках, в таких же деревнях получала 48,5 – 48,6, то на этом участке «Единая Россия» получили 34,9% при подсчете, где был наблюдатель. Если «Яблоко» на соседних участках получила 0,5%, 0,4%, 0,2%, то на этом странном участке в себе Князево странное «Яблоко» получило 8,5%. Еще раз: 8,5%.»

            http://trv-science.ru/2016/10/04/dvugorbaya-rossiya/#comment-77996

            1. Я слишком много обработал выборов, чтобы в любом капризе местной явки или расклада голосов видеть только фальсификацию.
              1. Выше я ссылался на картинку с выборов в якутский Ил Тумэн, которые, насколько мне известно, в нечестности не обвиняли. Явка по округам — не по участкам! — разнится там в 4 раза. И двугорбость, между прочим, можно усмотреть.
              2. В моём 200-м округе ЕР на этот раз не получила ни одного мажоритарного голоса. Но соседи не считают, будто все её мажоритарные мандаты завоёваны нечестно. Кстати, предвыборный опрос у нас бессовестно соврал, поставив будущего победителя на 7 место по популярности. http://www.deputat.club/node/292
              В США или UK сказали бы,что ещё раз убедились: интернетной самовыборке верить нельзя. А московская сторонница Митволя говорит, что голоса на наших выборах подтасовали.
              3. В 21-м округе Флориды по выборам в ПП Конгресса США 2010 партия демократов тоже не получила ни одного голоса. А победил без конкуренции республиканский кандидат – брат того племянника первой жены Фиделя Кастро, который побеждал здесь 9 раз подряд до выхода на пенсию.
              4. Если от ФМШ рукой подать до ПТУ, это ещё не значит, что на ЕГЭ они покажут близкие результаты.
              5. Да, Вы обнаружили пример отклонения от однородности. Но не привели примера, как просил, однородности по избирательным участкам на безупречных выборах. К тому же для того, чтобы симптом Ваш доработать до диагноза, нужно изрядно потрудиться. Наивная статистика здесь не поможет. Как и я — мне близки задачи конструирования избирательных систем, но не диагностики электоральных данных.
              6. В своей «коррекции» С. Шпилькин отбраковал участки с высокой явкой, взятые из разных субъектов федерации. Было бы интересно посмотреть, как бы сказалась его правка на распределении думских мандатов по землям и партиям. И на соразмерности представительства партий, земель и земельных партийных ячеек. Почему он этого не делает? Ведь выборы проводятся не для проверки однородности электората.
              7. И ещё раз подчеркну, чему здесь, как показалось мне, не придают значения. Не только в США тому бы удивились, что представленность в парламенте конституционных «штатов» РФ и ФРГ зависит от погоды, даты голосования, мобилизации, гипотетической фальсификации и прочих факторов, влияющих на локальную явку.

              1. По-моему, вы скорее забалтываете тему. Все это обсуждалось еще 5-10 лет назад. Конечно, население может быть неоднородным, но эти неоднородности тоже должны подчиняться каким-то разумным закономерностям и лежать в разумных пределах, а не играть роль «бога из машины» или скорее «черта из табакерки», которым можно оправдать все что угодно. И конечно, неоднородность населения должна проявляться на протяжении ряда лет, а не странным образом «включаться», а потом «выключаться» после скандалов, наблюдателей и телекамер, как было при переходе от парламентских выборов 2011 года к президентским 2012 года, через несколько месяцев.

                Я помню, тогда был пример по ФРГ о корреляции процентов голосов о явки. Но при рассмотрении данных по регионам в отдельности этот эффект исчез, при рассмотрении же данных по регионам России он не исчезал, а где-то и усугубился, не помогало и деление на село и город и т.д.

                Помню пример с Израилем, где была полимодальность по процентам голосов. Но выяснилось, что там и раньше всегда так было. А в Москве вдруг такое стало нарастать в 2000-е, достигло апогея в 2011, и столь же вдруг сгладилось в 2012.

                Представьте себе, что в некотором государстве, по всей стране стали пропадать деньги из сейфов, но прямых улик против кого-либо нет. Что это — орудует хитрая банда грабителей или это таинственное явление природы, дематериализация денег ? Ученые говорят, что такого явления нет, оно противоречит законам физики. А позиция государственных органов — что это таинственное явление, которое не нужно расследовать и с которым следует смириться. Просто климат у нас такой. А ученые — враги народа и иностранные агенты.

                1. Алексею В. Лебедеву
                  Уважаемый А.В., если Вы не замечали, что занятие разведкой выборов людям придаёт уверенности, вот толика лёгких примеров.
                  1. We can tell you whence you come, Mr. Putin
                  http://maxpark.com/community/4061/content/2128657
                  2. Как штат Аляска всё возвращается…
                  https://newsland.com/community/4061/content/kak-shtat-aliaska-vsio-vozvrashchaetsia-uzhe-v-maksparkovskom-formate/2169478
                  3. А по этой ссылке не спешите кликать, а то заблудитесь на 843 страницах Итогового отчета о результатах общественного дистанционного мониторинга выборов депутатов Бундестага ФРГ 18 созыва.
                  http://www.roiip.ru/images/data/gallery/8_6067__otchet_Germaniya_s_pril1.pdf
                  Сначала познакомьтесь:
                  — с титульными авторами,
                  http://maxpark.com/static/u/article_image/16/12/03/tmp_lLidA.jpeg
                  — с главным открытием Отчёта, 1000 дней лежащего в открытом доступе,
                  http://maxpark.com/static/u/article_image/16/12/03/tmpaWmLKE.jpeg
                  — и с наблюдённой «кражей» голосов, на которую тоже наткнулся намедни.
                  http://maxpark.com/static/u/article_image/16/12/03/tmpU0_OrR.jpeg

                  1. Я не понимаю, к чему это все. Да, какие-то нарушения возможны и в ФРГ, с ними должно разбираться местное население. Вы по-прежнему выступаете в роли «адвоката дьявола»? Возможно, вам следует не загромождать форум, а предложить свои услуги Памфиловой. В свое время меня в числе группы коллег звали к Чурову, чтобы «дать отпор врагам», но мы отказались.

                    1. «Я не понимаю, к чему это все.»

                      Человеку просто скучно. Он даже сообщество «Физика» на макспарке так замучил, что исключили.

                    2. 1. Алексей В. Лебедев, где Вы в моих ссылках обнаружили «нарушения в ФРГ»? Я Вам ставлю двойку по разведке выборов. Как поставил «Журналу о выборах», разведавшему по Решению Конституционного Суда ФРГ, что дрезденскую службу В.В. Путин проходил на дальнем западе Западной Германии. И как поставил составителю хрестоматии для юристов, в ВОСЬМИ изданиях которой с точностью до наоборот переведена поправка к Конституции США, применяемая на президентских выборах. И как СЕМИ наблюдательным ИНСТИТУТАМ, обнаружившим в законах ФРГ, что депутатов БУНДЕСТАГА избирают граждане РОССИЙСКОЙ ФЕДЕРАЦИИ. А при СПИСЫВАНИИ из интернета легальных результатов выборов приписавших СДП добрых полтора миллиона голосов. Просто институты торопились накатать отчёт к распределению президентских грантов для разведчиков чужих выборов. И как бы знали, что «кирпич» никто читать не станет. Ни АП, ни ЦИК, ни СПЧ, ни студенты авторов из МГУ, МГИМО, МГЮА, Дипакадемиии etc.
                      2. Мне никто пока что не ответил, чему равна достигутая вероятность ложных тревог для проверки окружной однородности электората на выборах в ЗАКС СПб по критерию хи-квадрат. Видно, заглянуть сюда успели только пользователи конторского ПО с 29 ноября.
                      3. Результат коррекции распределения голосов ЕР, выполненной С.А. Шпилькиным, обязан однозначно воспроизводиться кем угодно. Вы полномочны его описать?

  5. С.А. Шпилькину, который, думаю, сюда заглядывает.
    Уважаемый Сергей Александрович, предлагаю такой обмен:
    1. Я разглашаю непредставительность последних выборов в Госдуму (по легальным голосам) и выборов в немецкий Бундестаг (до и после многострадальной реформы) из Kill seven birds with one Bundestagswahl.
    http://maxpark.com/static/u/article_image/16/12/03/tmp9afBij.jpeg
    http://maxpark.com/static/u/article_image/16/12/03/tmpqPQUjr.jpeg
    http://maxpark.com/static/u/article_image/16/12/03/tmpgoJw7q.jpeg
    2. А Вы за это разглашаете кухню коррекции матрицы легальных партийных голосов о 95 тыс. строках и 14 столбцах. У меня сложилось впечатление, что столбец ЕР был заменён суммой 13 остальных столбцов, умноженной на неизвестный коэффициент С. Если я верно угадал, то могу С подогнать по опубликованной Вами строке столбцовых сумм скорректированной матрицы. Но и в этом случае хотелось бы услышать С от Вас. Или Вы ещё учитывали столбец бракоделов? Если я кухню понял верно, то смогу работать с раскладом голосов по окружным партийным ячейкам, не опускаясь до участков, которые, похоже, уже недосягаемы, но они меня мало волнуют.

    1. РАБОТА НАД ОШИБКАМИ. Резник Владислав Матусович второпях назван Резниковым в шпаргалке 3.

  6. To Ash
    Вам почему-то нельзя ответить под комментарием.
    Гугл так не думает. А Вы, значит, поверили моей гипотезе? К сожалению она не подтвердилась. Просто тогда сбоил Макспарк, и я ушёл в ньюслендрвский сооб. Там это запросто — сосуды сообщаются. А Вы физику, похоже, любите? Тогда дарю задачку.
    Перейдите здесь к тексту по первой картинке.
    https://www.google.ru/search?q=валерий+чурбанов+newsland&newwindow=1&client=opera&hs=jrD&source=lnms&tbm=isch&sa=X&ved=0ahUKEwiMs9Xjx9rQAhUCkCwKHT7NBHkQ_AUICSgC&biw=1517&bih=731&dpr=0.9#imgrc=_

  7. to Валерий И. Чурбанов

    1. А кого это волнует?

    Меня лично, как российского избирателя, волнует, что мой голос и голоса моих соотечественников учитываются неправильно, а люди, ответственные за это, остаются безнаказанными, так что будут очевидно продолжать и дальше этим заниматься.

    А вы возмущаетесь, что кто-то издал плохую книгу о Германии. Да, сейчас в России издается много плохих книг. Но к сожалению, это не самая большая наша проблема.

    2. Разумеется, строгой однородности в данном случае нет, и никто этого не утверждал. Могут (и даже должны) быть естественные колебания базовых средних в несколько процентов, вполне достаточные, чтобы испортить статистику хи-квадрат. Другое дело, разница в разы, пример чего привел Ash.

    Вы приписываете ученым ложные методы, которые они на самом деле не используют, потому что понимают, что в каких-то случаях их использовать нельзя, и таким образом пытаетесь дискредитировать научный подход вообще.

    Если уж на то пошло, гораздо подозрительнее такая однородность, какая была в Саратове, где на более чем сотне участков совпали результаты за все партии с точностью до трех знаков.

    3. Я не уполномочен, равно как и вы тут не уполномочены никому давать задачи и ставить оценки.

  8. Место, занятое партией (кандидатом), — это показатель, измеренный по порядковой шкале. А логарифм — это функция, которая корректно определена на абсолютной шкале. Эти типы шкал легко спутать, потому что получаемые данные представляют в форме цифр. Но за одними и теми же цифрами стоит разная информация (см. Орлов А.И. Теория измерений как часть методов анализа данных: размышления над переводом статьи П.Ф. Веллемана и Л. Уилкинсона // Социология: 4М. 2012. №35). Попытка вычислить логарифм порядкового числа приводит к бессмысленным результатам. Поэтому «Еще один простой тест на фальсификации» априори иррелевантен.

Добавить комментарий

Ваш адрес email не будет опубликован.

Оценить: