Содержание

 

Введение

Выявление фальсификаций результатов

Распределение последних цифр

Доля недействительных бюллетеней

Реконструкция истинных результатов

Метод реконструкции результатов

Общая идея

Конкретизация методики

Структура фальсификаций

Понятие о достоверности результатов выборов

Частичная верификация реконструкции

Избиратели-зомби и административный ресурс

Результаты реконструкции

Общефедеральный округ

Одномандатные округа

Верификация методики

Сравнение сильной и слабой реконструкций для Москвы

Гипотезы Собянина–Суховольского и Шпилькина

Выводы

 

Введение

 

Обсуждение достоверности результатов российских выборов зачастую основывается на слабо-формализованных и разрозненных данных, получаемых от общественных наблюдателей или членов избирательных комиссий. При этом установить фальсификацию результатов возможно только посредством выполнения определенных юридических процедур, на исход которых неизбежно влияют дополнительные субъективные факторы, еще сильнее затуманивающие общую картину. Вместе с тем, официальные результаты выборов, публикуемые по всем избирательным участкам, образуют достаточно большой массив регулярных данных, чтобы к нему можно было применять статистические методы анализа, результаты которого объективны.

Перед изучением результатов выборов необходимо напомнить некоторые особенности избирательной системы России и дать ряд определений.

Избирательные комиссии (ИК), организующие голосование и обработку его результатов, имеют иерархическую структуру: центральнаясубъектов федерацииокружныетерриториальныеучастковые. Всего в 2016 г. было сформировано 96,9 тыс. УИК, 2,8 тыс. ТИК и 225 ОИК. Избирательные участки, образованные за рубежом, были формально приписаны к разным округам, однако здесь они рассматриваются как образующие виртуальный 226-й округ.

Основными итогами выборов являются:

  • количество проголосовавших избирателей;
  • (общая) явка – его отношение к списочному составу избирателей;
  • явка за партию – доля поддержавших ее избирателей, измеряемая от их списочного состава;
  • результат партии – доля поддержавших ее избирателей, измеряемая от числа проголосовавших, т.е. отношение явки за партию к общей явке.

 

Выявление фальсификаций результатов

 

Развитие электоральной статистики породило множество тестов, позволяющих выявить последствия, обусловленные искажением итогов голосования. Здесь мы рассмотрим два таких теста, являющихся, на взгляд автора, наиболее ясными и обоснованными. Первый тест направлен на обнаружение в избирательных протоколах выдуманных чисел за счет неравномерности распределения их последних цифр. Второй тест отслеживает падение доли недействительных бюллетеней, связанное с вбросом голосов за партию власти.

Разумеется, данные тесты, как и любые другие, возможно обмануть. Однако это требует кропотливой и квалифицированной работы, выполнить которую фальсификаторы, как правило, не только не могут, но даже и не пытаются. Кроме того, при сочетании нескольких тестов возникает синергетический эффект, в результате которого обмануть их все вместе оказывается принципиально сложнее, чем сколько угодно раз обмануть любой из них по отдельности.

Здесь мы ограничиваемся всего двумя простыми тестами, поскольку, видимо, никто и не стремится придать фальсификациям хотя бы минимальное правдоподобие. Однако, опыт показывает, что в соревновании брони и снаряда всегда побеждает снаряд, так что любой способ подтасовки в принципе может быть обнаружен.

 

Распределение последних цифр

 

В этом разделе систематизируются и развиваются подходы, изложенные в работах 1, 2.

У целочисленной случайной величины, разброс которой измеряется многими десятками и даже сотнями единиц, последняя цифра (ПЦ) должна принимать все возможные значения с практически равной вероятностью. Если же какие-то из них преобладают, это может означать, что данная величина получена не в результате измерений или наблюдений, а выдумана.

Равновероятность ПЦ не предполагает в точности равной частоты их появления в конкретной выборке, поскольку всегда есть флуктуации. Понять, насколько они могут быть велики, позволяет критерий согласия Пирсона 3. Как и любой метод проверки гипотез, он основывается на вычислении по имеющейся выборке статистики – величины, для которой известно теоретическое распределение, позволяющее определить вероятность ее наблюдаемых значений.

Для гипотезы о равновероятности ПЦ статистика имеет вид \(S=nd\cdot \sum_{i=0}^{d-1}(n_i/n-1/n)^2\), где \(d=10\) – количество используемых в записи числа цифр, \(n=\sum_{i=0}^{d-1}n_i\) – объем выборки, а \(n_i\) – сколько раз в конце числа оказывается цифра \(i\).

Если все \(n_i>10\), то статистика \(S\) подчиняется распределению \(\chi^2\) с \(d-1\) степенью свободы независимо от распределения частот \(n_i/n\). Если же оно нормально, то указанное ограничение на величины \(n_i\) становится излишним.

Чем больше значение статистики, тем менее вероятно возникновение отклонений \(n_i/n\) от \(1/d\) в результате действия случайностей и тем подозрительнее они выглядят. При этом вероятность совершить ошибку I рода, т.е. отвергнуть верную гипотезу о естественном происхождении отклонений, задается ее уровнем значимости \(\alpha\), который можно определить с помощью стандартных функций в статистических пакетах (например, в Excel \(\alpha=\text{Хи2Расп}(S;d−1)\)). Бумажные таблицы распределения \(\chi^2\) тут бесполезны, т.к. обыкновенно не простираются на область столь больших \(S\), при которых неверность гипотез очевидна.

Далее для удобства вместо \(\alpha\) приводится его десятичный показатель \(\text{p}\alpha=-\lg\alpha\), увеличение которого на единицу соответствует десятикратному падению вероятности отсутствия фальсификаций.

Наиболее продуктивными для данного теста оказались следующие 3 электоральные характеристики: количество проголосовавших избирателей, общая явка и результат партии власти. Две последние величины, являющиеся дробями, превращались в целые числа путем умножения на 1000 и округлением до ближайшего целого, т.е. проверялась равновероятность десятых долей процента.

Проголосовавших избирателей здесь будем подсчитывать не по обнаруженным в урнах бюллетеням, а по выданным. В норме эти величины почти не различаются. Однако фальсификаторы иногда не доносят значительное количество якобы выданных бюллетеней до урн, что делает их виртуальное содержимое чуть более случайным, маскируя фальсификации.

Для начала проведем анализ по избирательным округам. В нем учитываются только те участки, на которых проголосовали не менее 100 человек, чем гарантируется достаточная ширина разброса анализируемых величин. Кроме того, для явки не учитываются участки, на которых проголосовали вообще все зарегистрированные избиратели, поскольку нельзя исключать, что на таких участках списки избирателей составлялись лишь по факту их прихода на участок, что делает явку фиктивной величиной.

Для простоты далее используется минимум уровня значимости по рассматриваемым характеристикам \(\alpha_\text{min}\) (его показатель \(\text{p}\alpha_\text{min}\) – максимален). Для 3 анализируемых характеристик и 226 округов в среднем должен встретиться 1 округ с \(\text{p}\alpha_\text{min}=\lg(3\cdot226)\approx2.8\). Таким образом, значения показателя начиная примерно с 3 следует считать подозрительными, с 4 – исключительными, а с 5 – невероятными.

Логично предположить, что фальсификаторы чаще выдумывают числа круглые (для количества проголосовавших) или целые (для процентов общей явки или результата «ЕР») в силу их психологической привлекательности. В этом случае не просто будет нарушаться равновероятность ПЦ, но и преобладающей среди них окажется «0». Анализ подтверждает это предположение. В табл. 1 приведены данные о 18 округах с \(\text{p}\alpha_\text{min}>3.4\), в которых имеет место описанная ситуация, рождающая обоснованные сомнения в достоверности результатов голосования, которые визуализирует рис. 1.

Таблица 1
Округа с преобладанием круглых результатов
Субъект федерацииИзбирательный округ\(\text{p}\alpha_\text{min}\)Характеристика
ТатарстанНабережночелнинский38,4Общая явка
ТатарстанМосковский20,9Результат «ЕР»
ДагестанЦентральный16,4Результат «ЕР»
ДагестанЮжный14,2Результат «ЕР»
БашкортостанСтерлитамакский12,1Результат «ЕР»
ТатарстанАльметьевский11,9Общая явка
БашкортостанНефтекамский11,8Общая явка
БашкортостанУфимский11,4Результат «ЕР»
ТатарстанПриволжский9,2Результат «ЕР»
ДагестанСеверный8,8Результат «ЕР»
МордовияМордовский8,4Результат «ЕР»
Северная ОсетияСеверо-Осетинский8,1Проголосовали
Кемеровская обл.Кемеровский7,6Общая явка
Кемеровская обл.Новокузнецкий5,4Проголосовали
БашкортостанБелорецкий5,4Результат «ЕР»
Тюменская обл.Заводоуковский4,1Результат «ЕР»
ТатарстанЦентральный3,5Результат «ЕР»
Кемеровская обл.Прокопьевский3,4Общая явка

Рис. 1. Частоты последних цифр для округов с преобладанием круглых результатов

Цифра «0» в конце некоторых электоральных характеристик в округах из табл. 1 встречается в 2 или даже в 3 раза чаще прочих цифр.

Однако выдумывание результатов – не единственная возможная причина, из-за которой нарушается равновероятность ПЦ. Другой очевидный сценарий – ориентация фальсификатов на одни и те же целевые проценты (предположительно, заданные директивно), на которых происходит аномальная концентрация участков, т.е. возникают сгустки явки или результата. Для их выявления вновь прибегнем к критерию Пирсона, но будем использовать систему счисления с основанием \(d\ne 10\). При его смене круглые числа перестают быть круглыми, тогда как сгустки остаются сгустками. Кроме того, если имеется несколько сгустков, ПЦ для которых различаются в десятичной системе счисления, то при другом основании они могут и совпасть.

Минимальный из уровней значимости гипотезы о равновероятности ПЦ, определенных при \(d=7\div 9\) и \(11 \div 13\), обозначим \(\alpha^\prime\). Для него, как и для \(\alpha\), будем использовать минимум по 2 (проценты явки и результата) рассматриваемым характеристикам \(\text{p}\alpha^\prime_\text{min}\).

В табл. 2 приведены данные по 7 округам c \(\text{p}\alpha^\prime_\text{min}>4.3\), не попавшим в табл. 1. Среди них выделяется Чеченский округ, для которого так же, как и для всех округов из табл. 1, \(\text{p}\alpha^\prime_\text{min}<\text{p}\alpha_\text{min}\), однако преобладают ПЦ с «5» по «9» (можно предположить, что здесь для фальсификаторов притягательной оказалась возможность округления вверх). Для остальных округов из табл. 2 \(\text{p}\alpha^\prime_\text{min}>\text{p}\alpha_\text{min}\), чего и следует ожидать в случае целевых процентов. Как такой способ фальсификации сказывается на распределении последних цифр, можно видеть на рис. 2.

Таблица 2
Округа, подозреваемые в наличии сгустков
Субъект федерацииИзбирательный округ\(\text{p}\alpha^\prime_\text{min}\)Характеристика\(\text{p}\alpha_\text{min}\)
ЧечняЧеченский8,8Результат «ЕР»18,1
Саратовская обл.Саратовский18,2Результат «ЕР»11,1
Карачаево-ЧеркесияКарачаево-Черкесский6,1Результат «ЕР»3,5
ИнгушетияИнгушский6,1Общая явка2,7
Саратовская обл.Балашовский5,5Общая явка4,4
Тюменская обл.Тюменский5,3Результат «ЕР»2,0
ТатарстанНижнекамский4,4Результат «ЕР»2,9

Рис. 2. Частоты последних цифр для округов, подозреваемых в наличии сгустков

Равновероятность последних цифр электоральных характеристик нарушается по-разному в разных округах из табл. 2.

В 25 округах, перечисленных в табл. 1 и 2, зарегистрировано 11,4% избирателей, что представляется весьма значительным масштабом фальсификаций, выявленных одним элементарным тестом.

Вместе с тем, даже при смене \(d\) округ может пройти тест на равновероятность ПЦ, если на разных его территориях фальсифицируются различные характеристики или если выдумывание чисел сочетается с ориентацией на целевые проценты. Так случилось, например, в Кабардино-Балкарском округе, где число проголосовавших избирателей было круглым для 15 из 23 участков ТИК 10 (Урванская), а процент голосов, поданных за партию власти, оказался целым для 11 из 18 участков ТИК 11 (Чегемская) и образовал сгустки для 15 из 21 участка ТИК 13 (Эльбрусская) и всех 20 участков ТИК 8 (Прохладненская городская), причем на разных значениях.

В свете сказанного целесообразно провести формальную проверку и для территорий, несмотря на то, что количество участков, относящихся к одной ТИК, как правило, недостаточно для гарантированной сходимости статистики к распределению \(\chi^2\) при произвольном распределении разброса частоты последних цифр. Поэтому далее явным образом предполагается его нормальность. Это предположение весьма правдоподобно, но даже если оно не выполняется в точности, результаты, полученные с его помощью, могут измениться лишь количественно, но не качественно, что несущественно в случае сверхнизкой значимости. Тем не менее, надо понимать, что если приведенные выше результаты вполне строги и могут использоваться как доказательство в суде, то для придания такого же уровня обоснованности дальнейшему могут потребоваться дополнительные исследования.

Табл. 3 обобщает результаты по 59 территориям с \(\text{p}\alpha_\text{min}>4.2\) из тех субъектов федерации, в которых есть хотя бы одна территория с \(\text{p}\alpha_\text{min}>6\). Наличие таких ТИК означает, что вышестоящие ИК, как минимум, не предприняли усилий по пресечению очевидных фальсификаций, а, возможно, и способствовали им. Это дает веские основания трактовать всего лишь подозрительные значения показателя скорее как результат умысла, нежели как случайность. Поэтому подозрительными среди 2801 ТИК считаются те, в которых \(\text{p}\alpha_\text{min}\) лишь немного превышает \(\lg(3\cdot2801)\approx3.9\).

Таблица 3
Сводка по субъектам федерации с ТИК, провалившими тест на равновероятность ПЦ
Субъект федерации\(\text{max }\text{p}\alpha_\text{min}\)ТИКИзбирателей
Ингушетия18,43/855%
Чечня23,47/2047%
Северная Осетия6,42/1046%
Тюменская обл.10,64/2938%
Карачаево-Черкесия13,72/1234%
Татарстан31,510/6531%
Дагестан74,812/5430%
Кабардино-Балкария29,34/1327%
Башкортостан29,26/7124%
Саратовская обл.31,43/4923%
Кемеровская обл.37,16/4915%

Примечательно, что если сравнивать долю ТИК субъекта, проваливших тест, с долей приходящихся на них избирателей (3‑я и 4‑я колонки табл. 3, то первая величина в 10 случаях из 11 оказывается меньше второй (единственное исключение – Кабардино-Балкария), т.е. фальсификаторы предпочитают крупные территории.

В заключение обратим внимание на несколько примечательных обстоятельств. Наибольшая доля избирателей, приписанных к ТИК, провалившим тест, оказалась именно в Ингушетии, прошедшей его при \(d=10\) как единый округ. Обратная картина наблюдалась в Мордовии, все ТИК которой прошли тест за счет умеренного уровня фальсификаций, для выборок малого объема еще не выводящего статистику за пределы вероятного, тогда как сам Мордовский округ тест провалил в силу однотипности фальсификаций, осуществляющихся на его территориях.

Наконец, фантастичен показатель \(\text{p}\alpha_\text{Проголосовали}=74.8\), зафиксированный для ТИК 15 из Центрального округа Дагестана. Чтобы при таких шансах добиться одного случайного попадания за время существования планеты Земля, каждая элементарная частица в ее составе должна делать по миллиону попыток ежесекундно. На самом деле объясняется столь феноменальное везение элементарно. На многих дагестанских участках принято не затруднять себя выдумыванием числа проголосовавших, а просто полагать его в точности равным числу избирательных бюллетеней, полученных УИК, которое очень часто является круглым. Поэтому неудивительно, что та ТИК, где ревностнее всего блюли эту традицию, и выбилась в абсолютные лидеры по показателю \(\text{p}\alpha\).

 

Доля недействительных бюллетеней

 

Внимание фальсификаторов концентрируется на голосах, поданных за соревнующиеся партии. Поэтому из его сферы выпадают недействительные бюллетени (НДБ), что делает их долю удобной основой для выявления подтасовок. Достаточно сказать, что 12 субъектов федерации, ОИК и/или ТИК из которых провалили тест на равновероятность ПЦ, занимают последние 12 мест по доле НДБ. Однако ее рассмотрение позволяет не только идентифицировать регионы с высоким уровнем фальсификаций, но и дает инструментарий для анализа картины в целом.

Доля НДБ по-разному меняется при возрастании явки в зависимости от того, естественны или искусственны его причины. Если явка увеличивается из-за вброса бюллетеней, то, поскольку НДБ не вбрасывают, их доля, скорее всего, будет сокращаться. Если же явка увеличивается из-за роста активности избирателей, то повышается процент людей, умышленно (в силу антипатии ко всем партиям) или неумышленно (в силу ограниченных физических возможностей) портящих бюллетени, – при низком интересе к выборам такие люди, как правило, не голосуют.

Рис. 3 представляет условное распределение доли НДБ в виде зависимости нескольких его квантилей от явки. Как можно видеть, пока она не превосходит 45÷50%, графики идут более-менее горизонтально, не демонстрируя выраженных тенденций. Однако при большей явке графики устремляются вниз, что, предположительно, связано с разбавлением неизменного количества недействительных бюллетеней вброшенными действительными. Причем падение доли НДБ столь значительно, что его вряд ли возможно было организовать с помощью только физического вброса бюллетеней. Скорее, следует предполагать вписывание в протоколы выдуманных результатов с нулевым или почти нулевым количеством НДБ, свидетельством в пользу чего является падение квантилей уровня 50%+ до оси абсцисс при достаточно высокой явке. Это означает, что там, где зафиксирована такая явка, более чем в половине случаев вообще нет НДБ. Сей фантастический результат устоял даже против естественного всплеска их доли, наблюдаемого в самой правой части графиков, на которую приходится основная масса специализированных участков (больницы, дома престарелых, следственные изоляторы, воинские части, предприятия непрерывного цикла, корабли и т.п.), где порча бюллетеней естественна.

Рис. 3. Квантили условного распределения доли НДБ

Уровень квантиля, подписанный около графиков, определяет вероятность того, что при данной явке доля НДБ превысит его ординату.

Избирательные участки, отсортированные по величине явки, обрабатывались в окне шириной в 3 тыс. шт. Все участки учитывались с весом, равным их размеру.

Из рассмотрения исключены 59 ТИК, попавших в табл. 3, на которые приходятся 3,8% избирателей.

Вертикальная сетка соответствует квантилями распределения явки: штриховые линии – 25%, пунктирные – 5%.

Если считать, что с ростом общей явки доля недействительных бюллетеней не должна меняться, то можно оценить вброс разбавляющих их действительных. Поскольку он увеличивает явку, при определении реальной доли НДБ наибольшего доверия заслуживают участки с ее сравнительно небольшой величиной. Однако именно для них наиболее существенна роль случайных факторов, в силу чего необходимо рассмотрение по возможности обширной выборки.

Рис. 4 показывает, как удовлетворить одновременно обоим этим требованиям, анализируя кумулятивные характеристики доли НДБ. Речь идет о том, чтобы учитывать только участки с явкой, не превышающей некоторого порога. Его величина, определяемая из условий максимальной стационарности средней доли НДБ и минимальности его стандартного отклонения, составляет примерно 45%. При достижении наибольшей рассматриваемой явкой этой величины доля НДБ устанавливается на уровне в 2,49%. С учетом их общего количества в 0,983 млн это позволяет ожидать 39,5 млн проголосовавших. Однако по официальным данным проголосовало 52,6 млн чел., т.е. имеется излишек в 13,2 млн бюллетеней, или свыше ¼ от официального количества проголосовавших избирателей. Как мы увидим далее, эта оценка является на удивление точной.

Рис. 4. Средняя доля НДБ и ее стандартное отклонение

Этот рисунок аналогичен рис. 3 с теми отличиями, что учитываются уже все территории, а характеристики распределения приводятся для явки, не равной абсциссе, а для не превосходящей ее, т.е. рассчитываются с накоплением. Рассмотрение начинается с 500 участков с минимальной явкой.

Вид графиков позволяет определить и ту часть электората (примерно ⅓ с наименьшей явкой), при охвате которой рассматриваемые характеристики уже достигают стационарных значений, и ту его часть (примерно ⅔ с наименьшей явкой), при выходе за пределы которой становятся значимыми вбросы. Под их действием среднее и его стандартное отклонение начинают меняться противонаправленным образом.

Приведенный расчет опирается на предположение о том, что доля НДБ может меняться только в силу действия специальных факторов и в ситуации общего положения не зависит от этнокультурных и социоэкономических особенностей, способных заметно влиять на электоральные активность и симпатии. Однако нельзя исключать существования компактно проживающих и хорошо организованных групп избирателей (например, ортодоксальные религиозные общины), демонстрирующих аномально высокую политическую активность и не портящих бюллетеней. Для некоторых стран такие группы вполне реальны. И хотя для России они гипотетичны, их наличие могло бы вызывать точно такое же убывание средней доли НДБ с ростом явки, какое показано на рис. 4. Однако при этом должно убывать и его стандартное отклонение за счет гомогенизации электората, тогда как в реальности наблюдается его рост, что свидетельствует именно о фальсификационной природе падения доли НДБ.

 

Реконструкция истинных результатов

 

Установив факт масштабной фальсификации результатов выборов, перейдем к более сложной задаче их реконструкции. Она имеет две постановки, схожие по форме, но принципиально различные по содержанию. Решение этой задачи в ее слабой постановке дает ответ на вопрос «Какой результат получился бы, если бы голоса сразу честно посчитали?», а в сильной – на вопрос «Какой результат получится, если голоса всё-таки честно пересчитать?». Иначе говоря, слабая постановка предполагает обеспечение честного подсчета на основе реально существующих общественно-политических механизмов, а сильная требует привлечения некоторых дополнительных факторов, в реальности пока отсутствующих.

Любая власть, оставленная без общественного контроля, стремится исказить волеизъявление избирателей в свою пользу. Поэтому изначально честный подсчет возможен лишь там, где в достаточной мере развито гражданское общество, что среди прочего предполагает наличие минимально успешной оппозиции, потенциально способной поднимать своих сторонников на защиту их интересов. Тем самым возникает положительная корреляция между политической поддержкой оппозиции и достоверностью официальных результатов голосования. Вследствие этого реконструкция в слабой постановке оказывается менее благоприятной для власти, чем в сильной.

Не следует удивляться тому, что в условиях целенаправленных искажений возникают две «истинных» картины электоральных предпочтений. Если сильная постановка задачи, будучи по своей сути юридической, ориентирована на восстановление справедливости и отправление правосудия, то слабая, относясь более к области социологии, возвращает выборам функционал инструмента, измеряющего взгляды политически активной части населения, игнорируя взгляды его пассивной части.

Пример решения задачи в сильной постановке на материале московской электоральной статистики, дан автором в работе 1. Возможность получения этого результата обусловлена тем, что удалось с высокой степенью надежности верифицировать достоверность результатов выборов, проводившихся в Москве в 2012 и 2013 гг., что и позволило реконструировать для нее фальсифицированные результаты выборов 2011 г. По всей видимости, реконструкция в сильной постановке неосуществима без таких чистых реперов, которых для многих регионов страны просто нет. Поэтому в настоящей работе, посвященной анализу результатов федеральных выборов, задача реконструкции рассматривается только в слабой постановке.

 

Метод реконструкции результатов

 

 

Общая идея

 

Реконструкция результатов опирается на предположение о некотором свойстве, которым они должны обладать при честном подсчете голосов. Выполнение или нарушение этого свойства дает возможность классифицировать избирательные участки, разделив их на достоверные и недостоверные. После чего результаты, зафиксированные на первых, распространяются и на вторые.

В основу предлагаемой методики положен анализ зависимости между общей явкой и явкой за оппозицию, под которой понимаются все партии (в т.ч. партия испорченных бюллетеней), кроме партии власти, в пользу которой и осуществляются фальсификации. При этом предполагается, что взаимообусловленное изменение рассматриваемых явок существенно превосходит их изменение, обусловленное факторами, связанными с разнородностью участков. Она может проистекать, например, из совместного рассмотрения сельского и городского населения или жителей мегаполисов и небольших городов. Поэтому для повышения однородности целесообразно рассматривать по возможности небольшие регионы, меньше субъектов федерации. С другой стороны, для слишком маленьких регионов, вроде избирательных территорий, количество входящих в них участков зачастую оказывается недостаточным для подавления флуктуаций. Поэтом далее анализ проводится для избирательных округов.

В случае выборов 2016 г. имеется и дополнительный довод в пользу оперирования именно округами, т.к. те охватывались избирательными кампаниями кандидатов-одномандатников. При этом харизматичность кандидатов могла сказываться и на популярности в их округе выдвинувшей их партии, а наличие в нем избирательной интриги могло влиять и на явку, что потенциально сближает электоральное поведение избирателей внутри одного округа, т.е. повышает его однородность.

Фальсификации результатов делятся на вброс голосов за партию власти и переброс их от оппозиции (выдумывание результатов можно рассматривать как комбинацию вброса и переброса). Вброс увеличивает общую явку, не меняя явки за оппозицию, а переброс уменьшает явку за оппозицию, не меняя общей явки. Поэтому если рассматривать зависимость явки за оппозицию от общей явки, как схематично представлено на рис. 5, чистые вброс и переброс голосов сдвигают точки вдоль осей координат. А поскольку зависимость частной явки общей является монотонно возрастающей, любые фальсификации сдвигают участки в одну и ту же сторону от истинного графика рассматриваемой зависимости – вправо/вниз. При этом участки, принадлежащие к ее ближайшей окрестности, следует считать достоверными, а сдвинувшиеся от нее достаточно далеко, – недостоверными.

Рис. 5. Влияние фальсификаций на общую явки и явку за оппозицию

Точки представляют собой результаты, зафиксированные на отдельных УИК. Истинные результаты лежат вдоль графика идеальной зависимости, слева и сверху от которой точек нет.

 

Конкретизация методики

 

При классификации участков зависимость между общей явкой и явкой за оппозицию будем полагать линейной. Рассмотрение более сложных функций нецелесообразно, т.к. количество достоверных участков в ряде округов недостаточно для определения более чем двух параметров зависимости в условиях, когда саму достоверность тоже надо определять. Кроме того, во всех рассмотренных случаях качество аппроксимации данных прямыми представляется вполне удовлетворительным и не требующим усложнения модели.

Если выделено множество достоверных участков, то параметры прямой определяются с помощью регрессии Деминга (т.е. минимизируется сумма квадратов отклонений точек от прямой не по ординате, а в перпендикулярном направлении). Необходимость ее использования обусловлена тем, что обычные методы регрессионного анализа предполагают отсутствие погрешностей у абсциссы, а возможность – тем, что и абсцисса, и ордината измеряются в одних и тех единицах – процентах от списочного состава избирателей, величина которого в свою очередь определяет вес, с которым учитываются точки.

Классификация участков для каждого округа проводилась автором вручную, на основе его интуиции, но со следующим формальным ограничением. Если какой-то участок признан достоверным (недостоверным), то такими же принудительно признаются и все участки, отклоняющиеся от регрессионной прямой меньше (больше), чем он (точки, лежащие слева/сверху от прямой, имеют отрицательное отклонение и всегда считаются достоверными).

Это ограничение позволяет радикально уменьшить не только трудозатраты по классификации, но и произвол при ее проведении. Изменяя по одному принадлежность участков, можно добиться, чтобы достоверные участки по возможности тесно лежали вдоль линии, ограничивающей их множество слева/сверху. Для каждого округа эта процедура повторяется несколько раз, поскольку принадлежность некоторых участков неочевидна. Для участков, хотя бы по разу попадавших как в достоверные, так и в недостоверные, введена промежуточная градация – они считаются подозрительными. В дальнейшем их трактовка как достоверных/недостоверных позволит получить нижнюю/верхнюю оценку фальсификаций.

Рис. 6 демонстрирует типичные ситуации, возникающие при классификации. Для подавляющего большинства округов выделяется довольно четкая полоса достоверных участков. Вправо и/или вниз от нее тянется шлейф недостоверных участков, форма и размер которого зависят от методов и масштабов фальсификаций, характерных для конкретного округа. Наконец, между достоверными и недостоверными участками, как правило, имеется узкая прослойка из подозрительных участков.

Рис. 6. Примеры зависимостей явки за оппозицию от общей явки для разных округов

Размер точек соответствует числу зарегистрированных на участке избирателей (менее 200, менее 500, менее 2 тыс. и от 2 тыс. чел.).

Регрессионная прямая описывает взаимосвязь между переменными для достоверных участков.

Среднеквадратичное отклонение достоверных участков от регрессионной прямой почти для всех округов попадает в диапазон 0,6÷1,1% пункта, что находится в разумном согласии со средней численностью избирательных участков около 1 тыс. чел. Если при вычислении параметров регрессионной зависимости учитывать не только достоверные, но и подозрительные участки, то почти для всех округов отклонение оказывается в диапазоне 0,7÷1,6% пункта.

Зарубежные участки (с номерами 8000+) классифицировались в худшем случае как подозрительные, т.к. их совокупность слишком разнородна, чтобы по ней можно было делать выводы о недостоверности, а, кроме того, для части из них списки избирателей составлялись постфактум, что вело к завышению явки. Теоретически такая мягкость может привести к недоучету фальсификаций. Однако по официальным данным за рубежом проголосовали всего 0,4% избирателей, так что масштаб возможных искажений реконструкции пренебрежимо мал.

 

Структура фальсификаций

 

 

Понятие о достоверности результатов выборов

 

По итогам реконструкции результатов каждый округ может быть охарактеризован их достоверностью, измеряемой либо долей достоверных (нижняя оценка) или достоверных и подозрительных (верхняя оценка) участков, либо долей зарегистрированных на них избирателей.

Измерение достоверности как по участкам, так и по избирателям необходимо в силу существенной зависимости уровня фальсификаций от размеров избирательного участка. Как можно видеть из рис. 7, наименее достоверны участки с 1÷4 сотнями избирателей, а наиболее – с 2÷3 тысячами. Таким образом, большие участки (типичные для крупных городов) в целом менее подвержены фальсификациям, в силу чего достоверность по избирателям выше достоверности по участкам.

Рис. 7. Достоверность результатов по участкам в зависимости от их размера

Вероятность того, что участок оказывается достоверным, убывает по мере роста его размера для 10% самых малых и 10% самых больших участков и возрастает для 60÷70% участков промежуточного размера.

Избирательные участки, отсортированные по размеру, обрабатывались в окне шириной в 1 тыс. шт.

Вертикальной сеткой показаны квантили распределения участков по размеру: штриховые линии – 25%, пунктирные – 5%.

Рассмотрим распределение ОИК и ТИК по достоверности результатов, измеренной по избирателям. Для этого упорядочим ИК рассматриваемого в порядке возрастания этой величины и при продвижении по этому списку будем суммировать долю избирателей, зарегистрированных на этих ИК. Полученные зависимости представлены на рис. 8. Как можно видеть, примерно 20% избирателей приписаны к территориям, где достоверных участков нет вовсе. На уровне округов картина более размыта, однако графики в их левой части имеют очень пологие участки, завершающие при достижении охвата избирателей в 20÷25%. Таким образом, можно считать, избирательные права, как минимум, пятой части электората нарушены тотально.

Рис. 8. Кумулятивное распределение ИК по достоверности результатов

Ордината графиков вычислялась как электората, зарегистрированных в округах и территориях, где достоверность по избирателям не превосходит абсциссы.

Подъем графиков над началом координат соответствует тем ОИК и ТИК, где результаты были фальсифицированы полностью.

 

Частичная верификация реконструкции

 

Если проведение осмысленной прямой, связывающей явку за оппозицию с общей явкой, оказывается невозможным, результаты выборов во всем округе считаются фальсифицированными полностью. Кроме того, определим их как фальсифицированные почти полностью, если верхняя оценка достоверности не превышает 7% по участкам и 14% по избирателям. Значения порогов выбраны так, что под ними оказываются одни и те же округа, тогда как увеличение порогов приведет к включению в список уже разных округов в зависимости от того, ориентироваться ли на достоверность по участкам или по избирателям.

Результаты выборов 2016 г. было полностью сфальсифицированы в 18 округах, на которые приходится 8,6% участков и 8,1% избирателей страны, хотя по официальным данным здесь проголосовали 14,3% избирателей, принявших участие в выборах, а партия власти получила 21,5% всех поданных за нее голосов. Почти полностью результаты были сфальсифицированы еще в 15 округах, охватывающих 7,6% участков и 6,6% избирателей, но 10,0% участия и 12,2% голосов за партию власти.

Эти 33 округа, сводка по которым дана в табл. 4, полностью покрывают Башкортостан, Дагестан, Ингушетию, Кабардино-Балкарию, Карачаево-Черкесию, Мордовию, Северную Осетию, Татарстан, Тыву, Чечню, Кемеровскую и Тюменскую области, а также частично – Саратовскую область (3 округа из 4) и Краснодарский край (2 округа из 8). В этом списке содержатся без исключения все субъекты федерации и округа, ранее уличенные в сильном нарушении равновероятности ПЦ и исключительно низкой доле НДБ.

Таблица 4
Избирательные округа с особо высоким уровнем фальсификаций
Субъект федерацииПолностью сфальсифицированыПочти полностью сфальсифицированы
Башкортостан Уфимский, Благовещенский, Белорецкий, Нефтекамский, Салаватский, Стерлитамакский
ДагестанСеверный, Центральный, Южный 
ИнгушетияИнгушский 
Кабардино-БалкарияКабардино-Балкарский 
Карачаево-ЧеркесияКарачаево-Черкесский 
Кемеровская обл.Кемеровский, Прокопьевский, НовокузнецкийЗаводский
Краснодарский кр. Туапсинский, Тихорецкий
Мордовия Мордовский
Саратовская обл. Саратовский, Балашовский, Энгельсский
ТатарстанПриволжский, Московский, Нижнекамский, Набережночелнинский, Альметьевский, Центральный 
Северная Осетия Северо-Осетинский
Тыва Тывинский
Тюменская обл.Тюменский, Заводоуковский 
ЧечняЧеченский 

На рис. 9 сопоставлены итоги разных тестов. Легко видеть, что если результаты голосования в округе с точки зрения возможности их реконструкции оцениваются как (почти) полностью фальсифицированные, то и равномерность распределения последних цифр будет, скорее всего, нарушена, и доля недействительных бюллетеней окажется аномально низкой. Такое единодушие разных подходов, с одной стороны, показывает, что при тотальных фальсификациях способ их выявления непринципиален, а с другой – позволяет надеяться, что и для частичных фальсификаций предложенная методика реконструкции дает адекватные результаты.

Рис. 9. Доля недействительных бюллетеней (НДБ) в зависимости от показателя уровня значимости и достоверности результатов

Все округа из табл. 4 имеют долю НДБ < 1,5% и подавляющее большинство из них проваливает тест на однородность последних цифр в системах счисления с основанием \(d=7÷13\) (десятичная система здесь для простоты тоже учтена в \(\alpha^\prime\)).

Врезка показывает, что при низкой достоверности результатов нет округов с большой долей НДБ, а при высокой – с маленькой, за счет чего возникает положительная корреляция между этими характеристиками (\(R=0.59\) без подозрительных участков и \(R=0.67\) с подозрительными участками).

 

Избиратели-зомби и административный ресурс

 

Анализ взаимосвязи между общей и частной явками позволяет сделать важные выводы не только о фальсификациях результатов голосования, но и о фальсификациях его процедуры, обусловленных использованием административного ресурса.

Зависимость явки за оппозицию \(A\) от общей явки \(T\) описывается формулой \(A=k\cdot(T−Z)\), в которой \(Z\) (координата пересечения регрессионной прямой с осью абсцисс) задает гипотетическую явку, при которой все избиратели, принявшие участие в голосовании, поддержали бы партию власти. Таких избирателей будем называть зомби, поскольку их электоральное поведение обусловлено, скорее всего, не осознанным выбором, а преференциями в агитации, которые имеет партия власти.

При равных условиях конкуренции партий явка за них должна быть примерно пропорциональна общей явке, т.е. величина \(Z\) должна флуктуировать около 0. Однако анализ показывает, что \(Z>0\) в 204 из 208 округов, для которых возможно определить параметры регрессионной зависимости. Верхняя и нижняя децили для распределения округов по доли избирателей-зомби равны 1,3% и 9,1%, а квартили – 3,2%, 5,2% и 7,4% (при расчете округа учитывались с весом, равным числу избирателей, зарегистрированных на достоверных участках).

Приведенные значения подтверждают ставшее общим местом представление, что административный ресурс добавляет партии власти примерно 5%. Но эти проценты – от всего электората, а доля, которую зомби составляют от его политически активной части, существенно выше. И именно отношение \(Z/T\) определяет относительное падение результата оппозиции, обусловленное административным ресурсом (соответственно, при \(Z=0\) независимо от общей явки результат оппозиции оказывается равен угловому коэффициенту регрессионной зависимости \(k\)). Поэтому власти очень выгодно не только зомбировать избирателей, но и работать на сокращение явки, несмотря на то, что это уменьшает легитимность выборов.

Отметим, что к приводимым количественным показателям роли административного ресурса следует относиться с некоторой осторожностью. Лежащие в их основе регрессионные параметры \(k\) и \(Z\) определяются для каждого округа независимо и в силу малых объемов анализируемых выборок имеют значительные погрешности. Дополнительным фактором искажения может оказаться и предположение о линейном характере изучаемой зависимости, справедливость которого за пределами области наблюдаемых явок неочевидна.

 

Результаты реконструкции

 

 

Общефедеральный округ

 

Распространение параметров множества достоверных участков на все участки дало для выборов 2016 г. результаты, приведенные в табл. 5 (3‑я колонка). Для всех реконструируемых величин указывается диапазон значений, границы которого получаются отнесением всех подозрительных участков либо к достоверным, либо к недостоверным.

Таблица 5
Официальные и реконструированные результаты парламентских выборов
Электоральная характеристикаРоссия–2016Россия–2011Москва–2011
Достоверность результатов выборов, %избиратели40÷5240÷4821÷27
участки27÷3626÷3221÷28
Разница, % пунктов14÷1614÷16–1÷0
Проголосовало избирателей, млнофициально52,665,64,33
реально38,9÷40,154,3÷54,93,51÷3,57
Вброшено голосов, млн12,6÷13,710,7÷11,40,76÷0,82
Общая явка, %официальная47,860,160,9
реальная35,4÷36,449,7÷50,349,4÷50,2
Завышение активности избирателей, % от реальной31÷3520÷2121÷23
Проголосовали за оппозицию, млн чел.официально24,133,32,32
реально25,138,0÷38,42,69
Переброшено голосов, млн1,04,8÷5,10,37
Явка за оппозицию, %официальная21,930,532,6
реальная22,834,8÷35,137,8
Занижение поддержки оппозиции, % от реальной4,01314
Проголосовали за партию власти, млн чел.официально28,532,42,01
реально13,8÷15,015,9÷16,90,82÷0,88
Общий объем фальсификаций, млн голосов13,5÷14,715,5÷16,51,13÷1,19
Доля переброса голосов в структуре фальсификаций, %7,13132
Явка за партию власти, %официальная25,929,628,3
реальная12,5÷13,614,5÷15,411,5÷12,4
Завышение поддержки партии власти, % от реальной90÷10792÷104129÷146
Результат партии власти, %официальный54,249,346,5
реальный35,4÷37,429,3÷30,723,3÷24,6
Завышение результата партии власти, % от реального45÷5361÷6889÷99
Избиратели-зомби, %от электората5,0÷5,48,1÷8,38,2÷10,3
от общей явки13,8÷15,216,4÷16,616,3÷20,8
Гипотетический истинный результат партии власти, %при 100%-явке27,2÷29,221,8÷22,712,6÷16,8
без зомби22,8÷25,214,6÷15,32,3÷9,1
Гипотетическое завышение реального результата партии власти, %подавлением явки28÷3034÷3547÷85
зомбированием49÷55100÷101170÷900%
Предельное завышение результата партии власти, раз2,2÷2,43,2÷3,45÷20

Помимо собственно реальных результатов выборов наибольший интерес представляют точные масштабы их фальсификации – завышение общей явки, явки за партию власти и ее результата (выделены жирным шрифтом). Бонусом служат верхние оценки искажений, связанных с использованием административного ресурса, которые оказываются соизмеримы с результатами фальсификаций.

Для лучшего понимания полученных результатов их полезно сравнить с аналогичной реконструкцией для выборов Госдумы прошлого созыва (4‑я колонка табл. 5). Из-за того, что в 2011 г. было значительно меньшее число избирательных округов, чем в 2016 г. (135 против 226), в некоторых из них сошлись очень разнородные участки. Поэтому для выборов 2011 г. нельзя исключать систематической переоценки фальсификаций, могущей достигать нескольких единиц в третьей значащей цифре.

По сравнению с VI созывом Госдумы в выборах ее VII созыва участвовало на 15 млн чел. меньше, из которых потери оппозиции составили 13 млн, а власти – 2 млн избирателей. Общая явка уменьшилась на 14% пунктов, а результат партии власти вырос на 6÷7% пунктов.

В 2016 г. вброшено было на 2 млн голосов больше чем в 2011 г., а переброшено на 4 млн меньше, в результате чего роль переброса голосов в структуре фальсификаций радикально сократилась. При этом их общий уровень почти не изменился – вброшен или переброшен почти каждый второй голос, якобы отданный за партию власти.

Доля избирателей-зомби в электорате сократилась на 3% пункта, а ее отношение к явке – примерно на 2. На фоне роста популярности партии власти это привело к существенному уменьшению роли административного ресурса, которая, тем не менее, остается огромной. Впрочем, необходимо напомнить, что ее оценка носит лишь справочный характер без претензий на тот же уровень точности и обоснованности, что и остальные части реконструкции.

 

Одномандатные округа

 

В 2016 г. были возрождены выборы по мажоритарной системе. К сожалению, надежная реконструкция их результатов практически невыполнима. Если для общефедерального округа можно суммировать результаты по всем достоверным участкам страны, уменьшая тем самым роль флуктуаций, то победителя в каждом одномандатном округе необходимо определять независимо. Однако во многих округах просто нет необходимого для этого количества достоверных участков. Кроме того, в случае, когда победитель получает всё, возникает специфический тип фальсификаций, связанных с целенаправленным перебросом голосов кандидату власти от наиболее сильного конкурента. И очень сложно установить, в какой мере переброс носил именно такой характер.

Как бы то ни было, победа партии власти в одномандатных округах была оглушительной: из 225 депутатов от нее были избраны 204 и только 21 – от других партий. При этом лишь в 3 округах представители партии власти проиграли выборы, а в остальных 18 она просто не выставила кандидатов. Провести в парламент 98,6% выдвинутых кандидатов только с помощью административного ресурса и фальсификаций результатов нереально.

Дело здесь в самой мажоритарной системе, которая при слабом гражданском обществе оказывается антидемократическим институтом. Непропорциональное представительство принципиально плохо тем, что при достаточно изощренном манипулировании процедурой выборов можно добиться их произвольного результата вообще без каких бы то ни было фальсификаций. Ну, а для резкого усиления их эффекта никакие манипуляции и не требуются, а достаточно наличия всего одной пороговой нелинейности.

Если исключить нелинейность из процедуры выборов по одномандатным округам, просто просуммировав по ним официальные результаты, то на долю партии власти придется лишь 123 мандата вместо 204. Если же еще и реконструировать результаты с помощью той же методики классификации участков, которая применялась для общефедерального округа, то результат партии власти упадет до 62÷72 мандатов. Иначе говоря, прямые фальсификации дали ей лишь 25÷30% представительства, а их усиление за счет мажоритарной системы – 40%. Таким образом, общее завышение результата партии власти, связанное как с фальсификацией результатов голосования, так и с манипулированием его процедурой, оказывается трехкратным даже без учета административного ресурса.

 

Верификация методики

 

 

Сравнение сильной и слабой реконструкций для Москвы

 

Для проверки предложенной методики были использованы результаты парламентских выборов 2011 г. по Москве. В работе 4 для них (без учета спецучастков) была выполнена реконструкция в сильной постановке, выявившая переброс около 0,32 млн голосов и вброс не менее 0,63 млн. Возможность получения лишь нижней оценки для вброса обусловлена тем, что ему не препятствует использование электронных урн, однако, практически исключающее переброс голосов.

Реконструкция тех же результатов в слабой постановке представлена в 5‑й колонке табл. 5. При этом следует отметить, что для столицы нет оснований сомневаться в социальной однородности округов 2011 г., которая для страны в целом могла привести к переоценке фальсификаций.

При переходе от сильной реконструкции к слабой переброс возрастает лишь на 17% (0,05 млн голосов), тогда как вброс – уже на 20÷30% (0,13÷0,19 млн). Большее относительное увеличение оценки вброса, скорее всего, связано с тем, что в рамках сильной реконструкции он был недооценен. Однако даже с учетом этого замечания общее увеличение размеров фальсификаций обоих типов представляется довольно значительным. Можно предположить, что оно обусловлено систематической недооценкой фальсификаций в силу особенностей методики, использованной в работе 4, где реконструкция проводилась не на уровне участков, а на уровне территорий из-за того, что внутри них нарезка участков меняется от выборов к выборам. Учитывая крайне низкий общий уровень достоверности выборов 2011 г. в Москве, нельзя исключать, что на каждой территории имелись недостоверные участки, однако при их не очень большой доле территория воспринималась в целом как достоверная, что и порождало систематические искажения.

Еще сильнее разница между вариантами реконструкции может увеличиться, если учитывать спецучастки. В сильной постановке спецучастки должны считаться достоверными, если нет прямых подтасовок (что, к сожалению, почти невозможно проверить, из-за чего спецучасти и были исключены из анализа), тогда как в слабой они имеют высокие шансы оказаться недостоверными. Дело в том, что на спецучастках избиратели менее свободны как в принятии решения об участии в голосовании, так и в доступе к информации об оппозиционных партиях, что может увеличивать там общую явку и уменьшать явку за оппозицию по сравнению с обычными участками. Тем не менее, с точки зрения анализа взглядов политически-активной части населения низкий уровень достоверности спецучастков вполне закономерен, поскольку голосующие там избиратели свой выбор по большей части не могут не только отстаивать, но даже и осознавать.

С учетом сделанных замечаний результаты слабой реконструкции на московском материале представляются адекватными. Ее более агрессивные оценки фальсификаций вполне соответствуют содержательным различиям между сильной и слабой постановками, а отчасти могут быть отнесены и на счет несовершенства методики реконструкции в сильной постановке.

Особый интерес представляет сравнение картин фальсификаций выборов 2011 г. в России и в Москве. Для них практически одинаковы завышение активности избирателей и занижение поддержки оппозиции. Однако поддержка партии власти и ее результат были завышены в столице значительно сильнее, чем в стране в целом. А эффект от использования административного ресурса оказался столь велик, что не поддается надежной оценке. И, наконец, в Москве отсутствовало превышение достоверности результатов по избирателям над достоверностью по участкам, что является характерной чертой электорального султаната, а не современного мегаполиса, статус которого был восстановлен столицей лишь в результате всплеска протестной активности. Наглядное подтверждение такой характеристики уровня московских фальсификаций 2011 г. можно видеть на рис. 10.

Рис. 10. Зависимость явки за оппозицию от общей явки для всех округов Москвы в 2011 г.

Как и для рис. 6 классификация участков проводилась по округам, а затем результаты были объединены. Поскольку области достоверных, подозрительных и недостоверных участков для разных округов слегка различаются, на итоговой картинке они немного перекрываются.

 

Гипотезы Собянина–Суховольского и Шпилькинае

 

Кроме верификации предложенной методики интересно использовать и ее саму для верификации других методик. Классические подходы к реконструкции результатов в слабой постановки основываются на использовании гипотезы Собянина–Суховольского (ГСС) 5 или обобщающей ее гипотезы Шпилькина (ГШ) 6, 7, 8. Первая из них предполагает независимость результатов партий от общей явки, вторая требует одинаковой (с точностью до коэффициента) зависимости от нее числа набранных партией голосов.

ГСС эквивалента предположению об отсутствии избирателей-зомби, что при реконструкции результатов выливается в необходимость одновременно исключать из официальных данных как последствия фальсификаций, так и вклад административного ресурса. Однако с точки зрения каждой из этих задач исходная постановка другой выглядит нормальными условиями. Поэтому при попытке их одновременного решения оба типа искажений будут маскировать друг друга, порождая неинтерпретируемые результаты.

В случае более сильной ГШ указанная сложность может оказаться не столь принципиальна, поскольку оперирование зависимостью, а не с одним числом оставляет больше степеней свободы для независимой обработки разных искажающих факторов. К сожалению, методика реконструкции, основанная на ГШ, сталкивается с проблемой иного рода. Реконструкция результатов выборов 2016 г., проведенная самим С.А. Шпилькиным для субъектов федерации, показала умеренный уровень фальсификаций для Башкортостана, Северной Осетии и Кемеровской области и вовсе не выявила фальсификаций в Ингушетии, Кабардино-Балкарии и Чечне. Иначе говоря, с точки зрения ГШ результаты выборов могут выглядеть правдоподобно даже при очень высоком уровне фальсификаций, если те выполнены однотипно. Однако такие фальсификации легко выявляются на основе ГШ при рассмотрении не отдельных субъектов, а страны в целом.

И здесь мы сталкиваемся с фундаментальной проблемой обеих рассматриваемых гипотез. Они вполне правдоподобны при рассмотрении социально-однородных регионов, однако могут оказаться неверны в случае целых стран (и, по крайней мере, для ГСС известно, что в некоторых вполне демократических странах она не работает). Используя проведенную ранее реконструкцию результатов выборов 2016 г., проверим применимость этих гипотез к России. На рис. 11 представлено условное распределение результата власти в виде зависимости некоторых его квантилей от явки.

Рис. 1. Квантили условного распределения результата партии власти

Уровень квантиля определяет вероятность того, что при данной явке результат лидера превышает ординату графика.

Избирательные участки, отсортированные по величине явки, обрабатывались в окне шириной в 2,5 тыс. штук и учитывались с весом, равным числу зарегистрированных избирателей.

Квантили распределения явки, обозначенные вертикальной сеткой (штриховые линии – 25%, пунктирные – 5%), рассчитаны отдельно для достоверных и для подозрительных и недостоверных участков.

Для достоверных участков графики в левой части демонстрируют небольшое, но вполне заметное убывание. Это и есть эффект избирателей-зомби, вклад которых в результат размывается по мере нарастания явки. В правой части график 5%-квантили немного поднимается, что может означать проникновение в выборку небольшого числа участков, которые, наверное, следовало бы счесть подозрительными. Тем не менее, в целом можно считать, что обе гипотезы удовлетворительно выполняются для достоверных участков в масштабе страны, а значит, потенциально пригодны для реконструкции результатов выборов.

Для подозрительных и недостоверных участков результат партии власти отчетливо увеличивается с явкой, что обусловлено масштабными фальсификациями. Небольшое убывание в самой левой части графиков говорит о том, что среди подозрительных участков, увы, оказалось некоторое число достоверных. Провал графиков квантилей уровня 50%+ в самой правой части графика связан с тем, что среди участков с экстремально высокой явкой доля недостоверных ниже, чем среди участков с просто высокой. Дело в том, что явка, близкая к 100%, может возникать не только из-за фальсификаций, но и из-за того, что либо списки избирателей составляются лишь по факту их прихода к урнам (таковы многие зарубежные участки и, предположительно, участки Тывы), либо из-за того, что избиратели изначально находятся на избирательном участке (таковы спецучастки, где вопрос, идти голосовать или нет, не стоит). Однако даже этот эффект не опускает графики до уровня достоверных участков, так что в российском случае значительное отклонение результатов выборов от ГСС и ГШ может служить индикатором фальсификаций.

Так же как и методика реконструкции результатов выборов, предложенная в настоящей статье, все методики, основанные на рассматриваемых гипотезах, связаны с разделением массива результатов на достоверную и недостоверную части и распространением электоральных характеристик первой на всю страну. То есть, речь идет о реконструкции в слабой постановке, результаты которой можно сравнить с приведенными выше. Для этого были выбрана реконструкция, выполненная С.А. Шпилькиным (в скобках – соответствующие величины из табл. 5):

  • в 2011 г. результат партии власти – 34,0% (29,3÷30,7%), явка за нее – 15,7% (14,5÷15,4%), а общая явка – 46,1% (49,7÷50,3%) 7;
  • в 2016 г. результат партии власти – 40,5% (35,4÷37,4%), явка за нее – 14,9% (12,5÷13,6%), а общая явка – 36,8% (35,4÷36,4%) 8.

Таким образом, реконструированный результат партии власти оба раза получился на 3÷5% пунктов выше, чем у автора. Но разница эта возникла разными путями. Если в 2011 г. она проистекает преимущественно из недооценки общей явки, то в 2016 г. – из переоценки явки за партию власти.

Первое из указанных расхождений обусловлено тем, что ГШ позволяет видеть лишь вброс голосов, но замечает их переброса (в связи с чем реконструированные данные по поддержке оппозиции и явке за нее совпадают с официальными). Поэтому масштабный переброс голосов в 2011 г. вылился в дискриминацию части результатов, сочетавших уже фальсифицированную явку за партию власти с высокой, но еще честной общей явкой, что и привело к недооценке ее реконструированного значения.

Второе расхождение менее тривиально и связано с тем, что методика реконструкции исключает лишь те голоса за партию власти, количество которых не пропорционально количеству голосов за прочие партии, поданных при той же общей явке. Однако при чрезмерном полете фантазии фальсификаторов количество голосов, выдуманных оппозиции, может оказаться больше реального, т.е. возникает неумышленный вброс и за нее. В этом случае в реконструкции по Шпилькину сохраняется некоторая часть голосов, выдуманных и партии власти, тогда как в авторской методике участки с запредельными цифрами гарантировано исключаются из анализа, не повлияв ни на чьи результаты. Именно этим обстоятельством объясняется переоценка С.А. Шпилькиным явки за партию власти – еще небольшая в 2011 г., но заметно подросшая к 2016 г. благодаря увеличению в структуре фальсификаций доли вброшенных голосов, в т.ч. посредством рисования цифр.

 

Выводы

 

Тест на равновероятность последних цифр целочисленных электоральных характеристик выявляет наиболее грубые и примитивные подтасовки, связанные с вписыванием в избирательные протоколы выдуманных или целевых чисел. По итогам выборов 2016 г. этот элементарный тест провалили 25 округов и 59 территорий из всего 12 субъектов федерации. Такая географическая концентрация означает, что эти субъекты, охватывающие более 14% электората, попадают под подозрение целиком.

Тест на независимость доли недействительных бюллетеней от явки не только полностью подтверждает эти подозрения, но и позволяет выявлять фальсификации уже не в розницу, а оптом. На основе данных по той части результатов, которая подверглась наименьшим искажениям, удалось оценить вброс бюллетеней в ⅓ от их реального количества.

Фальсификации, выявляемые двумя простейшими тестами, оказываются достаточно велики, чтобы существенно исказить результаты выборов.

Для избирательных округов зависимость явки за оппозицию от общей явки хорошо аппроксимируется прямой. Сдвиг точек относительно нее, вызванный любыми фальсификациями, происходит только в одну сторону, что позволяет разделить участки на достоверные и недостоверные. При этом распространение результатов, зафиксированных на достоверных участках, на всю страну позволяет решить задачу реконструкции результатов выборов в ее слабой постановке, а анализ отклонения зависимости между частной и общей явками от прямой пропорциональности – дополнительно оценить влияние на результаты административного ресурса.

Таким образом, разработан эффективный инструментарий для восстановления истинных политических предпочтений избирателей в той части, в которой она искажена фальсификацией результатов выборов, и намечены пути ее восстановления в той части, в которой она искажена фальсификацией их базовых принципов.

На выборах 2011 г. за счет фальсификаций общая явка была завышена на пятую часть, явка за партию власти – вдвое, а ее результат – почти на две трети. Увеличить его еще до двух раз позволил административный ресурс, т.е. общее завышение было примерно трехкратным.

На выборах 2016 г. за счет фальсификаций общая явка была завышена уже на треть, явка за партию власти – также вдвое, а ее результат – лишь на половину. Увеличить его еще до полутора раз позволил административный ресурс, т.е. общее завышение было примерно двукратным.

За 5 лет реальная поддержка партии власти несколько увеличилась, а роль административного ресурса уменьшилась. При этом активность избирателей заметно упала и фальсификации результатов выборов почти полностью свелись к вбросу голосов с резким сокращением их переброса.

Новым инструментом искажения политических предпочтений избирателей стали выборы по мажоритарной системе. Их пороговый характер, амплифицируя фальсификации, дал как минимум трехкратное завышение результата кандидатов власти.


В заключение хотелось бы выразить глубокую признательность В.С. Столярову, чья научная интуиция позволила на раннем этапе работы выделить рассмотренные в статье тесты как наиболее перспективные, и С.А. Шпилькину, скачавшему с сайта ЦИК первичные данные результатов федеральных выборов и выложившему их в открытый доступ в удобном формате.

 

Библиография

 

  1. Столяров В. Про арифметику и немножко про выборы// Троицкий вариант – наука. 13 мар. 2012 г., №5(99), с.10‑11.
  2. Kobak D., Shpilkin S., Pshenichnikov M.S. Integer percentages as electoral falsification fingerprints// Ann. Appl. Stat. 2016, 10(1), p.54‑73.
  3. Вентцель Е.С.Теория вероятностей. – М.: Наука, 1964. – 576 с.
  4. Подлазов А.В. Опыт изучения московской электоральной статистики (по итогам выборов)// Социологические исследования. 2014, №6(362), с.77‑88.
  5. Собянин А.А., Суховольский В.Г. Демократия, ограниченная фальсификациями: Выборы и референдумы в России в 1991–1993 гг. – М.: ИНТУ, 1995. – 266 с.
  6. Шпилькин С. Статистическое исследование результатов российских выборов 2007–2009 гг.// Троицкий вариант – наука. 27 окт. 2009 г., №21(40), c.2.
  7. Шпилькин С. Математика выборов – 2011// Троицкий вариант – наука. 20 дек. 2011 г., №25(94), с.2‑4.
  8. Шпилькин С. Двугорбая Россия// Троицкий вариант – наука. 4 окт. 2016 г., №20(214), с.1‑3.