Исправленному верить Константин Сонин рассказал об анализе фальсификаций на выборах 2011 года: Наука и техника: Lenta.ru

В конце декабря 2012 года в журнале Proceedings of the National Academy of Sciences появилась статья ученых из РЭШ Рубена Ениколопова, Василия Коровкина, Марии Петровой и Константина Сонина и Алексея Захарова из Высшей школы экономики, в которой они обратились к теме фальсификаций на выборах в Государственную думу в декабре 2011 года в Москве.

Исследователям удалось поставить масштабный эксперимент (pdf), позволивший обнаружить два замечательных эффекта. Первый: результаты выборов на участках с наблюдателями и без таковых заметно различались. Второй: это различие было не в пользу "Единой России" - ученым удалось даже оценить примерный масштаб фальсификаций в Москве, который составил как минимум 10,8 процента. О мировом и отечественном опыте исследования электоральных фальсификаций, о том, какими методами пользовались исследователи, как их результаты связаны с прежними исследованиями и почему простота дураков обманчива, "Лента.ру" расспросила одного из авторов работы, проректора РЭШ Константина Сонина.

"Лента.ру": Расскажите, пожалуйста, немного об истории вопроса.

Константин Сонин: История анализа российской фальсификации для меня лично началась в 2007 году. Тогда я прочитал в блоге Александра Киреева (это такой электоральный географ), что, конечно, мол, фальсификации были, но они не превышают одного-двух процентов. И я тогда же, на следующий день после декабрьских выборов, написал у себя в ЖЖ пост про сравнение двух московских участков - в одном был изгнан наблюдатель (от "Яблока", кажется), а в другом - нет. Я посмотрел, как эти участки голосовали в 2003 году. Это было не так просто сделать, потому что участки переименовали и нужно было проделать работу по изучению, какие дома к какому участку относились. И стало видно, что результаты на этих участках были одинаковыми в 2003 году, а в 2007-м "Единая Россия" на одном из них получила чуть ли не вдвое больше голосов, чем в 2003-м.

Я тогда написал, что не понимаю, почему все считают, что фальсификации маленькие. Конечно, один пример - всего два участка, две временные точки и две географические - не дает права оценивать размер фальсификации по стране. Но это, как мне казалось, должно поколебать веру в тезис, что, мол, все и так за "Единую Россию", какая разница, как считать голоса.

Вот я написал тот пост, а потом оказалось, что у него было совсем неожиданное последствие: его прочитал Сергей Шпилькин, и с этого началось его занятие электоральной математикой, так сказать. Он потом сделал гораздо больше, чем мы все (авторы оригинальной работы - здесь и далее прим. "Ленты.ру"), для анализа данных по российским выборам.

Константин Сонин. Фото: Митя Алешковский / ИТАР-ТАСС
Lenta.ru

А что-нибудь про исторический, мировой опыт? Вот вы ссылаетесь, например, в работе на анализ выборов в Гане.

Мировая политологическая наука начиналась с изучения тех стран, которые мы сейчас называем развитыми демократическими странами. Поэтому, если смотреть на политологическую науку как на науку, она очень долгие годы была наукой, изучающей исключительно демократию. Все в ней было предназначено для демократии, и, соответственно, электоральные фальсификации изучались не как какой-то специальный феномен, а как патология. О них рассуждали в основном практики - скажем, американский сенатор выигрывал выборы с помощью какого-то воровства голосов, его оппонент подавал в суд, были судебные разбирательства - вот эта вот история и изучалась.

Например, у лауреата Пулитцеровской премии Роберто Каро есть замечательная книга, биография американского президента Линдона Джонсона. Так вот, второй том его книги целиком посвящен выборам (это примерно страниц 600), которые Линдон Джонсон выиграл с помощью небольших фальсификаций. Небольших в том смысле, что они составили какие-то десятые - сотые доли процента относительно числа проголосовавших. То есть он украл несколько тысяч голосов из нескольких миллионов. Но там исключительно "клиническая история болезни": как люди воруют голоса, переписывают протоколы и как потом суды с этим разбираются.

Но так было до недавнего времени. Примерно 15-20 лет назад политологи стали больше интересоваться тем, что происходит в менее развитых странах. И, конечно же, появились работы про смысл электоральных фальсификаций, их оценку. Мы, в частности, ссылаемся только на работы по оценке, но упоминаем и те работы, которые говорят про смысл, потому что иногда это загадочная вещь.

А на каком этапе развития сейчас эта наука? Скажем, в сфере математических методов?

Там везде так или иначе применяются математические методы. Что значит, на каком этапе? Фальсификации - это всегда динамическая вещь, потому что каждый следующий фальсификатор, конечно, статей не читает, но пытается каким-то образом использовать ошибки предыдущих. Это мы наглядно видели на мартовских выборах в Москве (про другие города не знаю) - там методы фальсификаций были отличными от декабрьских. В марте, например, людей регистрировали как работников производств на непрерывном цикле и всякое такое. Такого в декабре не было - то есть предыдущий опыт был учтен. Но анализ ведь позволяет нам узнать, что в стране происходило на самом деле.

Если же вы спрашиваете, есть ли у этих научных результатов какие-то реальные последствия, то я бы сказал, что таких прямых последствий нет. Но политические последствия фальсификаций, конечно, есть.

Я-то про другое, конечно, спрашивал. В своем посте, в котором вы упоминаете вашу работу, вы пишете, что это довольно маргинальная тема.

Да.

Вот я и спрашиваю, есть ли уже в этой науке некие постулаты, теории? Развивается ли она? И если да, то насколько активно? Или все этой темой занимаются вскользь?

Тех статистических методов, которые сейчас используются, еще 15-20 лет назад не существовало, то есть статистический анализ стал мощнее. Мы эти методы не использовали, но те люди, которые предполагают какое-то распределение и показывают, в чем состоят отличия от него, пользуются в каком-то смысле международным опытом. То есть чем больше выборов в мире мы изучаем, тем больше мы знаем, что всякий раз, когда есть ненормальное распределение, это почти точно указывает на фальсификации. Понимаете, экономику (здесь все пересекается - экономика с политологией) лучше всего сравнивать с медициной. У нас есть большее понимание того, как протекает болезнь, и мы можем лучше ее лечить. Но это совсем не похоже, например, на аппендицит, который можно вырезать в любой районной клинике, тут сложнее.

Хорошо, что вы вспомнили про эти методы, я про них тоже хотел спросить. Ведь именно такого рода работы попали, так сказать, в фокус общественного внимания. Их же довольно сильно критиковали, говорили, что распределение может быть не только нормальным, но и логнормальным?

С одной стороны, серьезной критики не было. Было много болтовни, были какие-то слова со стороны оппонентов, но Чуров и те люди, которые с ним, совершенно безграмотные, среди них много пустозвонов. Так ведь бывает, что у человека формально есть какие-то математические достижения, образование, вот он и доказывает, что бывают двугорбые распределения. С одной стороны, как математически точное утверждение, это, конечно, так: действительно, двугорбые распределения в природе бывают. С другой стороны, распределение в Москве было нормальным (У нормального распределения один горб - прим. "Ленты.ру") в 2003 году, в 2007-м, а 4 декабря 2011 года стало вдруг ненормальным, а к 4 марта 2012 года вновь стало нормальным. Вероятно, любое событие может произойти. По мне, тот факт, что на 4 декабря выпала эта двугорбость, а во все остальные годы все было так, как должно быть, указывает на фальсификацию с такой очевидностью, что и говорить тут, собственно, не о чем. Я с такими пустозвонами и не пытался спорить, хотя среди них были и приличные, и честные люди.

<center> Распределение голосов за партию "Единая Россия" на участках без наблюдателей, с наблюдателями и на участках, где наблюдатели не зафиксировали нарушений. Иллюстрация из статьи Enikolopov et al., PNAS, 2012</center> — Распределение голосов за партию "Единая Россия" на участках без наблюдателей, с наблюдателями и на участках, где наблюдатели не зафиксировали нарушений. Иллюстрация из статьи Enikolopov et al., PNAS, 2012
Lenta.ru

Хорошо. Тогда давайте поговорим о той работе, которую вы проделали. Про историю вы уже немножко рассказали. Расскажите о методологии?

Методология чрезвычайно проста. Была группа людей от "Гражданина наблюдателя". Они распределили своих наблюдателей 4 декабря на 3164 участках случайным или, точнее, квазислучайным образом - наблюдатели были на первом, двадцать пятом, пятидесятом, семьдесят пятом участках. Поскольку ничего не говорит о том, что номера участков распределялись специально, то это фактически дает случайное распределение. В общей сложности в выборке было 156 участков.

Это дало возможность сравнить два типа участков: участки, на которых наблюдатели были, и участки, на которых их не было. Вот мы их и сравниваем по среднему значению проголосовавших за ту или иную партию. Благодаря этому нам удалось оценить размеры фальсификаций за "Единую Россию".

Нужно подчеркнуть: чтобы сравнение имело смысл, распределение наблюдателей должно быть случайным. Мой соавтор Рубен Ениколопов (профессор РЭШ, сейчас работает в Институте перспективных исследований в Принстоне) несколько лет тут, в Москве, всех пытался убедить проводить эти случайные эксперименты, то есть разбрасывать наблюдателей случайно. Я не знаю, почему "Гражданин наблюдатель" решил сделать именно так, - возможно, под влиянием этих попыток протолкнуть современные методы анализа.

И, собственно, почему они решили не по жребию распределять? Потому что этот случайный метод гораздо более прозрачен для окружающей публики. Он все равно не очень прозрачен, потому что нормальный человек, не с высшим образованием, теорию вероятностей, вероятностные концепции, как правило, плохо понимает. Из-за этого люди в целом не очень-то понимают, почему выборка из 156 участков дает очень точную оценку того, каким был масштаб фальсификаций.

Огромное количество вещей показывает, что случайность и результативность - это довольно сложные вещи. Вот самый простой пример. Опросите своих друзей, просто друзей или из фейсбука, кто из них ходил на Болотную площадь. У меня таких 20 или 30 процентов. Это значит, что выборка моих друзей совершенно нерепрезентативна, потому что иначе, если бы она была репрезентативной, на Болотной было бы 3 миллиона москвичей. Это очень распространенная вещь: люди плохо оценивают репрезентативность своих выборок.

Популярный аргумент: "Из моих друзей никто не голосовал за 'Единую Россию'".

Да, но у оппозиции, прямо скажем, нет монополии на эту ошибку. Точно так же Путин продолжает говорить про ностальгию по Советскому Союзу, хотя нет никаких причин думать, что кто-то кроме его окружения и его самого эту ностальгию испытывает. Но друг другу они про это говорят постоянно, и им кажется, что это все так думают.

Материалы по теме

Истина в цифрахКак математики ищут следы фальсификаций на выборах
6 декабря 2011

Вернемся, однако, к участкам.

Итак, у нас был материал для сравнения. Конечно, возник вопрос: что тут публиковать, ведь эти результаты уже были оглашены "Гражданином наблюдателем" 6 или 7 декабря, и тогда же была колонка Алексея Захарова в "Слоне". Но научный вклад нашей статьи в том, что мы аккуратно все записали, аккуратно объяснили, что было проделано, плюс еще выполнили некоторые проверки устойчивости. Проверка на устойчивость - это, грубо говоря, когда ученые предполагают другие (отличные от собственных) возможные объяснения того или иного явления и придумывают, с помощью какого теста эти альтернативные объяснения можно опровергнуть.

Какую проверку мы проводили здесь? Я еще раз вернусь к случайности назначения наблюдателей. Представьте, что, как на предыдущих выборах или как это было в других городах, наблюдатели пошли бы на те участки, на которые хотели, и мы получили бы сходные результаты. То есть оказалось бы, что среднее по участкам с наблюдателями отличается от среднего по участкам без наблюдателей. Что бы это означало? Это могло бы означать, что наблюдатели захотели пойти на вполне определенные участки, потому что, например, это их родные участки, на которых у "Единой России" аномально маленький процент голосов. У нас же получилась совсем другая картина. Поскольку мы получили разницу в результатах между участками с наблюдателями и участками без наблюдателей, а наблюдатели были распределены по участкам случайным образом (первый, 25-й, 50-й, 75-й в каждом из больших территориальных округов), то выходит, что разница в результатах возникает по причине, нам неизвестной.

Чтобы отвергнуть упреки в нерепрезентативности выборки, мы взяли данные 2007 года. Я это так говорю "взяли данные" - это интеллектуально очень просто взять данные. На самом деле этих данных в каком-то смысле не существует в природе. И все из-за российского ЦИКа. Надо понимать, что основным методом фальсификации чуровского ЦИКа являются вовсе не осмысленные действия (про них мне ничего неизвестно), а совершенно вопиющие бездарность и некомпетентность. Поэтому по 2007 году, например, нет никакой таблицы, которая позволяла бы сравнивать участки 2011 года с 2007-м. Не по злому умыслу, а просто потому что они совершенно никуда не годные профессионалы. И вот мы с помощью большой работы, она охватила примерно треть всех участков, которые были в 2007 году, по домам поставили в соответствие с участками 2011 года. Соответственно, мы получили довольно большую выборку и могли сравнить, отличались ли выбранные нами участки от остальных. И получилось, что в 2007 году они совершенно не отличались, то есть среднее по ним было тем же самым, что и среднее по всем участкам. Следовательно, тот факт, что сейчас, в 2011 году, это отличие имеется, и указывает на наличие заявленного нами "эффекта присутствия наблюдателя", снижающего процент фальсификаций.

Вот я вам и объяснил, как мы проверяли, что эти участки были репрезентативными, - с помощью данных 2007 года. Если кто-то испытывает недоверие, то он может провести такую же проверку и сравнить декабрьские выборы и мартовские - это проще, данные есть - и убедиться, что выборка репрезентативна. Мы это тоже проделали и отличий этих участков от других не обнаружили.

Хорошо. Вот, значит, выбрали - и какие результаты получились?

Основной результат заключается в том, что есть очень сильные статистические доказательства масштабных (как минимум 10,8 процента) фальсификаций (На выборах в Москве 4 декабря 2011 года "Единая Россия" набрала, по официальным данным, 46,5 процентов голосов - прим. "Ленты.ру")

Смотрите. Есть разные способы оценивать количественный размер фальсификаций. Например, то, что делают Сергей Шпилькин и его соавторы Кобак и Пшеничников. Они пытаются предположить, как выглядит правильная закономерность, и рассчитывают воровство голосов как отклонение от этой закономерности. У них метод дает более точные оценки размеров фальсификации, но он требует более сильных предположений (нам нужно знать вид "правильной" кривой).

В случае с нашими оценками, можно сказать, почти ничего не требуется, кроме минимальных предположений. Кстати, в Москве наши результаты очень точно совпадают с их результатами. Для нашей работы это мало что значит, а для них - подтверждает их результаты независимым способом.

Ваш результат существенно расходится с популярным в интернете аргументом, что фальсифицировать выборы более чем на 5 процентов невозможно.

Трудно себе представить, что это был какой-то человек уровнем ниже Суркова или Володина, который бы знал размах всей операции. Я даже не уверен, что и они, или там Путин или Медведев, знают. Вряд ли кто-то назначал конкретные цифры, расписывал проценты по участкам. Скорее всего, ночью просто стучали кулаком по столу: переделать протоколы, вбросить как можно больше...

Хорошо. Стало быть 10 процентов...

Результаты выборов в Госдуму 4 декабря 2012 года по Москве

"Единая Россия" - 46,5 процента

КПРФ - 19,4 процента

"Справедливая Россия" - 12,2 процента

ЛДПР - 9,5 процента

"Яблоко" - 8,6 процента

10 процентов - это минимальная оценка. Если мы посмотрим по тем участкам, по которым наблюдатели сообщили, что нет нарушений, то тогда оценка получается больше - до двадцати процентов. Наш основной результат никак не связан с тем, что сообщали наблюдатели. Наша оценка основана только на том, присутствовал наблюдатель на участке или не присутствовал. Можно отдельно посчитать, что было по тем участкам, где наблюдателей удалили. Там, где удалили, становится резко хуже. Но основной результат с этим не связан. Мы учитывали только данные ЦИК и данные о присутствии наблюдателей.

Вы сами видите какие-то альтернативные объяснения собственных результатов?

Все статистические доказательства - это по своему характеру доказательства косвенные. Но, как мы знаем по итогам президентских выборов, даже прямые доказательства, то есть записи видеокамеры, не принимаются для рассмотрения в суде. И все же мне кажется, что, если говорить про выборы в Москве в декабре 2011 года, то эти косвенные доказательства все доказали по самым строгим судебным критериям.

Как мы видим, нет.

Что это значит? Бывает, что судья отпускает преступника, но тогда это подрывает авторитет суда в наших глазах. Я не могу себе представить, что разумный человек, прочитавший нашу статью, согласится с тем, что Центризбирком компетентно провел выборы и подсчитал голоса. Но, конечно, в статье ничего не говорится о том, что они это специально сделали.

Тогда такой вопрос: вы делали аналогичное сравнение по президентским выборам?

Мы - нет. Потому что ни один из нас не работает в этой теме целенаправленно. Есть люди, которые этим занимаются. Мне кажется особенно интересным то, что это делает Кирилл Калинин из Мичиганского университета. Он занимается вопросом, который меня как гражданина с математическим образованием волнует: российские социологические фирмы, причем как те, у которых репутация кремлевских, придворных социологов, так и те, у кого репутация независимых социологов (ВЦИОМ, ФОМ, "Левада"), - они все предсказали результаты выборов с размером фальсификаций, который сейчас оценен.

Хотелось бы, раз сами социологи ничего про это не рассказывают, чтобы кто-то проанализировал такой феномен. Что это? Они действительно совершенно нечестные люди или они каким-то образом умеют как бы не чувствовать себя бессовестными, строить такие модели, которые автоматически подгоняют данные под желаемое? Этого же всегда можно добиться - просто модель вручную отстроить: подходящие данные оставить, неподходящие выбросить. В итоге, может быть, даже незаметно для себя с помощью каких-то процедур приходишь ровно к тому, к чему нужно было прийти. Мне было бы интересно про это узнать. Хотя я не понимаю: во всем мире социологические фирмы живут на заказы от бизнеса, потому что для крупных компаний это огромное дело - разного рода социологические опросы. Например, выпускает Apple какой-нибудь продукт, и одна закорючка в слове Apple в рекламном слогане может стоить, не знаю, десятки миллионов продаж, сотни миллионов долларов прибыли. Но кто размещает заказы у ФОМ, ВЦИОМ и "Левады", если известно, что они выдают результат, который им самим хочется получить? Чем то, что они делают, отличается от их экспертного мнения?

Какие-нибудь еще исследования в этом направлении ведутся? Может быть, кто-нибудь еще работает?

Я уверен, что про эти выборы люди пишут книги. То есть сидят и те же данные собирают. И у нас в том числе. Тот же Сергей Шпилькин, хотя он человек с математическим образованием, совершенно не ученый, но он просто вынужденно стал политологом.

Он человек увлеченный.

Скорее, я бы сказал, обиженный, как и многие граждане здесь. Потому что есть люди, я и себя к ним отношу, у которых нет глубокого внутреннего импульса к перестройке общества. Но есть какой-то предел мерзости, с которого ты оказываешься вынужден становиться гражданином. И мне кажется, что Сергей точно так же стал политологом, начал анализировать выборы. Он прекрасно бы работал себе программистом, если бы не было такого вранья и фальсификаций.

Какие-нибудь еще исследования в этом направлении можно провести?

Интересный научный вопрос, который нормальному человеку может показаться странным: зачем все это нужно? Если у нас в стране не было вопроса к марту 2012 года, кто там в стране правил в феврале и кто будет править в апреле. Тем не менее были предприняты масштабные меры, чтобы можно было официально объявить 67 процентов. Вот зачем им была нужна эта фальсификация? Ну не было бы фальсификации, ну набрал бы он 52 процента…

Это все-таки вопрос из области политологии, а не математики.

Да, но это интересный вопрос. Например, в моем детстве на каждых выборах было по одному кандидату, и объявлялось, что этот кандидат набрал 99,99 процента голосов при 99,99-процентной явке. И, судя по всему, эти показатели даже никак не считались и не агрегировались. По крайней мере, с 1970-х, 1980-х годов никаких данных не сохранилось, их никто не считал. Зачем тогда это было нужно? Что, были люди, которые думали, что ли, что это выборы? Это тоже, я бы сказал, для политических историков интересный вопрос. Какой символический смысл существует в таких выборах?

Тут хочется скатиться в пелевинщину и сказать, что это как раз был символизм такой, что-то сакральное, совсем не научное, не логичное и, скорее всего, сверхъестественное.

Я бы сказал, что меня такой ответ не слишком устроит, потому что масса политических режимов, да и наш нынешний, не отличаются большой склонностью к сакрализации чего-либо. Кроме сакрализации самой по себе, конечно.

Просто кажется, что при ответе на этот вопрос легко попасть в ловушку, если пытаться объяснить какие-то вещи с рациональных позиций. Проблема ведь часто заключается в том, что никаких рациональных позиций просто нет.

Не так уж и часто.

Как говорил один из моих преподавателей по матану, дураки хуже умных не потому, что они дураки, а потому, что они непредсказуемы. Настоящий дурак, он вот такой - случайный, может выдать что-то такое, что нормальному человеку никогда в голову не придет. Преподаватель, правда, про остаточные члены в формуле Тэйлора говорил, но это не суть - вполне применимо и к сегодняшнему дню.

Это правда. Дурак живет в более простом мире, он пользуется более грубыми моделями типа "Россия в кольце врагов". Если подумать, то у нас огромное количество проблем во всех сферах просто оттого, что нами управляют дураки. У нас же нет грамотных людей во власти, поэтому они пользуются какими-то страшно простыми схемами. Взять, например, нашу политику в ближнем зарубежье: свой-чужой. Американские президенты восемьдесят лет назад, глядя на Латинскую Америку, тоже считали "свой-чужой", но опыт их научил, что дело не в том, свой политик или чужой, а в том, что нужно смотреть глубже. Может быть, мы тоже за 30-40 лет научимся. В этом смысле ваша мысль верна: дураки более непредсказуемы, у них мир более простой, более грубый.

Мне просто кажется, что источник их непредсказуемости даже не в простоте картины мира, а в том, что у них разные части этого мира между собой не связаны. Они локально просто устроены, а глобально, наоборот, сложнее. У них хаос, нет глобального порядка.

Ну, правильно. Мы говорим как бы о двух частях одного и того же. У них такое локальное представление о мире, непротиворечивое, но поскольку они его не могут ни с чем сопоставить, не могут сделать шаг в сторону, то вынуждены очень сильно перескакивать с одного на другое. Вот мы, кстати, построили хорошую модель нашего общества и мышления, но оттого, что мы стали больше понимать, не так уж ясно, как нам следует лучше действовать.

Более того, от этого вообще не стало лучше.

Нет, ну, всегда понимать - это лучше, чем не понимать.

Комментарии к материалу закрыты в связи с истечением срока его актуальности