Константин Сонин: "Случайный эксперимент"

"Голосование 1 июля организовано таким образом, что проверить настоящую явку и количество голосов "за/против" очень трудно. Вот у меня тут появилась теоретическая идея, как это можно было бы организовать - в условиях противодействия. Это может сделать любая организация с репутацией и минимальными ресурсами", - пишет профессор Чикагского университета на своей странице в Facebook.

"Представьте, что сделан сайт, который оказывает простую услугу. Каждый гражданин, который хочет поучаствовать в проверке явки, идет на сайт и вводит свой примерный адрес и время когда он может быть "проверщиком явки" (это будет гораздо проще, чем "наблюдатель"). Сайт ему в ответ сообщает адрес избирательного участка, к которому идти и часовой интервал, когда гражданину нужно стоять и считать, сколько человек зашло на участок. Всего один час и внутрь заходить не нужно!

После этого гражданин сообщает организаторам, сколько он насчитал. Кажется, он считал всего час, что тут можно оценить. Можно - потому что этот час был выбран случайным образом! Среднее по сделавшим так гражданам даст несмещенную оценку явки. Для того, чтобы оценка была относительно точной, нужно будет несколько тысяч (но не десятков тысяч, не сотен) человек на всю страну.

По полученной оценке явки можно будет оценить и количество голосов "за" по методу Сергея Шпилькина (просто предполагая - на основе всех российских выборов с честным подсчетом, что распределение голосов по явке должно быть нормальным). Можно ли будет, используя эти данные, оценить "накрутки" в электронном голосовании, не знаю - но, возможно, и это можно.

Собственно, можно даже исходную рандомизацию заменить на квазирандомизацию. Например, распределить интервалы (час, когда стоять недалеко от участка и считать вошедших) случайным образом можно не среди людей, а среди дней рождений. У тебя, скажем, день рождения 22 февраля, ты идешь на сайт, там написано - твой интервал в воскресенье, с 15 до 16, твой избирательный участок.

Квазирандомизация хуже: те, кто придёт на сайт, посмотрит своё время и решит, что не пойдет считать, внесут искажение. Зато можно будет потом выбрать те участки, в которых дисперсия сообщенной явки маленькая (люди, реально пошедшие, за тот же самый час насчитают примерно одно и то же).

Что помешает желающим (с масштабным ресурсом) манипулировать этим подсчетом? Нагнать там десять тысяч человек, которые завысят сообщенные цифры. Если хотя бы несколько тысяч участвующих в эксперименте можно будет проверить (то есть они сообщат паспортные данные или являются знакомыми активистами), то это даст грубую оценку, которая в среднем должна быть близка к оценке по всем участникам. То есть манипуляция легко обнаружится.

Оригинал здесь.

Комментарии

Чтобы оставить комментарий, Вам нужно авторизоваться.