среда, 24 октября 2012 г.

МММ - продолжение расследования

Для начала немного ссылок:

Я подошёл к проблеме с другого конца. В прошлом посте я уже нарисовал график, который позволяет поверить, что "вбросы" были. Естественный механизм для понимания какого же масштаба были вбросы - теория вероятности.

Сначала, построим математическую модель.
В обычной ситуации избиратель голосует за i-го кандидата с вероятностью pi.
В ситуации, когда есть голосование по спискам, вероятность получения кандидатом голоса трансформируется в a * pi + (1-a) * qi (qi здесь близко к 1 для кандидатов из списка, и близко к 0 для остальных)

То есть, мы имеем дело с обычной смесью распределений. И известный EM-алгоритм позволяет разделить эту смесь на части.

Алгоритм достаточно несложно реализуется. На выходе имеем ~17900 МММ-голосов (в среднем 40.6 голосов на человека) и ~63800 нормальных голосов (в среднем 26.55 голоса на человека). Удивительным образом алгоритм восстанавливает список МММ. А также даёт очищенные вероятности голосов за разных кандидатов.

Сравнение же полученных результатов с официальными итогами выборов хочется оставить на лёгкой развлечение читателю :)

Upd: не могу не поделиться новыми гистограммами распределения голосов после очистки МММ-ов. Система координат всё та же - процент голосов отданных за i-го в упорядоченном списке кандидата. Сверху чистые голоса, снизу МММ-голоса.

4 комментария:

  1. у вас тоже получилось только -
    Левые силы
    -Николаев
    -Палчаев
    +Волкова
    +Санников ?
    Остальные не изменились?

    ОтветитьУдалить
  2. Любопытно.
    А что такое all-votes.npy? Я хочу одно исследование провести и мне для этого нужне максимально очищенный протокол голосования. Вы не могли бы выложить архив с кодом и данными полностью? Или, если вам проще протокол без МММ-щиков, или список МММ-щиков :)

    ОтветитьУдалить
    Ответы
    1. вот протокол из голосов, максимально похожих на МММ (17871 голос)
      https://raw.github.com/xoposhiy/cvk2012/master/results/splitted-votes/mmm-votes.txt

      Удалить
  3. Наверное всё же «проверить», а не «поверить», а то как-то больно по Фрейду.

    ОтветитьУдалить