don_katalan: (Default)
[personal profile] don_katalan
Не все так просто, как казалось вначале. Обсуждения математических моделей доказательств наличия/отсутствия фальсификаций на выборах в Росдуму продолжаются. Вот еще материал по теме. За наводку спасибо [livejournal.com profile] world_japan
Нам ведь скоро тоже "выбирать"...
=================
О Нумерологии
Предуведомление
Для создания хоть какой-то конструктивной атмосферы в обсуждении, вынужден сообщить:

Я никоим образом не пытаюсь оспорить наличие фальсификаций на прошедших выборах о чем просто утомился уже говорить. Есть участки, где просто ....... стыд, есть зафиксированные расхождения между копией протокола у наблюдателя и сайтом ЦИК (и эти расхождения, как правило, за одну партию), есть всякие подозрительные случаи, когда наблюдателя выгнали, а на сайте ЦИК что-то абсолютно не похожее на результаты по соседним участкам.
Вышесказанное не означает, что любая странность должна трактоваться против Чурова и ЕР.
Вышесказанное не означает, что любая наукообразная аргументация от противников Чурова/ЕР должна восприниматься некритически.
Ну и если мы про статистическую науку, так давайте действовать как-то наукообразно, а не кто кого громче заклеймит и перекричит.
Чувствую себя полным идиотом оправдываясь, но без подобной преамбулы дискуссия сводится, в пределе "не надо оправдывать фальсификации, путинский наймит". А я скорее о том, что фальсификации не должны разоблачаться с помощью неподходящего к ситуации (или неправильно употребленного) статистического аппарата. То есть, конечно, все имеют право на заблуждения, но ситуация, когда на заблуждения указываешь, а в ответ получаешь ругань (обвинения в проданности режиму и прочее подобное) - огорчительна мне.
О Гауссиане и Центральной Предельной Теореме
В качестве обоснования гауссианы в подавляющем большинстве дискуссий поминается "Центральная Предельная Теорема", исходя из которой эта гауссиана и обязана получаться.

Центральная Предельная Теорема в классическом выражении говорит нам (вот прямо по википедии):


  • сумма бесконечной последовательности независимых случайных величин,

  • одинаково распределенных т.е. имеющих одинаковое матожидание и дисперсию,

  • будет распределена нормально (т.е. по гауссиане)


В случае выборов, под "независимой случайной величиной" имеет смысл понимать результат голосования одного избирателя. Тогда суммами будут результаты голосования по участкам, а распределение этих результатов по стране вроде бы должно быть нормальным.
Но


  1. Откуда берется мысль, что избиратели по стране (или по Москве) голосуют одинаково т.е. с одинаковым мат-ожиданием и дисперсией? Насколько я знаю, результаты выборов по регионам - заметно (и значимо) отличаются. А значит никакой гауссианы по стране не получится.

  2. Откуда берется мысль о независимости? Насколько я знаю, явка на разных выборах - сильно отличается. А значит есть какие-то факторы, которые решение вопроса "не сходить ли на участок" значимо сдвигают.

  3. (Еще раз) откуда берется мысль о независимости, если, чудесным образом, сумма всех результатов (голоса за партии + незачтенные бюллютни) по каждому из участков равна строго 100%? Результаты за партии - линейно зависимы.

Ну и практика показывает отсутсвие гауссианы. Вот "английская гауссиана" из исследования С. Кузнецова, на которое я еще сошлюсь. Это результаты по партиям:

Даже два горба есть (которые, как "все знают" - свидетельство подтасовок).
Отмечу, что если бы идея о гауссиане соблюдалась бы на практике, то всеобщие выборы были бы не нужны, было бы вполне достаточно нескольких сотен участков, причем вовсе не обязательно было бы их распределять по стране.

Update: украду еще пару графиков из статьи Статистический анализ результатов израильских выборов 2009 года

1. Распределение по партиям:


Как видим, длинный хвост встречается не только у нас.
2. Распределение по партийным блокам


Тут вообще труба. Привет Гауссу.
В-общем, тезис о том, что "во всех нормальных странах ВСЕГДА ГАУССИАНА" можно считать не просто недоказанным, а противоречащим практике.

Зависимость результата от явки
Утверждение: результат не должен зависеть от явки (ибо гауссиана и вообще не должен). И уж тем более, не может быть так, что только у одной партии он так зависел (с углом графика явка-голоса под 45%). Есть единственная модель - вброс за правящую партию.

Упрощенную модель явления я уже описывал, у меня нет никаких демографических обоснований этой модели, она просто не противоречит никаким физическим законам.

Обратимся к опыту развитой английской демократии (сопру еще один график у Кузнецова):


По оси X - явка, по оси Y - голоса за консерваторов. В первоисточнике есть ссылка на исходные данные.
Получается, так бывает. Более того, похоже что каждый явившийся избиратель консерваторов вбрасывал минимум два бюллютня.

Подобная же картина наблюдается и в Израиле, см. статью по ссылке выше.

Гребенка Чурова
Все видели эту гребенку (пики на кратных процентах: 50, 60, 75 и так далее), что якобы является свидетельством накруток за ЕР.
Многие, я надеюсь, читали и о другом объяснении, которое заключается в целочисленной арифметике: 50% голосов ровно дадут исходы 7 из 14, 8 из 16, 9 из 18 и так далее по всем размерам участков. И для участка с 8-ю явившимися избирателями возможны исходы с шагом 12.5% и никакие иные. А 51% ровно - получается куда меньшим числом способов. Аналогично 60% (3/5) будут возникать чаще, чем 59 или 61 (или 59.9 и 60.1 если взять бины помельче).

Понятно, что рассуждая таким образом нельзя отличить вброс (ровно на 50%, "ну давайте парочку добросим, а то у нас 49.9") от математических эффектов. Потому что и 50% и 60% - это круглые цифры, которые приятны не только целочисленной арифметике, но и избиркому.

По счастью, есть исключения: 2/3 (66.67%) и 7/8 (87.5%) - цифры не круглые, избиркомам неинтересные, то есть пики там будут именно за счет целочисленных эффектов.

Я, блин, не поленился, выкачал данные и построил график с бинами через 0.1% для голосов за ЕР. Вот кусочек его, от 48 до 82%. Бины проведены через 0.1% и "тупо" (т.е. номер бина - это int(процент*10), если рисовать менее тупо как int((процент+0.05)*10), то эффект сглаживается:


Никакого сглаживания, оно все спрячет.
Как видим, пик на 2/3 имеется, причем он ровно на 2/3 (66.7), избиркомы тянули бы до 67%, как мне кажется. Пик на 65% тоже есть, но он меньше по величине, чем на 2/3.

Вывод: как минимум частично, пики на круглых дробях (1/2, 3/5, 2/3, 3/4, 4/5) объясняются целочисленной арифметикой. Пик на 7/8 (87.5%) совсем невыразительный (участков мало), но тоже имеется.

Update: Как нам подсказывают в комментариях, гребенка есть и для КПРФ на 20% (1/5) и на 25% (1/4) и для других партий - тоже. ПГ на том графике - просто случайная величина, так ведь тоже. Кругом враги!

Update2: продолжение про гребенку Чурова - в следующем посте. Как мне кажется, тема закрыта совсем, никаким "свидетельством фальсификаций" эта гребенка не является, это всего-лишь артефакт обработки данных.

Мораль
Мораль простая: не все "очевидные" особенности стат-данных по выборам есть результат злонамеренности. И гауссиана отсутствует в развитых демократических странах и странные пики - не обязательно странные. Тщательнее надо. Если статистика - то прямо вот от основ, независимость, случайность, вид распределения....

Еще раз Источник
From: [identity profile] ljtimes.livejournal.com
Редакторы LiveJournal посчитали ваш пост интересным и добавили его в дайджест LJTimes по адресу: http://www.livejournal.com/ljtimes

Date: 2011-12-18 11:22 am (UTC)
From: [identity profile] tramp-lin.livejournal.com
Как ни странно, Власти испугались Лимонова и Левашова http://tramp-lin.livejournal.com/2779.html

http://www.ridus.ru/news/15376/

Date: 2011-12-18 11:48 am (UTC)
From: [identity profile] msk-partizan.livejournal.com
Еще подборка фальсификаций
mmmarat.livejournal.com/195806.html?view=775646#t775646
nommm.livejournal.com/36159.html
vakhnenko.livejournal.com/65167.html

Profile

don_katalan: (Default)
don_katalan

April 2026

S M T W T F S
    1 2 3 4
5 6 7 8 9 10 11
12131415161718
19202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Apr. 12th, 2026 07:00 pm
Powered by Dreamwidth Studios