Мне Микеле не поленился даже в личку ругательство прислать. Видать, совсем с катушек съехал или статистку в вузе учил да не выучил.
А главная идея моего первого сообщения была в том, что данные опроса были интерпретированы с грубой методической ошибкой: поскольку ответы на вопоросы были альтернативные, группы, давшие разные ответы, можно объединять. И это будет математически корректно.
Итак - вернёмся к опубликованным данным опроса. {Следите за моими руками.} Известен размер выборки n=1200. По четырём ответам имеем распределение частот: р1=0.412, р2=0.358, р3=0.204 и р4=0.026; в сумме получаем 1.00 - здесь ошибок пока не сделано. Более того - мы видим, что на вопрос о языке допускался лишь единственный из четырёх возможных ответов.
Кроме того, известна половина ширины 95%-ного доверительного интервала D=0.029. Давайте её перепроверим; её нетрудно оценить, зная только размер выборки n:
D = 1.96*sqrt(p*(1-p)/n). Эту формулу вы найдёте в любом учебнике статистики.
Для частоты р1 получаем: D1 = 1.96*sqrt(0.412*(1-0.412)/1200)=1.96*sqrt(0.00020188)=0.0278, или 2.8% - почти сошлось. Далее - для каждой из оставшися частот получаем: D2=0.271, D3=0.228 и D4=0.009.
Добавляя плюс-минус Di к pi получаем 95%-ный доверительный интервал для частоты каждго из четырёх ответов.
Сами по себе эти частоты нас не очень интересуют. Более того - чтобы убедиться в том, что 41.2% - это уверенное большинство противников изменения стауса русского языка, мы должны рассматривать частоту р5=р2+р3=0.358+0.204=0.562 - это частота в той или иной форме выступивших ЗА изменение статуса русского языка. Здесь мы объединяем ответы 2 и3 в одну группу 5 - потому что это корректно.
Итак - вопрос в том, 0.412 и 0.562 - это статистически значимая разница или нет?
Чтобы ответить на этот вопрпс, надо проверить нуль-гипотезу:
Н0: "частота р5 не отличается от частоты р1"
против альтернативной гипотезы:
На: "частота р5 выше, чем частота р1".
Чтобы проверить, какая статистическая гипотеза должна быть принята, нам нужно вычислить тестовую статистику:
z=(p5-p1)/sqrt(2*p0*(1-p0)/n), где р0=(р1+р5)/2. Это вы тоже найдёте в учебнике.
При доверительной вероятности 95%, если z>1.64, мы должны отвергнуть нулевую гипотезу и принять альтернативную. (Порог 1.64, а не 1.96 - потому что тест односторонний)
Считаем:
p0=(0.412+0.562)/2=0.487;
z=(0.562-0.412)/sqrt(2*0.487*(1-0.487)/1200)=0.15/sqrt(0.000416385)=7.35;
Это существенно больше, чем 1.64; если требование к надёжности поднять до 99%, то порог будет 2.33 - он тоже намного превышен.
Вывод: с уровнем надёжности более, чем 99%, имеются достаточные основания отвергнуть нулевую гипотезу H0 и принять альтернативную гипотезу На.
То есть данные опроса свидетельствуют, что процент противников изменения стауса русского языка на Украине меньше, чем процент сторонников сделать русский язык либо вторым государственным, либо официальным на региональном уровне.
Ну как - есть желающие оспорить этот статистический анализ?
=======================================================
Полагаю, что именно вывод, показанный красным цветом, удерживает власть имущих от естественного шага вынести вопрос о языке на общенародный референдум. Если вопрос будет ясный вроде: "вы за повышение статуса русского языка при сохранении украинского в качестве государственного языка?", то он будет поддержан большинством голосов.
И я полагаю, что Янукович, хорошо понимает, что именно при такой постановке вопроса у него будет больше сторонников. Поэтому он перестал настаивать на государственном статусе для русского языка.