<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
</head>
<body bgcolor="#99ffff" text="#000000">
<big><big><tt>Anch'io ottengo lo stesso risultato, ma tento
un'impostazione bayesiana:<br>
p è la densità ignota della percentuale di popolazione che voterà NO.<br>
Il dato dell'esperienza è X[1500]=780<br>
Voglio conoscere la densità di <br>
p | X[1500]=780<br>
che per Bayes è proporzionale a <br>
X[1500]=780 | p<br>
Ipotizzando una distribuzione binomiale la densità cercata è
proporzionale a<br>
f(p)=p^780*(1-p)^720<br>
Calcolo<br>
A:=int(f(p),p,0.5,1)<br>
B:=int(f(p),p,0,1)<br>
e concludo<br>
Pr(p>0.5|X[1500]=780)=A/B=93.9%<br>
<br>
Mi sembra che il procedimento di Paolo sia più semplice e non richieda
sofisticati </tt></big></big><big><big><tt>strumenti </tt></big></big><big><big><tt>di
calcolo.<br>
Però l'ipotesi p=q=0.5 è molto forte. E se il campione fosse molto
minore di 1500?<br>
<br>
Ciao<br>
Michele<br>
<br>
<br>
<br>
</tt></big></big><br>
Paolo Bonavoglia ha scritto:
<blockquote cite="mid:4A1C465C.5080300@aruba.it" type="cite">
<meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
Michele Impedovo ha scritto:
<blockquote cite="mid:4A1A674D.5060004@tin.it" type="cite">
<meta content="text/html;charset=ISO-8859-1"
http-equiv="Content-Type">
<font size="+1"><font face="Courier New">Visto che il problema è
piaciuto, ve ne propongo un altro, dello stesso tipo, che ho discusso
con Domingo Paola.<br>
Lui dice che la soluzione sembra inverosimile.<br>
<br>
</font></font><font size="+1"><font face="Courier New">Su 1500
cittadini intervistati 720 dichiarano che voteranno SI al prossimo
referendum, i rimanenti voteranno NO. <br>
Sulla base di questa informazione i promotori vogliono sapere con quale
probabilità perderanno il referendum.<br>
<br>
Vi consiglio, prima di fare i conti, di immaginare il risultato, e di
confrontarlo poi con la probabilità ottenuta.<br>
</font></font></blockquote>
Tento di dare una risposta.<br>
<br>
Caso dicotomico come il precedente ma con p e q molto vicine; dunque
appare corretto approssimare la distribuzione binomiale (qui piuttosto
intrattabile) con una gaussiana; prendiamo come base l'ipotesi che
nella popolazione (supposta >> 1500) ci sia perfetta parità tra
si e no, p = q = 0,5; il sigma della distribuzione con campione di 1500
è RadQ(1500*0,5*0,5) = 19,36<br>
In questa ipotesi il valore osservato di 720 SI 780 NO ha un valore
standard z = 30/19,36 = 1,55 circa; siamo quindi molto lontani dalla
media e la probabilità di osservare frequenze di SI maggiore di 720 si
ricava dall'integrale della gaussiana (p.es. con la funzione Excel
0,5+GAUSS(1,55) e vale circa il 0,939 = 93,9%. Solo il 6,1% che la
frequenza risulti pari a 720 o meno di SI. <br>
<br>
Si tratta quindi di un risultato molto improbabile anche solo in caso
di parità tra SI e NO. Ancora più improbabile nell'ipotesi di una
prevalenza dei SI. Intuitivamente la probabilità che i NO vincano in
presenza di un simile sondaggio dovrebbe essere pari o superiore a quel
93,9%.<br>
<br>
Provando con Excel a integrare tutte le ipotesi possibili da 0,01 di SI
a 0,99 di SI e usando un metodo simile a quello usato per il caso
malati/infetti, ottengo una probabilità che i NO siano in maggioranza
del 99,9%!!!! In realtà già per l'ipotesi del 51% di SI il valore z
diventa 2,32, per il 52% z vale 3 (livello del 99%) insomma percentuali
di SI superiori al 52% sono ai limiti dell'impossibile, mentre le
ipotesi inferiori al 50% hanno tutte probabilità elevate.<br>
<br>
Usando il test del chi quadro, che qui dovrebbe dare risultati
abbastanza attendibili nell'ipotesi della distribuzione gaussiana, e
usando un metodo simile al precedente si ottiene una probabilità del
97,1% che i NO siano in prevalenza. <br>
<br>
Se simili risultati appaiono inverosimili, potrebbe essere il segno che
la distribuzione gaussiana non è una buona ipotesi in questo caso dove
gli individui della popolazione sono elettori alias esseri umani; in
particolare non regge l'ipotesi che i voti degli N elettori possano
essere considerati eventi indipendenti come in un'estrazione con
ripetizione (base della distribuzione binomiale); quegli N esseri umani
comunicano tra di loro e si condizionano a vicenda (ovvero sono tutti
informati e condizionati dai mass-media ...)<br>
<br>
Se da una popolazione di palline ne estraggo 720 bianche e 780 nere, il
risultato di sopra è forse valido, nel senso che è quasi certo che la
maggioranza delle palline sia nera. Per gli elettori credo che non sia
così semplice.<br>
<br>
Non mi intendo di sondaggi elettorali, mi piacerebbe sapere come si
regolano i vari istituti quando calcolano il margine di errore di un
sondaggio.<br>
<pre class="moz-signature" cols="72">--
        Paolo Bonavoglia
Cannaregio 3027/R
30121 V E N E Z I A
========================================================
Astronomia e Calendari                <a moz-do-not-send="true"
class="moz-txt-link-freetext" href="http://astro.liceofoscarini.it/">http://astro.liceofoscarini.it/</a>
Crittografia                        <a moz-do-not-send="true" class="moz-txt-link-freetext"
href="http://critto.liceofoscarini.it/">http://critto.liceofoscarini.it/</a>
</pre>
<pre wrap="">
<hr size="4" width="90%">
_______________________________________________
Cabrinews mailing list
<a class="moz-txt-link-abbreviated" href="mailto:Cabrinews@liste.keynes.scuole.bo.it">Cabrinews@liste.keynes.scuole.bo.it</a>
<a class="moz-txt-link-freetext" href="http://keynes.scuole.bo.it/mailman/listinfo/cabrinews">http://keynes.scuole.bo.it/mailman/listinfo/cabrinews</a>
</pre>
</blockquote>
</body>
</html>