[Cabrinews] R: Problema di probabilità

Paolo Bonavoglia paolo.bonavoglia a aruba.it
Mar 26 Maggio 2009 21:43:24 CEST


Michele Impedovo ha scritto:
> Visto che il problema è piaciuto, ve ne propongo un altro, dello 
> stesso tipo, che ho discusso con Domingo Paola.
> Lui dice che la soluzione sembra inverosimile.
>
> Su 1500 cittadini intervistati 720 dichiarano che voteranno SI al 
> prossimo referendum, i rimanenti voteranno NO.
> Sulla base di questa informazione i promotori vogliono sapere con 
> quale probabilità perderanno il referendum.
>
> Vi consiglio, prima di fare i conti, di immaginare il risultato, e di 
> confrontarlo poi con la probabilità ottenuta.
Tento di dare una risposta.

Caso dicotomico come il precedente ma con p e q molto vicine; dunque 
appare corretto approssimare la distribuzione binomiale (qui piuttosto 
intrattabile) con una gaussiana; prendiamo come base l'ipotesi che nella 
popolazione (supposta >> 1500) ci sia perfetta parità tra si e no, p = q 
= 0,5; il sigma della distribuzione con campione di 1500 è 
RadQ(1500*0,5*0,5) = 19,36
In questa ipotesi il valore osservato di 720 SI 780 NO ha un valore 
standard z = 30/19,36 = 1,55 circa; siamo quindi molto lontani dalla 
media e la probabilità di osservare frequenze di SI maggiore di 720 si 
ricava dall'integrale della gaussiana (p.es. con la funzione Excel 
0,5+GAUSS(1,55) e vale circa il 0,939 = 93,9%. Solo il 6,1% che la 
frequenza risulti pari a 720 o meno di SI.

Si tratta quindi di un risultato molto improbabile anche solo in caso di 
parità tra SI e NO. Ancora più improbabile nell'ipotesi di una 
prevalenza dei SI. Intuitivamente la probabilità che i NO vincano in 
presenza di un simile sondaggio dovrebbe essere pari o superiore a quel 
93,9%.

Provando con Excel a integrare tutte le ipotesi possibili da 0,01 di SI 
a 0,99 di SI e usando un metodo simile a quello usato per il caso 
malati/infetti, ottengo una probabilità che i NO siano in maggioranza 
del 99,9%!!!! In realtà già per l'ipotesi del 51% di SI il valore z 
diventa 2,32, per il 52% z vale 3 (livello del 99%) insomma percentuali 
di SI superiori al 52% sono ai limiti dell'impossibile, mentre le 
ipotesi inferiori al 50% hanno tutte probabilità elevate.

Usando il test del chi quadro, che qui dovrebbe dare risultati 
abbastanza attendibili nell'ipotesi della distribuzione gaussiana, e 
usando un metodo simile al precedente si ottiene una probabilità del 
97,1% che i NO siano in prevalenza.

Se simili risultati appaiono inverosimili, potrebbe essere il segno che 
la distribuzione gaussiana non è una buona ipotesi in questo caso dove 
gli individui della popolazione sono elettori alias esseri umani; in 
particolare non regge l'ipotesi che i voti degli N elettori possano 
essere considerati eventi indipendenti come in un'estrazione con 
ripetizione (base della distribuzione binomiale); quegli N esseri umani 
comunicano tra di loro e si condizionano a vicenda (ovvero sono tutti 
informati e condizionati dai mass-media ...)

Se da una popolazione di palline ne estraggo 720 bianche e 780 nere, il 
risultato di sopra è forse valido, nel senso che è quasi certo che la 
maggioranza delle palline sia nera. Per gli elettori credo che non sia 
così semplice.

Non mi intendo di sondaggi elettorali, mi piacerebbe sapere come si 
regolano i vari istituti quando calcolano il margine di errore di un 
sondaggio.

-- 

	Paolo Bonavoglia

Cannaregio 3027/R
30121 V E N E Z I A
========================================================
Astronomia e Calendari		http://astro.liceofoscarini.it/
Crittografia			http://critto.liceofoscarini.it/

-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: http://keynes.scuole.bo.it/pipermail/cabrinews/attachments/20090526/c7120cac/attachment.html 


Maggiori informazioni sulla lista Cabrinews