[Cabrinews] R: Problema di probabilità
Paolo Bonavoglia
paolo.bonavoglia a aruba.it
Mar 26 Maggio 2009 21:43:24 CEST
Michele Impedovo ha scritto:
> Visto che il problema è piaciuto, ve ne propongo un altro, dello
> stesso tipo, che ho discusso con Domingo Paola.
> Lui dice che la soluzione sembra inverosimile.
>
> Su 1500 cittadini intervistati 720 dichiarano che voteranno SI al
> prossimo referendum, i rimanenti voteranno NO.
> Sulla base di questa informazione i promotori vogliono sapere con
> quale probabilità perderanno il referendum.
>
> Vi consiglio, prima di fare i conti, di immaginare il risultato, e di
> confrontarlo poi con la probabilità ottenuta.
Tento di dare una risposta.
Caso dicotomico come il precedente ma con p e q molto vicine; dunque
appare corretto approssimare la distribuzione binomiale (qui piuttosto
intrattabile) con una gaussiana; prendiamo come base l'ipotesi che nella
popolazione (supposta >> 1500) ci sia perfetta parità tra si e no, p = q
= 0,5; il sigma della distribuzione con campione di 1500 è
RadQ(1500*0,5*0,5) = 19,36
In questa ipotesi il valore osservato di 720 SI 780 NO ha un valore
standard z = 30/19,36 = 1,55 circa; siamo quindi molto lontani dalla
media e la probabilità di osservare frequenze di SI maggiore di 720 si
ricava dall'integrale della gaussiana (p.es. con la funzione Excel
0,5+GAUSS(1,55) e vale circa il 0,939 = 93,9%. Solo il 6,1% che la
frequenza risulti pari a 720 o meno di SI.
Si tratta quindi di un risultato molto improbabile anche solo in caso di
parità tra SI e NO. Ancora più improbabile nell'ipotesi di una
prevalenza dei SI. Intuitivamente la probabilità che i NO vincano in
presenza di un simile sondaggio dovrebbe essere pari o superiore a quel
93,9%.
Provando con Excel a integrare tutte le ipotesi possibili da 0,01 di SI
a 0,99 di SI e usando un metodo simile a quello usato per il caso
malati/infetti, ottengo una probabilità che i NO siano in maggioranza
del 99,9%!!!! In realtà già per l'ipotesi del 51% di SI il valore z
diventa 2,32, per il 52% z vale 3 (livello del 99%) insomma percentuali
di SI superiori al 52% sono ai limiti dell'impossibile, mentre le
ipotesi inferiori al 50% hanno tutte probabilità elevate.
Usando il test del chi quadro, che qui dovrebbe dare risultati
abbastanza attendibili nell'ipotesi della distribuzione gaussiana, e
usando un metodo simile al precedente si ottiene una probabilità del
97,1% che i NO siano in prevalenza.
Se simili risultati appaiono inverosimili, potrebbe essere il segno che
la distribuzione gaussiana non è una buona ipotesi in questo caso dove
gli individui della popolazione sono elettori alias esseri umani; in
particolare non regge l'ipotesi che i voti degli N elettori possano
essere considerati eventi indipendenti come in un'estrazione con
ripetizione (base della distribuzione binomiale); quegli N esseri umani
comunicano tra di loro e si condizionano a vicenda (ovvero sono tutti
informati e condizionati dai mass-media ...)
Se da una popolazione di palline ne estraggo 720 bianche e 780 nere, il
risultato di sopra è forse valido, nel senso che è quasi certo che la
maggioranza delle palline sia nera. Per gli elettori credo che non sia
così semplice.
Non mi intendo di sondaggi elettorali, mi piacerebbe sapere come si
regolano i vari istituti quando calcolano il margine di errore di un
sondaggio.
--
Paolo Bonavoglia
Cannaregio 3027/R
30121 V E N E Z I A
========================================================
Astronomia e Calendari http://astro.liceofoscarini.it/
Crittografia http://critto.liceofoscarini.it/
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: http://keynes.scuole.bo.it/pipermail/cabrinews/attachments/20090526/c7120cac/attachment.html
Maggiori informazioni sulla lista
Cabrinews