Dopo Brexit e presidenziali americane, anche i sondaggi sul referendum del 4 dicembre si riveleranno sbagliati? Nel nostro caso il problema è se il campione osservato sia o meno una buona rappresentazione di chi voterà. Perché i non rispondenti sono tanti. E ciò aumenta l’incertezza dei risultati. 

di Paolo Brunori (www.lavoce.info)

Le previsioni sul 4 dicembre

La mattina del 9 novembre ci siamo ritrovati increduli a leggere della vittoria di Donald Trump. Il risultato ha sorpreso tutti, anche i mercati avevano scommesso su una sua sconfitta, ma sondaggisti e brokers avevano di nuovo sbagliato previsione. Eppure, il risultato del referendum sulla permanenza nell’Unione europea nel Regno Unito aveva messo in guardia sul rischio di sottovalutare la probabilità di eventi considerati irragionevoli dagli addetti ai lavori. Anche la notte del 4 dicembre, qui in Italia, rischiamo di avere sorprese.

Gli ultimi sondaggi pubblicati in Italia davano tutti il “No” in vantaggio. Il 18 novembre ne sono stati divulgati sei. Il più favorevole al “Sì”, dava comunque avanti il “No”, seppure di pochissimo: 50,49 per cento contro il 49,41 per cento al “Sì”. Divulgato da Termometro Politico, era però un sondaggio atipico, basato sulla partecipazione volontaria degli intervistati. Rilevazioni di questo tipo sono complesse da valutare perché la loro rappresentatività su scala nazionale è ottenuta a posteriori, calcolando medie pesate sulla base delle caratteristiche demografiche dei rispondenti.

Tra gli altri sondaggi, quello di Demopolis vedeva il “Sì” distaccato di 4 punti percentuali rispetto al “No”. Gli ultimi quattro erano più pessimisti: Istituto Ixè indicava un vantaggio del “No” di 6 punti, Istituto Piepoli di 8, Demos&Pi e Demetra addirittura di 9 punti.

L’incertezza dei sondaggi

I sondaggi, però, sono sempre accompagnati da una misura di incertezza, calcolata attraverso alcune ipotesi sulla qualità dei dati raccolti. Assieme alle percentuali viene fornito un intervallo di confidenza. La forchetta indica in che intervallo possiamo aspettarci di trovare il risultato elettorale con una probabilità di errore minima, tipicamente il 5 per cento. I sondaggisti sono quindi consapevoli delle incertezze insite nelle loro previsioni. Quelle della figura 1 sono le forchette di confidenza al 95 per cento dei cinque sondaggi.

Figura 1

Fonte: Sondaggipoliticoelettorali.it

Fonte: Sondaggipoliticoelettorali.it

D’altra parte, anche le forchette possono essere sbagliate. Ci sono due assunzioni fondamentali che le rendono valide. La prima è che le persone rispondano in modo sincero a chi le intervista. La seconda è che la probabilità di intervistare un favorevole o un contrario alla riforma dipenda esclusivamente da quanti sono i favorevoli e quanti i contrari fra gli aventi diritto al voto.

Nel caso della Brexit e dell’elezione di Trump è stato ipotizzato che i sondaggi avessero sbagliato perché le persone non rispondevano in modo sincero riguardo alle loro intenzioni di voto. Votare “leave” e non votare “Clinton” era considerato socialmente inaccettabile per cui molte persone hanno nascosto la loro reale intenzione di voto. Nel caso del referendum italiano, invece, un problema molto serio potrebbe essere il secondo: siamo certi che il campione osservato sia una buona rappresentazione di chi voterà?

Leggendo attentamente i dati allegati ai sondaggi non è chiaro, ad esempio, se gli italiani residenti all’estero siano stati contattati o meno. Anche i tassi di non risposta sono molto elevati. Il sondaggio Ixè riguarda mille risposte date su 9.266 soggetti contattati. Al sondaggio Demos&Pi addirittura i rispondenti sono meno di uno ogni dieci contattati: 1.232 risposte su 13.598 contatti.

È verosimile che le non risposte aumentino il grado di incertezza riguardo ai risultati. Se non possiamo essere certi che chi risponde abbia una probabilità di votare “Sì” o “No” identica a chi non risponde, allora con il numero di non-risposte aumenta anche l’errore che ci dovremmo attendere di compiere.

Per capire come gli istituti che pubblicano sondaggi tengano conto di questo ulteriore fonte di incertezza occorre confrontare le forchette calcolate sotto l’assunzione che il campionamento sia casuale con quelle pubblicate dai sondaggisti. La cosa interessante è che, sulla base della documentazione pubblicata dagli istituti di sondaggio, le due forchette risultano identiche. Semplicemente i sondaggisti sembrano ignorare le non-risposte. Due sondaggi, uno con un tasso di risposta del 100 per cento e l’altro con un tasso di risposta del 10 per cento sono trattati in modo identico al momento della quantificazione dell’errore. Questa scelta metodologica può avere conseguenze molto serie.

Facciamo due ipotesi alternative, ammettiamo che la percentuale dei “Sì” e dei “No” possa essere leggermente diversa fra chi accetta di rispondere e chi no. Nella prima ipotesi immaginiamo che la percentuale dei “Sì” sia del 5 per cento più elevata fra i non rispondenti, nella seconda i non rispondenti votano “Sì” con una probabilità il 5 per cento inferiore. Sulla base di queste ipotesi ho ricostruito l’orientamento di voto dei non rispondenti a ciascuno dei cinque sondaggi. E ho calcolato le forchette ammettendo, oltre all’incertezza dovuta al campionamento casuale, la possibilità che vi sia una differenza sistematica nell’orientamento di voto di rispondenti e non rispondenti.

Il risultato è un forte aumento dell’incertezza. Le percentuali minime e massime del “Sì” e del “No” si avvicinano molto e spingersi a prevedere il risultato delle urne sembra piuttosto difficile.

Nota metodologica

Figura 2

Fonte: elaborazione su dati pubblicati su Sondaggipoliticoelettorali.it

Fonte: elaborazione su dati pubblicati su Sondaggipoliticoelettorali.it