A un mese scarso dalle elezioni inizia a salire un certo nervosismo pre-elettorale e per capire cosa succede in un elettorato piuttosto disorientato ogni giorno c’è un nuovo sondaggio che rimbalza da una trasmissione a un quotidiano e poi viene rilanciato su ogni spazio web immaginabile. Questo è un tipico commento“Lieve calo per il Pd, mentre salgono M5s e Forza Italia, che sfiora il 20%. E’ quanto emerge dall’ultimo sondaggio di Datamedia Ricerche, istituto diretto da Natascia Turato, per Il Tempo. Nel dettaglio troviamo il Partito Democratico al 31,5% (-0,5% in due settimane), il Movimento 5Stelle è invece al 25,5% (+0,4), Forza Italia è al 20% (+1%)”.

Andando però a vedere il sito Sondaggi Politico Elettorali, dove sono riportati tutti i sondaggi e sono fornite  alcune informazioni tecniche sugli stessi, si scopre così che in termini assoluti le variazioni sono: + 0,4% =+ 4 persone,  -0,5% = -5 persone e +1% =+ 10 persone. Infatti il campione su cui è stata fatto il sondaggio è di 1000 persone. In che senso 1000 persone possono essere rappresentative di 50 milioni?

“L’arte” del sondaggista dovrebbe consistere nel selezionare le 1000 persone in maniera da non avere alcun tipo di effetto sistematico ovvero in maniera da rappresentare in maniera più uniforme possibile l’intera popolazione italiana. Questo è già un problema molto critico, soprattutto in un periodo in cui l’elettorato è molto fluido e le scelte sono multiple. Da una parte ricordiamo infatti che il risultato del Movimento 5 Stelle dello scorso anno ha rappresentato il più grande spostamento di voti dell’Italia repubblicana. Dall’altro bisogna notare che in Italia, a differenza ad esempio degli Stati Uniti, la possibilità tra chi votare non è (sostanzialmente) tra due soggetti ma tra una molteplicità. Dunque se Nate Silver è riuscito a prevedere con successo il risultato in 49 sui 50 stati dell’unione, dubitiamo che una previsione del genere sia possibile in Italia oggi.

Il punto però che vorrei sottolineare è il seguente: qual è l’errore minimo che si effettua in sondaggio? Se i sondaggisti fossero così bravi da scegliere un campione che non abbia effetti sistematici l’errore minimo sotto il quale è impossibile scendere è l’errore casuale. Si impara su qualsiasi testo di statistica che questo errore cresce con la radice quadrata della grandezza del campione. Dunque se il campione è composto da mille persone l’errore minimale è  circa di 30 persone, che percentualmente significa 30/1000 = 3%. Questo implica che qualsiasi variazione al di sotto del 3% non è misurabile e dunque dei cambiamenti dello 0,5-1% rientrano entro nell’errore (minimo) di misura e non hanno alcun senso statistico.

In realtà, avendo seguito l’andamento dei sondaggi alle scorse elezioni, mi sono convinto che l’errore minimo nei sondaggi, almeno in questo momento in Italia, è di almeno del doppio. Invece di inventarsi improbabili spiegazioni dopo che le elezioni si sono svolte sul perché i sondaggi non hanno fotografato in maniera corretto le intenzioni di voto, bisogna semplicemente sapere che ogni misura si deve accompagnare con un errore e che bisogna imparare ad apprezzare l’importanza dell’incertezza.