A differenza dell’Italia, negli Stati Uniti i sondaggi possono essere pubblicati anche a poche ore dal voto, ma questo non significa che si possa effettivamente capire come andranno le elezioni… Ecco perché, nell’analisi di Luigi Curini, professore di Scienza Politica presso l’Università degli Studi di Milano
Le elezioni presidenziali americane producono ogni 4 anni un grande spettacolo, fatto, oggi come non mai, anche di numeri e previsioni. A differenza del caso italiano, infatti, i sondaggi possono essere pubblicati negli Stati Uniti anche a poche ore dal voto. Il che ci dovrebbe effettivamente aiutare a capire cosa realmente stia accadendo entro l’elettorato americano, almeno con un ragionevole grado di certezza (beninteso, entro il famigerato intervallo di confidenza).
Il condizionale è tuttavia d’obbligo, perché c’è un “grosso e grasso” ma. Un ma che rinvia alle trasformazioni che sono accadute all’industria dei sondaggi in questi ultimi 20 anni, oltre ad altri fattori specifici di queste elezioni presidenziali. Da quando il tasso di risposta è diventato infatti risibile (ben inferiore al 10%), la bontà di un sondaggio è fondamentalmente funzione della bontà dei sistemi di pesatura che adotta. Se questi ultimi sono ben fatti, allora i risultati del sondaggio saranno accurati. Viceversa no. E questo è un fatto, non una opinione.
Facciamo un esempio per comprendere meglio la cosa sul caso, per l’appunto, di queste elezioni americane. Assumiamo che il tasso di risposta ad un sondaggio sia uguale tra potenziali elettori repubblicani e democratici, o che (stessa cosa) la probabilità di risposta ad un sondaggio se si è repubblicano o democratico sia nota con ragionevole certezza (questa è una assunzione niente affatto banale – ma diamola per buona). Un certo scetticismo verso i sondaggi deriva dal fatto che potrebbero sbagliare perché non considerano i cosiddetti “shy voters”. Chi sono questi ultimi? Sono elettori che nel segreto dell’urna votano per Donald Trump ma per desiderabilità sociale non lo dicono. Un problema che non è solo americano. Negli anni settanta in Italia, nessuno sembrava votare la Democrazia cristiana ad esempio, eppure…
Ora, se questi “elettori timidi” c’erano anche nel 2016, dopo una campagna feroce e senza precedenti portata avanti ininterrottamente dai media mainstream contro l’attuale presidente americano in questi 4 anni, l’aspettativa è che il loro numero sia cresciuto sensibilmente (si parla tra il 3 e il 5%). Ergo i sondaggi saranno sbagliati nel caso americano? Non necessariamente. Questa asserzione è fallace nella misura in cui c’è una terza variabile (o un insieme di variabili) che predicono il voto bene. Ad esempio: se io so (da precedenti analisi) che al 90% tutti gli elettori con terza media votano Trump, allora tutti quelli che hanno terza media e non mi dicono per chi votano nel sondaggio, grazie ad una pesatura delle risposte per il loro livello di istruzione, li riesco comunque ad “assegnare” a Trump ecc.
Ovviamente poi devo anche cercare di capire se chi non mi ha detto per chi votare (ma che io inferisco votare Trump) vada poi effettivamente a votare. Ma questo potrebbe essere oggetto di una ulteriore pesatura. E così via. L’esempio dell’istruzione di cui sopra è fatto di proposito. Secondo alcuni, una delle ragioni per cui alcuni sondaggi statali andarono assai male nel 2016 è che non avevano pesato per l’istruzione, che invece si è rivelata ex-post una determinante importante per il voto a Trump. Chi sostiene che nel 2020 per i sondaggi andrà meglio che nel 2016 deriva la sua aspettativa dal fatto che i sistemi di pesatura hanno “appreso” dal 2016 quello che avevano lasciato fuori, e quindi oggi (domani) saranno ben più precisi. La cosa è vera, ma “se e solo se”: 1) la probabilità di intervistare un potenziale elettore repubblicano è uguale a quella di intervistare un potenziale elettore democratico (e via con una ulteriore assunzione che facciamo!); 2) dispongo di un insieme di variabili “efficienti” nel prevedere il voto nell’urna. Si tenga presente che non potrò mai essere “certo” del loro impatto. Rimaniamo insomma nel mondo dello stocastico; 3) non ci sono stati nel frattempo altri “mutamenti” non banali nei fattori che influenzano il voto individuale.
Ad esempio, alcuni sondaggi tendono a produrre risultati “sensibilmente” diversi dagli altri. Prendiamo un esempio anche qua. Il Trafalgar Group (che aveva fatto molto bene nel 2016) da avanti Trump su Biden in molti stati chiave, ben più di quello che fa la concorrenza. E se prendessimo per buoni i suoi risultati, la notte delle elezioni ci potrebbe essere una grossa sorpresa – almeno rispetto alla narrazione scritta sino ad oggi e ai modelli predittivi che danno ad oltre il 90% la probabilità di vittoria di Joe Biden. Come mai?
Le ragioni sono due, che influenzano da un lato il “dato in entrata”, dall’altro il “dato in uscita”. Per quanto riguarda il primo aspetto, il Trafalgar Group non chiede nei suoi sondaggi per chi l’intervistato/a pensa di votare, ma per chi pensa voteranno i suoi vicini di casa (la cosiddetta “neighbor question”). Un piccolo cambiamento che tuttavia rende più semplice catturare “l’opinione vera” di chi risponde al sondaggio, che in questo modo non si sente più impaurito dall’essere giudicato per le sue opinioni. Per quanto riguarda il secondo aspetto, nel loro sistema di pesatura si “scommette” in modo molto maggiore degli altri istituti demoscopici sul crescente successo (relativo) di Trump tra le minoranze (afro-americana e ispanica), in misura ben maggiore di quanto accaduto nel 2016. Il punto è che i sistemi di pesatura da cui siamo partiti sono tarati su quello che è accaduto nel passato. Pertanto le “novità” per costruzione non le possono considerare (o quasi). Ma se queste novità ci sono e sono rilevanti, tutto va molto peggio. Succederà o no? Lo sapremo stasera.
Si tenga infine presente un ulteriore fattore di novità di queste elezioni americane: l’early-vote ha raggiunto cifre oramai impressionanti. Hanno infatti già votato qualche cosa come 93 milioni di americani. Da questo punto di vista, i sondaggi pubblicati in questi giorni catturano l’oggi più che quanto accaduto un mese e passa fa. Ma i milioni di voti già espressi non sono un dettaglio. Rischiano al contrario di essere le sabbie mobili su cui i sondaggi stanno producendo previsioni. La morale di questo articolo? Quello che è importante capire è che dietro ai dati di un sondaggio ci sono sempre molte assunzioni. Alcune più ragionevoli di altre. O semplicemente, in qualche caso, “più fortunate” di altre. Perché come al solito, come ci ricorda il grande Ronald Coase, se torturi i dati abbastanza, loro confesseranno. Sempre. Una lezione da tenere sempre bene in mente.