Il modello probabilistico - Cosa dicono i numeri

La profezia dei big data: “Metà dei casi è nascosta”

28 Febbraio 2020

L’epidemia da Coronavirus è destinata a raggiungere una diffusione mondiale e attualmente, in Italia, potrebbero esserci già quasi 800 contagiati, invece che i circa 470 diagnosticati: i dati arrivano dall’epidemiologia computazionale, uno strumento all’avanguardia per prevedere, e quindi limitare, i danni che un agente infettivo, specie se sconosciuto, può causare. Si basa su equazioni stocastiche – cioè probabilistiche – per descrivere e prevedere l’evoluzione di fenomeni complessi, in modo simile alla scienza delle previsioni meteorologiche.

Uno dei modelli più affidabili in tale ambito – specie per il Coronavirus-19, di cui si sa pochissimo – è il Gleam (Global Epidemic and Mobility Model) di Alessandro Vespignani, fisico dei sistemi complessi, direttore del Network Science Institute della Northeastern University di Boston (Usa). Il suo approccio è stato utilizzato con successo nel caso di epidemie come Ebola, aviaria, suina e influenze stagionali, con previsioni che si sono rivelate corrette. Oggi, il suo gruppo sta elaborando i possibili scenari per l’epidemia di Coronavirus-19. Lavorano a un ritmo frenetico, considerato che ogni giorno il numero di contagi e quello di Paesi in cui vengono scoperti nuovi casi aumenta e cambiano le misure di contenimento. Le informazioni vengono inserite costantemente nel modello probabilistico che si basa su dati reali della popolazione mondiale e della sua mobilità nonché sui modelli probabilistici di trasmissione delle epidemie sempre aggiornati. Gli oltre 7 miliardi di abitanti del pianeta sono suddivisi in 3 mila caselle, cioè 3 mila sotto-popolazioni. Per ogni casella si studiano tutti gli spostamenti reali (in aereo, treno, automobile) degli abitanti e le “caselle” a cui si connettono. In base al numero di contagiati, dei presunti infetti non sintomatici (il cui numero è sconosciuto), di immunizzati (perché guariti) e delle persone suscettibili al virus presenti in ogni “casella”, si osserva lungo quali traiettorie il virus si sposterà e come la popolazione di ogni altra casella collegata reagirà in base alle caratteristiche di suscettibilità. Vespignani spiega perché ad oggi in Italia sono stati diagnosticati 470 casi, mentre secondo il suo modello potrebbero essercene almeno 750.

“La differenza dipende dalla frazione di positivi al virus ma non visibili, il cui numero è sconosciuto”. Un aspetto che indica quanto sia importante lo sforzo di ricostruire le catene di contagio a partire dai casi già diagnosticati: “Ci permette di individuare il reale numero di infetti e ricostruire, attraverso i dati di mobilità, le traiettorie di diffusione del virus”. Basandosi sui dati ufficiali e sugli studi di altri colleghi, il gruppo di Boston ipotizza che i casi di infetti “visibili” – cioè diagnosticati – siano in realtà solo il 40% dei positivi effettivi. È plausibile che esista un altro 60% di “invisibili”, perché asintomatici o con sintomi lievi. Il loro numero è la grossa incertezza che virologi e decisori politici di tutto il mondo si trovano a dover affrontare. Da questa ipotesi e “dal numero di contagi che si scoprono via via in altri Paesi europei – dovuti presumibilmente al contatto di persone infette provenienti dall’Italia – che si riesce a stimare quanti casi positivi, sintomatici e non, ci sono realmente nel nostro Paese”, aggiunge Matteo Chinazzi, ricercatore del gruppo. Il fatto di aver scoperto un certo numero di infetti in Spagna e in altri Paesi europei, permette di inferire — sulla base dei dati della mobilità — che in Italia ci siano almeno 750 persone positive al virus in questo momento.

Su questa base, da un lato il modello suggerisce che la misura più efficace per contenere l’epidemia, per ora, è ricostruire le catene di trasmissione; dall’altro permette di stimare la reale efficacia di riduzione del contagio delle misure di contenimento finora implementate. Ad esempio, la chiusura di aeroporti nell’area di Wuhan in Cina non mostra un effetto significativo sul contenimento della diffusione del virus. Stesso discorso se si impedisse la circolazione da e verso l’Italia. “ È troppo tardi – spiega Vespignani –. Quel tipo di misura sarebbe efficace se si potesse implementare nel momento in cui avvengono i primi contagi, e non quando vengono scoperti (il modello di Vespignani indica che l’effettiva data di inizio dell’epidemia di Wuhan sia a novembre 2019, mentre l’allarme è stato lanciato il 7 gennaio 2020). Nel momento in cui la sorveglianza nazionale di un paese intercetta un’epidemia causata da un virus sconosciuto, i casi di infezione sono già molti di più di quelli che si riescono a vedere e stanno già circolando ovunque. Chiudere i confini non ha più senso. Al contrario, potrebbe causare problemi enormi per la società. Per questo le misure di contenimento vanno valutate tenendo conto di entrambi gli aspetti.

Ti potrebbero interessare

I commenti a questo articolo sono attualmente chiusi.