Il mondo FQ

Può leggere, prevedere mutazioni e progettare nuovi genomi: cos’è Evo 2 l’IA che impara il linguaggio del Dna

Il modello generativo sviluppato dall’Arc Institute con Nvidia analizza sequenze genetiche lunghe fino a un milione di nucleotidi. Lo studio pubblicato su Nature apre nuove prospettive nella ricerca su malattie e terapie geniche.
Può leggere, prevedere mutazioni e progettare nuovi genomi: cos’è Evo 2 l’IA che impara il linguaggio del Dna
Icona dei commenti Commenti

Una nuova frontiera si apre per la biologia grazie a Evo 2, il più potente modello di intelligenza artificiale generativa applicato allo studio della genetica. Paragonabile a una versione di ChatGPT addestrata non sul linguaggio umano ma sul Dna, il sistema è in grado di analizzare e riscrivere sequenze genetiche, individuare mutazioni all’origine di malattie e progettare nuovi genomi, lunghi quanto quelli di semplici batteri.

Il modello è stato sviluppato dall’Arc Institute insieme a Nvidia, con la collaborazione della Stanford University e delle Università della California di Berkeley e San Francisco. Il progetto, rilasciato inizialmente un anno fa, è stato ora descritto anche in uno studio pubblicato sulla rivista scientifica Nature. Evo 2 è stato addestrato su una quantità senza precedenti di dati genetici: circa 9 mila miliardi di “lettere” del Dna – i nucleotidi – provenienti da 128 mila genomi appartenenti a specie diverse, sia viventi sia estinte. Questa enorme base di conoscenza permette al sistema di interpretare il linguaggio della genetica e di elaborare sequenze complesse.

Rispetto al suo predecessore, Evo 1, presentato nel 2024, il nuovo modello compie un salto di qualità. Se la prima versione era stata addestrata esclusivamente su genomi di organismi unicellulari, Evo 2 include anche quelli di organismi pluricellulari, tra cui esseri umani e piante. In questo modo è in grado di analizzare contemporaneamente sequenze genetiche molto più lunghe, fino a un milione di nucleotidi, individuando anche relazioni nascoste tra parti lontane del genoma.

“Il nostro sviluppo di Evo 1 ed Evo 2 rappresenta un momento chiave nel campo emergente della biologia generativa, perché ha permesso alle macchine di leggere, scrivere e pensare nel linguaggio dei nucleotidi”, spiega Patrick Hsu, cofondatore dell’Arc Institute. “Evo 2 ha una comprensione generalista dell’albero della vita che può essere utilizzata per molte applicazioni, dalla previsione delle mutazioni che causano malattie alla progettazione di possibili codici per forme di vita artificiale”.

I primi test mostrano già le potenzialità del sistema. Evo 2 è in grado di identificare i cambiamenti genetici che alterano la funzione delle proteine. In prove condotte su varianti del gene Brca1, noto per essere associato al tumore al seno, il modello ha raggiunto un’accuratezza superiore al 90% nel distinguere mutazioni benigne da quelle potenzialmente pericolose. Risultati di questo tipo potrebbero ridurre tempi e costi della ricerca biologica, evitando molti esperimenti preliminari su cellule o animali. L’intelligenza artificiale potrebbe infatti aiutare a individuare più rapidamente le cause genetiche delle malattie e ad accelerare lo sviluppo di nuovi farmaci o terapie geniche mirate, con effetti collaterali ridotti.

Evo 2 si inserisce in un percorso scientifico iniziato con le tecniche di editing genetico, come Crispr – che nel 2020 è valsa il Premio Nobel per la chimica a Emmanuelle Charpentier e Jennifer Doudna – e proseguito con sistemi di intelligenza artificiale come AlphaFold di Google, capace di prevedere la struttura tridimensionale delle proteine. Il nuovo modello estende ulteriormente queste capacità e apre applicazioni in diversi ambiti: dalla progettazione di sequenze genetiche inedite all’interpretazione di frammenti di Dna di cui è ancora sconosciuta la funzione, fino allo studio delle malattie ereditarie.

Un esempio delle sue possibilità era stato mostrato già lo scorso settembre, quando il gruppo di ricerca guidato da Brian Hie alla Stanford University aveva utilizzato Evo 2 per realizzare per la prima volta in laboratorio un intero virus. Proprio per le implicazioni etiche di strumenti così potenti, gli sviluppatori hanno introdotto limitazioni: il sistema non può essere utilizzato per progettare o modificare organismi potenzialmente pericolosi.

Lo studio su Nature

Gentile lettore, la pubblicazione dei commenti è sospesa dalle 20 alle 9, i commenti per ogni articolo saranno chiusi dopo 72 ore, il massimo di caratteri consentito per ogni messaggio è di 1.500 e ogni utente può postare al massimo 150 commenti alla settimana. Abbiamo deciso di impostare questi limiti per migliorare la qualità del dibattito. È necessario attenersi Termini e Condizioni di utilizzo del sito (in particolare punti 3 e 5): evitare gli insulti, le accuse senza fondamento e mantenersi in tema con la discussione. I commenti saranno pubblicati dopo essere stati letti e approvati, ad eccezione di quelli pubblicati dagli utenti in white list (vedere il punto 3 della nostra policy). Infine non è consentito accedere al servizio tramite account multipli. Vi preghiamo di segnalare eventuali problemi tecnici al nostro supporto tecnico La Redazione