Addio polverosi faldoni cartacei e hard disk digitali. In futuro documenti e informazioni saranno immagazzinate in brevi sequenze di Dna. Ne sono convinti biologi molecolari e informatici dell’European bioinformatics institute (Embl-Ebi) di Hinxton, in Gran Bretagna, che sono riusciti ad archiviare 700 kb di dati, tra cui un file audio di 26 secondi del celebre discorso “I have a dream” di Martin Luther King e 154 sonetti di William Shakespeare, in 153 mila brevi tratti di Dna. Il nuovo codice, illustrato sulla rivista “Nature”, è molto più versatile degli attuali sistemi di memorizzazione come hard disk e nastri magnetici, vulnerabili di fronte all’inesorabile corso del tempo.

Secondo gli studiosi, con questa nuova metodica potrebbero essere archiviati in appena 41 grammi di Dna i 90 petabyte di dati (il petabyte corrisponde a un milione di miliardi, cioè 1 seguito da 15 zeri), prodotti dai laboratori di fisica delle particelle del Cern di Ginevra. “Si tratta di un modo efficace e durevole di preservare i dati – afferma Nick Goldman, a capo del team di ricerca – come dimostra il paleodna di animali estinti, per esempio il mammut, giunto fino a noi dopo essere rimasto conservato nei ghiacci per millenni”. 

Ma come sono riusciti gli scienziati a ottenere questo risultato? Nel nuovo codice, al posto dello zero e dell’uno del sistema binario, si adoperano le quattro lettere che compongono l’alfabeto del Dna: A (adenina), T (timina), C (citosina) e G (guanina), piccole strutture che rappresentano, nei modelli tridimensionali del Dna, i gradini sui quali si arrampica la scala a chiocciola che dà forma alla molecola della vita. In particolare, ogni byte – l’elemento base dell’informazione costituito da otto cifre, lo zero o l’unità – è rappresentato da parole di cinque lettere, ognuna delle quali è per l’appunto uno dei quattro mattoncini del Dna. I dati sono frazionati in piccole stringhe di 117 lettere, parzialmente sovrapponibili le une alle altre, in modo da poter bypassare eventuali errori di lettura o codifica, attraverso una verifica incrociata con i filamenti contigui. Alle estremità di ogni segmento sono, inoltre, agganciate piccole etichette, per indicizzare le informazioni e poter così ricostruire il messaggio completo unendo i singoli frammenti come in un puzzle.  

I ricercatori europei hanno spedito via mail ai colleghi della società informatica californiana Agilent Technologies i file in codice contenenti, oltre al brano del discorso del reverendo King e ai sonetti di Shakespeare, lo storico articolo di Watson e Crick che descrive per la prima volta la struttura della doppia elica del Dna – di cui proprio quest’anno ricorre il 60esimo anniversario -, una foto dell’istituto e un file di testo con le istruzioni per la codifica. Sulla base di quest’ultimo file, gli studiosi americani sono riusciti a sintetizzare centinaia di migliaia di frammenti di Dna. La fialetta con le informazioni, sottoforma di piccoli granelli biancastri, è stata poi rispedita al laboratorio europeo dove i ricercatori sono riusciti a decodificare i dati, attraverso il sequenziamento del Dna, con un tasso di fedeltà pari al 100 per cento, dimostrando così l’accuratezza della procedura.

Compatto, privo di consumi energetici e in grado di garantire l’integrità dei dati archiviati per migliaia di anni, il Dna ha, secondo gli studiosi, un unico difetto: i costi ancora elevati di scrittura e lettura dei dati. Il team dell’Ebi stima che la codifica di un singolo megabyte, allo stato attuale delle conoscenze tecnologiche, costerebbe all’incirca 12 mila dollari. “La codifica su Dna – sottolineano tuttavia gli autori – è già economicamente vantaggiosa per archivi a lunga scadenza e con bassa frequenza di accesso, come quelli storici e governativi”.

 L’abstract dello studio su Nature