Islandese, lettone, lituano e maltese sono le lingue che potrebbero presto sparire dal mondo digitale. A lanciare l’allarme, nella Giornata Europea delle Lingue, è un report del Meta-Net (Multilingual Europe Technology Alliance), network linguistico europeo di eccellenza che riunisce 60 centri di ricerca in 34 paesi (fra i quali, per l’Italia, l’Istituto di Linguistica Computazionale “Antonio Zampolli” del Consiglio Nazionale delle Ricerche di Pisa). Una lingua si estingue quando non la si parla più. Ma nel mondo digitale può gradualmente scomparire quando è “ignorata” dai software linguistici che non le danno il necessario supporto e che finiscono, addirittura, per ostacolarne l’uso.

“I risultati del nostro studio sono molto allarmanti. La maggior parte delle lingue europee non gode di sufficienti risorse digitali e alcune sono quasi completamente trascurate. In questo senso, molte delle nostre lingue potrebbero non sopravvivere alla prova del tempo e, in futuro, scomparire dal mondo digitale”, ha commentato Hans Uszkoreit, coordinatore di Meta-Net. L’Europa possiede un vero tesoro linguistico: si contano infatti 30 lingue ufficiali e oltre 60 comunità autoctone che parlano una lingua regionale o minoritaria, senza dimenticare le lingue parlate dai cittadini originari di altri paesi e continenti. Un patrimonio prezioso che, però, è anche molto fragile, se si pensa al fatto che, secondo il rapporto, 21 delle 30 lingue europee hanno risorse digitali “inesistenti” oppure “deboli”, nel migliore dei casi, e sono a rischio di estinzione digitale.

L’islandese, il lettone, il lituano e il maltese sono quelle che rischiano maggiormente di scomparire nel mondo digitale, ma sono in difficoltà anche il bulgaro, il greco, l’ungherese e il polacco. Lo studio, raccolto in 30 volumi della Meta-Net White Paper Series, è stato curato da oltre 200 esperti che hanno valutato il supporto tecnologico a disposizione per ogni lingua secondo quattro aree: traduzione automatica, interazione parlata, analisi dei testi e disponibilità di risorse linguistiche. Alcune lingue, come le quattro più a rischio già citate, sono apparse particolarmente “maltrattate” da questi strumenti digitali, ricevendo i punteggi peggiori in tutte le aree. Ma non è andata poi tanto meglio alle lingue che hanno ottenuto valutazioni superiori: l’inglese, lingua più valorizzata dalle tecnologie linguistiche fra tutte le lingue europee, è riuscito per esempio a ottenere solo una classificazione di “supporto buono” e non “eccellente”. E l’italiano? La lingua di casa nostra è stata valutata a “supporto moderato”, alla pari con francese, tedesco e spagnolo. Mentre lingue come il basco, il bulgaro, il catalano, il greco, l’ungherese e il polacco hanno ricevuto un “supporto frammentario”, che le fa considerare ad alto rischio estinzione.

Ma quand’è che una lingua si può considerare “trascurata” dalle tecnologie digitali? Quando non sono disponibili, in quel linguaggio, software come quelli usati per elaborare testi oppure comandi vocali, come quelli usati per sillabare o per controllare la grammatica, o quelli usati come personal assistant interattivi (si pensi a Siri sull’iPhone), oppure, ancora, come i sistemi per la traduzione automatica o i motori di ricerca via web. La scarsa presenza, quando non l’assenza completa, di software di questo genere espone la lingua al rischio estinzione e diminuisce le sue capacità di sopravvivenza nel mondo digitale. Questi sistemi tecnologici, si legge nel report, si basano principalmente su metodi statistici che richiedono una quantità incredibilmente grande di dati scritti o parlati, che sono difficili da acquisire per le lingue che hanno un numero di “parlatori” relativamente basso. Inoltre, le tecnologie linguistiche che si basano su sistemi statistici vanno incontro a limiti qualitativi notevoli nel caso delle lingue meno considerate, come si può vedere, ad esempio, nelle traduzioni errate, spesso divertenti, che sono rilasciate dai sistemi di traduzione automatica on-line. Secondo il rapporto, occorrerà un approccio coordinato, un impegno su larga scala in Europa per creare quelle tecnologie mancanti e trasferirle alle lingue che sono in via di estinzione digitale. Lo studio esce in concomitanza con la Giornata Europea delle Lingue, un appuntamento con cadenza annuale che si celebra ogni 26 settembre dal 2001 e che ha il triplice obiettivo di sensibilizzare il pubblico al plurilinguismo in Europa, coltivare la diversità culturale e linguistica ed incoraggiare l’apprendimento delle lingue da parte di tutti, dentro e fuori il contesto scolastico. Qui è possibile trovare il programma degli eventi europei previsti per la Giornata Europea delle Lingue 2012.

di Stefano Pisani