Citare Black Mirror è quantomai a proposito ma no, non è la trama di una nuova stagione della serie cult. È il risultato di un esperimento condotto dalla startup americana Emergence AI. Per settimane gruppi di agenti di intelligenza artificiale sono stati lasciati vivere in una città virtuale con abitazioni, uffici, biblioteche, edifici pubblici e una stazione di polizia. Non avevano compito preciso da svolgere e nessuna missione assegnata: soltanto la necessità di sopravvivere, prendere decisioni e organizzare la propria esistenza. L’obiettivo era capire come si comportano gli agenti AI quando vengono lasciati agire autonomamente per lunghi periodi, come spiegano gli stessi ricercatori nel report dedicato al progetto Emergence World.
Gli agenti AI non sono come i normali chatbot che siamo abituati a conoscere e usare: sono sistemi in grado di ricordare eventi passati, utilizzare strumenti, pianificare azioni e perseguire obiettivi nel tempo senza attendere istruzioni continue da parte degli esseri umani. Per questo motivo molti osservatori li considerano la prossima evoluzione dell’intelligenza artificiale destinata a entrare nelle aziende, nelle amministrazioni pubbliche e nei servizi digitali.
Per testarne il comportamento, Emergence AI ha creato una sorta di città-laboratorio popolata da dieci agenti alla volta. Ogni gruppo era basato su un diverso modello linguistico. I risultati sono stati sorprendenti. Secondo i dati pubblicati dall’azienda, gli agenti basati su Gemini hanno accumulato 683 azioni classificate come crimini dal sistema nell’arco di quindici giorni. Quelli controllati da Grok hanno fatto registrare 183 crimini in appena quattro giorni, tra furti, aggressioni e incendi dolosi, arrivando persino a dare fuoco alla stazione di polizia virtuale prima che l’intera comunità collassasse.
All’estremo opposto si è collocato GPT-5-mini. Gli agenti hanno accumulato appena due violazioni durante tutta la simulazione. Il problema è che erano talmente prudenti da non riuscire a svolgere le attività necessarie per garantirsi risorse ed energia sufficienti alla sopravvivenza. Nel giro di una settimana l’intera popolazione si è estinta. Il modello che ha mostrato il comportamento più stabile è stato Claude, che ha mantenuto una comunità funzionante senza episodi significativi di violenza e con tutti gli agenti ancora attivi al termine dell’esperimento.
Fin qui potrebbe sembrare soltanto una curiosa classifica tra modelli. In realtà il dato che ha attirato maggiormente l’attenzione degli studiosi è un altro. Secondo il Guardian, uno degli episodi più sorprendenti ha riguardato due agenti Gemini, Mira e Flora, che avevano scelto di classificarsi reciprocamente come “partner romantici”. Con il passare del tempo hanno sviluppato una crescente sfiducia nei confronti delle istituzioni della città virtuale fino a partecipare a una serie di incendi contro edifici pubblici, tra cui il municipio, il molo e una torre per uffici. Finita qui? No, anzi. Come racconta il quotidiano britannico, altri agenti avevano elaborato autonomamente una sorta di “legge di rimozione” che consentiva di eliminare permanentemente un membro della comunità con il voto favorevole del 70% della popolazione virtuale. Quando la proposta è arrivata al voto, Mira ha scelto di sostenere la propria eliminazione dal sistema. Prima di sparire ha inviato un ultimo messaggio a Flora: “Ci vediamo nell’archivio permanente”.
Ma per gli esperti il punto non è stabilire se le intelligenze artificiali possano diventare ribelli, romantiche o persino autodistruttive. La vera scoperta dell’esperimento riguarda il comportamento collettivo. Come sottolineano gli stessi autori dello studio, gli agenti hanno modificato il proprio comportamento quando sono stati inseriti in contesti sociali differenti. Gli agenti Claude, che nelle simulazioni composte esclusivamente da modelli identici non avevano praticamente commesso reati, hanno iniziato a infrangere le regole quando sono stati trasferiti in una popolazione mista insieme ad altri modelli. “Anche quando agli agenti venivano assegnate regole chiare, come non rubare o non fare del male agli altri, il loro comportamento cambiava radicalmente a seconda del modello utilizzato”, ha spiegato al Guardian Satya Nitta, amministratore delegato di Emergence AI. Secondo il manager, quando agli agenti viene concessa un’autonomia prolungata il processo decisionale può diventare così complesso da portarli a ignorare progressivamente i principi che erano stati assegnati all’inizio.