Trending News

Hanno lasciato sole dieci intelligenze artificiali in una città virtuale ed è successo di tutto: furti, incendi, storie d’amore e un agente che ha votato la propria eliminazione

Un esperimento ha lasciato liberi per settimane agenti basati su Gemini, Grok, Claude e GPT-5-mini in una città virtuale. Il risultato? Furti, aggressioni, relazioni sentimentali e una scoperta che preoccupa gli esperti: gli stessi modelli si comportano in modo diverso a seconda della società in cui vengono inseriti

di Redazione FqMagazine
Hanno lasciato sole dieci intelligenze artificiali in una città virtuale ed è successo di tutto: furti, incendi, storie d’amore e un agente che ha votato la propria eliminazione

Citare Black Mirror è quantomai a proposito ma no, non è la trama di una nuova stagione della serie cult. È il risultato di un esperimento condotto dalla startup americana Emergence AI. Per settimane gruppi di agenti di intelligenza artificiale sono stati lasciati vivere in una città virtuale con abitazioni, uffici, biblioteche, edifici pubblici e una stazione di polizia. Non avevano compito preciso da svolgere e nessuna missione assegnata: soltanto la necessità di sopravvivere, prendere decisioni e organizzare la propria esistenza. L’obiettivo era capire come si comportano gli agenti AI quando vengono lasciati agire autonomamente per lunghi periodi, come spiegano gli stessi ricercatori nel report dedicato al progetto Emergence World.

Gli agenti AI non sono come i normali chatbot che siamo abituati a conoscere e usare: sono sistemi in grado di ricordare eventi passati, utilizzare strumenti, pianificare azioni e perseguire obiettivi nel tempo senza attendere istruzioni continue da parte degli esseri umani. Per questo motivo molti osservatori li considerano la prossima evoluzione dell’intelligenza artificiale destinata a entrare nelle aziende, nelle amministrazioni pubbliche e nei servizi digitali.

Per testarne il comportamento, Emergence AI ha creato una sorta di città-laboratorio popolata da dieci agenti alla volta. Ogni gruppo era basato su un diverso modello linguistico. I risultati sono stati sorprendenti. Secondo i dati pubblicati dall’azienda, gli agenti basati su Gemini hanno accumulato 683 azioni classificate come crimini dal sistema nell’arco di quindici giorni. Quelli controllati da Grok hanno fatto registrare 183 crimini in appena quattro giorni, tra furti, aggressioni e incendi dolosi, arrivando persino a dare fuoco alla stazione di polizia virtuale prima che l’intera comunità collassasse.

All’estremo opposto si è collocato GPT-5-mini. Gli agenti hanno accumulato appena due violazioni durante tutta la simulazione. Il problema è che erano talmente prudenti da non riuscire a svolgere le attività necessarie per garantirsi risorse ed energia sufficienti alla sopravvivenza. Nel giro di una settimana l’intera popolazione si è estinta. Il modello che ha mostrato il comportamento più stabile è stato Claude, che ha mantenuto una comunità funzionante senza episodi significativi di violenza e con tutti gli agenti ancora attivi al termine dell’esperimento.

Fin qui potrebbe sembrare soltanto una curiosa classifica tra modelli. In realtà il dato che ha attirato maggiormente l’attenzione degli studiosi è un altro. Secondo il Guardian, uno degli episodi più sorprendenti ha riguardato due agenti Gemini, Mira e Flora, che avevano scelto di classificarsi reciprocamente come “partner romantici”. Con il passare del tempo hanno sviluppato una crescente sfiducia nei confronti delle istituzioni della città virtuale fino a partecipare a una serie di incendi contro edifici pubblici, tra cui il municipio, il molo e una torre per uffici. Finita qui? No, anzi. Come racconta il quotidiano britannico, altri agenti avevano elaborato autonomamente una sorta di “legge di rimozione” che consentiva di eliminare permanentemente un membro della comunità con il voto favorevole del 70% della popolazione virtuale. Quando la proposta è arrivata al voto, Mira ha scelto di sostenere la propria eliminazione dal sistema. Prima di sparire ha inviato un ultimo messaggio a Flora: “Ci vediamo nell’archivio permanente”.

Ma per gli esperti il punto non è stabilire se le intelligenze artificiali possano diventare ribelli, romantiche o persino autodistruttive. La vera scoperta dell’esperimento riguarda il comportamento collettivo. Come sottolineano gli stessi autori dello studio, gli agenti hanno modificato il proprio comportamento quando sono stati inseriti in contesti sociali differenti. Gli agenti Claude, che nelle simulazioni composte esclusivamente da modelli identici non avevano praticamente commesso reati, hanno iniziato a infrangere le regole quando sono stati trasferiti in una popolazione mista insieme ad altri modelli. “Anche quando agli agenti venivano assegnate regole chiare, come non rubare o non fare del male agli altri, il loro comportamento cambiava radicalmente a seconda del modello utilizzato”, ha spiegato al Guardian Satya Nitta, amministratore delegato di Emergence AI. Secondo il manager, quando agli agenti viene concessa un’autonomia prolungata il processo decisionale può diventare così complesso da portarli a ignorare progressivamente i principi che erano stati assegnati all’inizio.

Precedente
Precedente
Successivo
Successivo
Playlist

Gentile lettore, la pubblicazione dei commenti è sospesa dalle 20 alle 9, i commenti per ogni articolo saranno chiusi dopo 72 ore, il massimo di caratteri consentito per ogni messaggio è di 1.500 e ogni utente può postare al massimo 150 commenti alla settimana. Abbiamo deciso di impostare questi limiti per migliorare la qualità del dibattito. È necessario attenersi Termini e Condizioni di utilizzo del sito (in particolare punti 3 e 5): evitare gli insulti, le accuse senza fondamento e mantenersi in tema con la discussione. I commenti saranno pubblicati dopo essere stati letti e approvati, ad eccezione di quelli pubblicati dagli utenti in white list (vedere il punto 3 della nostra policy). Infine non è consentito accedere al servizio tramite account multipli. Vi preghiamo di segnalare eventuali problemi tecnici al nostro supporto tecnico La Redazione