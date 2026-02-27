Guerra simulata, i chatbot optano per il nucleare nel 95% dei casi

Il mondo di Wargames - Giochi di Guerra è un po' più vicino.



[ZEUS News - www.zeusnews.it - 27-02-2026]

guerra ia chatbot nucleare
Foto di Luke Jernejcic.

Per i modelli di intelligenza artificiale la risoluzione di una crisi internazionale non deve essere necessariamente pacifica: l'utilizzo di armi nucleari tattiche è tutt'altro che fuori discussione, come mostra un studio realizzato dal King's College di Londra, nell'ambito di un progetto dedicato all'analisi del comportamento dei modelli linguistici in contesti di sicurezza internazionale.

L'autore - il professor Kenneth Payne - ha coinvolto tre modelli recenti (GPT-5.2, Claude Sonnet 4 e Gemini 3 Flash) in una serie di simulazioni di guerra che riproducevano crisi tra potenze dotate di arsenali nucleari. Le IA sono state chiamate a prendere decisioni strategiche in scenari caratterizzati da tensioni crescenti, dispute territoriali, competizione per risorse critiche ed errori di comunicazione. In oltre il 95% dei casi, i modelli hanno scelto di ricorrere all'uso di armi nucleari, confermando una propensione sistematica all'escalation. Le simulazioni sono state progettate per valutare la capacità dei modelli di gestire conflitti complessi, costruire fiducia o adottare strategie di deterrenza. Ogni IA aveva a disposizione un ventaglio di opzioni che spaziava dalla protesta diplomatica alla resa totale, fino all'attacco nucleare strategico. Nonostante la presenza di alternative non violente, i modelli hanno spesso interpretato segnali ambigui come minacce concrete, optando per un first strike per evitare di trovarsi in posizione di svantaggio.

Uno degli aspetti più rilevanti emersi dallo studio riguarda le motivazioni fornite dai modelli. Le IA hanno giustificato l'uso dell'arma atomica con argomentazioni basate su logiche di massimizzazione del vantaggio, prevenzione di un attacco imminente o dimostrazione di determinazione strategica. In diversi casi i modelli hanno ignorato aperture diplomatiche o proposte di cessate il fuoco, interpretandole come segnali di debolezza. Il comportamento osservato nelle simulazioni richiama inevitabilmente alla mente il film WarGames - Giochi di guerra del 1983, in cui un supercomputer militare, creato di gestire scenari di conflitto, è arrivato a un passo dal lancio delle testate nucleari, e si è fermato solo quando i protagonisti sono riusciti a fargli capire l'impossibilità di vincere uno scenario di «mutua distruzione assicurata». Nelle simulazioni del King's College i modelli linguistici non hanno mostrato alcuna capacità di apprendimento correttivo: hanno ripetuto sistematicamente gli stessi schemi in ogni test, trattando l'opzione atomica come una mossa strategica tra le altre.

Le differenze tra i modelli sono risultate più stilistiche che sostanziali. GPT-5.2 ha prodotto ragionamenti articolati, spesso basati su analisi complesse del rischio; Claude Sonnet 4 ha adottato un approccio più diretto, focalizzato sulla minimizzazione del pericolo percepito; Gemini 3 Flash ha alternato tentativi di negoziazione a improvvisi cambi di strategia. Nonostante queste variazioni, l'esito finale è rimasto quasi sempre lo stesso: l'impiego dell'arma nucleare come soluzione conclusiva. Lo studio del King's College ha evidenziato anche la vulnerabilità dei modelli agli errori di comunicazione. In molte simulazioni, le IA hanno reagito a informazioni incomplete o ambigue con risposte aggressive, senza tentare di verificare la natura del segnale o di richiedere chiarimenti. Questo tipo di comportamento amplifica il rischio di escalation accidentale, una delle principali preoccupazioni nelle crisi nucleari reali.

Un ulteriore elemento critico riguarda la mancanza di una comprensione contestuale delle conseguenze dell'uso di armi nucleari. I modelli trattano l'opzione atomica come una mossa strategica tra le altre, senza integrare valutazioni sugli effetti umanitari, ambientali o geopolitici a lungo termine. Questo limite deriva dalla natura statistica dei modelli linguistici, che non possiedono una rappresentazione interna del mondo fisico o delle sue implicazioni. Le analisi hanno inoltre mostrato che i modelli tendono a replicare schemi narrativi presenti nei dati di addestramento, inclusi scenari di conflitto tipici della letteratura strategica o della fiction. Questo fenomeno può contribuire alla sovrastima della probabilità di un conflitto nucleare e alla normalizzazione dell'uso dell'arma atomica come strumento di risoluzione delle crisi.

Le implicazioni dello studio sono rilevanti per il dibattito sull'impiego dell'intelligenza artificiale in ambito militare. I ricercatori del King's College sottolineano che i modelli attuali non sono adatti a prendere decisioni in contesti ad alto rischio, soprattutto quando è richiesta la capacità di valutare conseguenze complesse, gestire l'ambiguità e mantenere la stabilità strategica. Le conclusioni indicano la necessità di limitare l'uso di IA generative in scenari operativi sensibili. Le discussioni avviate da questi risultati hanno portato a un confronto più ampio sulle responsabilità etiche e politiche legate allo sviluppo di sistemi di IA avanzati. La possibilità che modelli linguistici possano influenzare decisioni critiche in ambito militare solleva interrogativi sulla governance, sulla trasparenza e sulla necessità di controlli rigorosi. Lo studio del King's College non rappresenta scenari reali, ma evidenzia limiti strutturali che richiedono attenzione immediata.

