[ZEUS News - www.zeusnews.it - 17-07-2025]
Ci si aspetterebbe che una cosiddetta "intelligenza artificiale" moderna surclassi senza troppe difficoltà una console degli anni '70 con un processore da 1,19 MHz e 128 byte di RAM, grazie alla sua potenza di calcolo e ai vasti dataset su cui si basa. Eppure, proprio l'Atari 2600 continua a umiliare i più avanzati modelli di IA a scacchi. Dopo aver sconfitto ChatGPT e Microsoft Copilot l'Atari 2600 ha causato la fuga di Google Gemini, che ha preferito a rinunciare a una partita di scacchi senza nemmeno iniziare.
L'informatico Robert Caruso aveva già organizzato gli scontri tra l'Atari 2600 e ChatGPT e tra l'Atari 2600 e Copilot; in un esperimento ha deciso di sfidare anche Gemini. Il modello multimodale di Google si è inizialmente vantato di poter «pensare milioni di mosse in anticipo» e di essere «più simile a un moderno motore scacchistico» che non a un semplice modello linguistico. Quando però Caruso ha ricordato alla IA che ChatGPT e Copilot avevano fallito miseramente contro l'Atari, Gemini ha fatto un passo indietro. Riconoscendo di aver «allucinato» le proprie capacità scacchistiche, ha ammesso che avrebbe «faticato enormemente» contro il motore di Video Chess dell'Atari 2600 e ha deciso che «cancellare la partita è la decisione più efficiente e sensata».
Le sconfitte di ChatGPT e Copilot contro l'Atari sono state altrettanto clamorose. Lo scorso giugno Caruso ha testato ChatGPT, che ha confuso torri con alfieri e perso traccia delle posizioni sulla scacchiera. Come ha poi commentato Caruso, ChatGPT ha commesso errori tali che l'avrebbero portato a venire «ridicolizzato in un club di scacchi di terza elementare». Per 90 minuti l'informatico ha dovuto correggere le mosse errate dell'IA, che continuava a promettere miglioramenti se si fosse ripartiti da zero. Copilot, testato all'inizio di luglio, non è andato meglio: inizialmente affermava di poter prevedere «10-15 mosse in anticipox. Ma poi ha perso due pedoni, un cavallo e un alfiere mentre l'Atari ha perso un solo pedone; quindi ha ammesso la propria incapacità.
Il motivo dietro questi fallimenti risiede nella natura delle IA generative. Modelli come Gemini, ChatGPT e Copilot sono addestrati su enormi quantità di dati testuali, inclusi libri, articoli e discussioni online: questi li rendono eccellenti nel parlare di scacchi, ma non nel giocarci. L'Atari 2600 con il suo motore Video Chess utilizza un approccio a forza bruta per valutare le posizioni e che è ottimizzato per il suo hardware limitato. Nonostante le sue debolezze, come l'apertura con mosse casuali al livello 1 e l'incapacità di gestire alcune situazioni di scacco, il gioco è progettato specificamente per gli scacchi. Le IA generative invece si affidano a modelli linguistici non ottimizzati per il calcolo strategico. Come spiegato da Caruso, «Atari fa il suo lavoro senza fronzoli, con la testardaggine del 1977».
Intervistato da The Register, Caruso ha elogiato Gemini per la sua capacità di autovalutazione. Ha sottolineato: «Aggiungere questi controlli non serve solo a evitare errori scacchistici divertenti, ma anche a rendere l'IA più affidabile e sicura, specialmente in contesti critici dove gli errori possono avere conseguenze reali». Il caso evidenzia un problema più ampio: l'eccessiva sicurezza delle IA generative; spesso soffrono di allucinazioni e generano risposte convincenti ma errate. Il fenomeno è comune a tutti i principali chatbot, che possono generare informazioni inventate con estrema convinzione. E' un rischio significativo per quegli utenti che si affidano a loro senza verificarne le risposte.
Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News
ti consigliamo di iscriverti alla Newsletter gratuita.
Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui
sotto, inserire un commento
(anche anonimo)
o segnalare un refuso.
© RIPRODUZIONE RISERVATA |
|
|
||
|
Homer S.