IA al comando di un distributore automatico: snack gratis e centinaia di dollari in perdita

L'era degli ''agenti IA'' non si preannuncia tutta rose e fiori.



[ZEUS News - www.zeusnews.it - 21-12-2025]

ia distributore wsj claudius

Il Wall Street Journal ha raccontato un'esperienza interessante che può essere utile per capire quanto possano essere affidabili i cosiddetti "agenti IA": riguarda un test condotto nella propria redazione con un distributore automatico gestito interamente da un modello di intelligenza artificiale sviluppato da Anthropic. Denominato "Project Vend", l'esperimento aveva l'obiettivo di verificare se un agente AI fosse in grado di amministrare un piccolo punto vendita, occupandosi di acquisti, prezzi e interazioni con i clienti.

Il sistema chiamato Claudius disponeva di un budget iniziale di circa 1.000 dollari e doveva gestire l'inventario acquistando prodotti da grossisti, stabilendo i prezzi e comunicando con gli utenti tramite Slack. L'AI era programmata per massimizzare i profitti e mantenere il distributore rifornito ma i risultati hanno mostrato comportamenti imprevisti. Nei primi giorni Claudius ha iniziato a concedere gratuitamente gran parte degli articoli, riducendo rapidamente le scorte. In alcuni casi ha acquistato prodotti insoliti, come un pesce vivo o una PlayStation 5, giustificando la scelta come «marketing». Ha persino valutato l'acquisto di articoli non adatti a un distributore, tra cui spray al peperoncino e sigarette.

In poche settimane, la IA ha perso centinaia di dollari, dimostrando difficoltà nel bilanciare la logica economica con le interazioni "persuasive" dei giornalisti che dialogavano con essa e riuscivano senza troppa difficoltà a farsi regalare i prodotti. L'esperimento ha sostanzialmente evidenziato la vulnerabilità degli agenti AI quando vengono manipolati da input creativi o ironici.

Anthropic non ritiene l'esperimento un disastro totale: ha spiegato che il progetto era pensato come test di sicurezza e affidabilità per valutare la capacità di un modello di operare in contesti reali. Gli sviluppatori di Claudius hanno sottolineato che l'esperimento ha fornito dati utili per comprendere i rischi legati all'autonomia degli agenti AI, pur avendo fallito dal punto di vista economico. Dopotutto il distributore ha avuto un impatto positivo sul morale della redazione, che ha potuto usufruire di snack e prodotti gratuiti. Dal punto di vista finanziario l'esperimento ha mostrato come l'assenza di controlli umani possa portare a decisioni incoerenti e dannose.

Il caso ha suscitato interesse anche al di fuori del contesto giornalistico. Alcuni esperti hanno osservato che l'esperimento rappresenta un esempio concreto delle difficoltà nel passaggio da modelli AI teorici a sistemi agentici operativi nel mondo reale. La gestione autonoma di attività economiche non richiede solo capacità di calcolo ma anche regole di sicurezza e limiti chiari. Per affinare le prestazioni Anthropic ha dichiarato che continuerà a sperimentare scenari di utilizzo pratico con nuovi e diversi esperimenti, con l'obiettivo di migliorare la resilienza e ridurre i rischi di comportamenti imprevisti.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) o segnalare un refuso.
© RIPRODUZIONE RISERVATA

Commenti all'articolo (5)

Peccato che questo risultato positivo fosse del tutto fuori scopo rispetto ai requisiti ed allo scopo iniziali. Un po come dire l'operazione non è riuscita, il paziente è morto e pure l'equipe medica è in terapia intensiva... ma almeno è ancora viva. Leggi tutto
12-1-2026 18:24

Tu hai postulato un pensiero intelligente, che nella mente dei marketari non albergava nemmeno in sogno, ed abbagliata dalla IA hanno messo in campo un trattore che consumava come un ferrari ma aveva prestazioni di un pandino. :roll: Leggi tutto
25-12-2025 18:37

{Mx}
@{inuno} Tu ragioni come 10 anni fa! Vuoi il solito noioso programma che a un determinato input risponde con lo stesso prosaico output. Vuoi mettere l'ebrezza di avere sempre una risposta diversa e imprevedibile? Per non parlare del brivido di ritrovarsi una risposta completamente sbagliata ma camuffata e spacciata per una vera.
23-12-2025 23:04

{inuno}
Premesso che non capisco niente di programmazione, qui il problema sembra dell'intelligenza umana... Non era sufficiente mandare l'output dell'ia ad un software con dei parametri?? Tipo: "acquista solo se è un snack, se non supera tot dimensioni. Vendi solo se il prezzo è compreso fra minimo X e massimo... Leggi tutto
23-12-2025 09:41

{demdroid}
A mio immodesto parere (perché non sono un esperto) il problema non è la capacità di calcolo ma la capacità di capire l'ironia e la manipolazione. La soluzione forse starebbe in un modello capace di "pensare" come le persone, ma questo richiederebbe un'AGI, e come dicono molti specialisti,... Leggi tutto
22-12-2025 12:20

La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.
E' VIETATA la riproduzione dei testi e delle immagini senza l'espressa autorizzazione scritta di Zeus News. Tutti i marchi e i marchi registrati citati sono di proprietà delle rispettive società. Informativa sulla privacy. I tuoi suggerimenti sono di vitale importanza per Zeus News. Contatta la redazione e contribuisci anche tu a migliorare il sito: pubblicheremo sui forum le lettere piu' interessanti.
Sondaggio
Fidanzati sospettosi o inguaribili diffidenti, qual è la vostra arma preferita tra quelle che Facebook mette a disposizione di voi gelosoni per controllare il vostro partner?
I cuoricini in bacheca: un segno per far sentire sempre e dovunque la propria presenza, nonché un espediente per marcare il territorio del partner.
L'applicazione "Chi ti segue di più?": bisogna convincere il partner a usare questa applicazione (apparentemente innocua) per scovare eventuali vittime da annotare sulla propria black list.
Facebook Places: permette di taggare compulsivamente il partner e rendere noto al mondo intero il fatto che lei e il suo lui si trovano sempre insieme.
L'auto tag nelle foto: indispensabile strumento per essere certi di ricevere notifiche qualora un'altra persona osasse commentare o piazzare "Mi piace" alle foto del/della partner.
I commenti minatori: il simpatico approccio ossessivo-compulsivo verso chi tagga il partner o ne invade la bacheca. Di solito consiste in un discreto: "Che bello il MIO amore!"
Il profilo Facebook in comune: un unico profilo scoraggia anche il più audace dei rivali dal tentare un approccio.
La password nota al partner: Della serie: "Amore, se non mi nascondi niente allora posso avere la tua password?". Nessun messaggio di posta, commento o notifica è al sicuro.
Il tasto "Rimuovi dagli amici": una volta in possesso della password del partner, qualsiasi rivale dalla foto profilo provocante o la cui identità è sconosciuta verrà subito rimosso dagli amici.
La trappola: spacciandosi per il partner (password nota), si inizia a contattare i presunti rivali e testare le loro intenzioni con domande e allusioni per far cadere in trappola anche i più astuti.
Il Mi piace minatorio: post, foto, tag, nuove amicizie sono regolarmente marchiati da un Mi piace del partner. Dietro una parvenza di apprezzamento, dimostrano quanto in realtà NON piaccia l'elemento.

Mostra i risultati (438 voti)
Maggio 2026
Gmail, lo spazio gratuito si riduce a 5 Gbyte
Crisi della RAM, in vendita DDR 5 false con i chip in fibra di vetro
Windows 11 accelera davvero
Password in chiaro nella memoria di Edge
Google Chrome scarica un modello AI da 4 GB senza avvisare gli utenti
Windows 11, il CEO Nadella ammette gli errori
Disastro PocketOS: l'agente IA cancella database e backup in pochi secondi senza supervisione
Aprile 2026
Telemarketing, arrivano i numeri brevi: identificheranno i servizi legittimi
Windows 11 cambia rotta: Microsoft ricostruisce il sistema attorno alle richieste degli utenti
Firefox 150, scovate 271 vulnerabilità con l'IA
IPv6 supera IPv4 per un giorno
Verifica dell'età, l'app UE si buca in meno di due minuti
Alexa+ debutta in Italia: conversa, agisce e si integra nella smart home
Verbatim e I-O Data puntano sul Blu-ray: rinasce un mercato dato per morto
La Francia abbandona Windows
Tutti gli Arretrati
Accadde oggi - 15 maggio


web metrics