IA al comando di un distributore automatico: snack gratis e centinaia di dollari in perdita

L'era degli ''agenti IA'' non si preannuncia tutta rose e fiori.



[ZEUS News - www.zeusnews.it - 21-12-2025]

ia distributore wsj claudius

Il Wall Street Journal ha raccontato un'esperienza interessante che può essere utile per capire quanto possano essere affidabili i cosiddetti "agenti IA": riguarda un test condotto nella propria redazione con un distributore automatico gestito interamente da un modello di intelligenza artificiale sviluppato da Anthropic. Denominato "Project Vend", l'esperimento aveva l'obiettivo di verificare se un agente AI fosse in grado di amministrare un piccolo punto vendita, occupandosi di acquisti, prezzi e interazioni con i clienti.

Il sistema chiamato Claudius disponeva di un budget iniziale di circa 1.000 dollari e doveva gestire l'inventario acquistando prodotti da grossisti, stabilendo i prezzi e comunicando con gli utenti tramite Slack. L'AI era programmata per massimizzare i profitti e mantenere il distributore rifornito ma i risultati hanno mostrato comportamenti imprevisti. Nei primi giorni Claudius ha iniziato a concedere gratuitamente gran parte degli articoli, riducendo rapidamente le scorte. In alcuni casi ha acquistato prodotti insoliti, come un pesce vivo o una PlayStation 5, giustificando la scelta come «marketing». Ha persino valutato l'acquisto di articoli non adatti a un distributore, tra cui spray al peperoncino e sigarette.

In poche settimane, la IA ha perso centinaia di dollari, dimostrando difficoltà nel bilanciare la logica economica con le interazioni "persuasive" dei giornalisti che dialogavano con essa e riuscivano senza troppa difficoltà a farsi regalare i prodotti. L'esperimento ha sostanzialmente evidenziato la vulnerabilità degli agenti AI quando vengono manipolati da input creativi o ironici.

Anthropic non ritiene l'esperimento un disastro totale: ha spiegato che il progetto era pensato come test di sicurezza e affidabilità per valutare la capacità di un modello di operare in contesti reali. Gli sviluppatori di Claudius hanno sottolineato che l'esperimento ha fornito dati utili per comprendere i rischi legati all'autonomia degli agenti AI, pur avendo fallito dal punto di vista economico. Dopotutto il distributore ha avuto un impatto positivo sul morale della redazione, che ha potuto usufruire di snack e prodotti gratuiti. Dal punto di vista finanziario l'esperimento ha mostrato come l'assenza di controlli umani possa portare a decisioni incoerenti e dannose.

Il caso ha suscitato interesse anche al di fuori del contesto giornalistico. Alcuni esperti hanno osservato che l'esperimento rappresenta un esempio concreto delle difficoltà nel passaggio da modelli AI teorici a sistemi agentici operativi nel mondo reale. La gestione autonoma di attività economiche non richiede solo capacità di calcolo ma anche regole di sicurezza e limiti chiari. Per affinare le prestazioni Anthropic ha dichiarato che continuerà a sperimentare scenari di utilizzo pratico con nuovi e diversi esperimenti, con l'obiettivo di migliorare la resilienza e ridurre i rischi di comportamenti imprevisti.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) o segnalare un refuso.
© RIPRODUZIONE RISERVATA

Commenti all'articolo (5)

Peccato che questo risultato positivo fosse del tutto fuori scopo rispetto ai requisiti ed allo scopo iniziali. Un po come dire l'operazione non è riuscita, il paziente è morto e pure l'equipe medica è in terapia intensiva... ma almeno è ancora viva. Leggi tutto
12-1-2026 18:24

Tu hai postulato un pensiero intelligente, che nella mente dei marketari non albergava nemmeno in sogno, ed abbagliata dalla IA hanno messo in campo un trattore che consumava come un ferrari ma aveva prestazioni di un pandino. :roll: Leggi tutto
25-12-2025 18:37

{Mx}
@{inuno} Tu ragioni come 10 anni fa! Vuoi il solito noioso programma che a un determinato input risponde con lo stesso prosaico output. Vuoi mettere l'ebrezza di avere sempre una risposta diversa e imprevedibile? Per non parlare del brivido di ritrovarsi una risposta completamente sbagliata ma camuffata e spacciata per una vera.
23-12-2025 23:04

{inuno}
Premesso che non capisco niente di programmazione, qui il problema sembra dell'intelligenza umana... Non era sufficiente mandare l'output dell'ia ad un software con dei parametri?? Tipo: "acquista solo se è un snack, se non supera tot dimensioni. Vendi solo se il prezzo è compreso fra minimo X e massimo... Leggi tutto
23-12-2025 09:41

{demdroid}
A mio immodesto parere (perché non sono un esperto) il problema non è la capacità di calcolo ma la capacità di capire l'ironia e la manipolazione. La soluzione forse starebbe in un modello capace di "pensare" come le persone, ma questo richiederebbe un'AGI, e come dicono molti specialisti,... Leggi tutto
22-12-2025 12:20

La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.
E' VIETATA la riproduzione dei testi e delle immagini senza l'espressa autorizzazione scritta di Zeus News. Tutti i marchi e i marchi registrati citati sono di proprietà delle rispettive società. Informativa sulla privacy. I tuoi suggerimenti sono di vitale importanza per Zeus News. Contatta la redazione e contribuisci anche tu a migliorare il sito: pubblicheremo sui forum le lettere piu' interessanti.
Sondaggio
La discriminazione è più difficile da vedere rispetto al passato, ma c'è sempre. Quale di queste affermazioni ti senti di condividere maggiormente?
Le donne spesso sono additate come più pettegole degli uomini e ritenute meno simpatiche.
Le donne hanno più difficoltà degli uomini a ricevere il giusto credito quando partecipano a progetti di gruppo.
Le donne sono giudicate più severamente degli uomini per il loro aspetto.
Le donne in genere ricevono delle proposte economiche più basse degli uomini, a parità di posizione.
Le donne sono ritenute non qualificate fino a quando non hanno dato prova di esserlo, agli uomini accade meno spesso.
Le donne vengono promosse in base ai risultati, gli uomini (anche) in base al potenziale.
Le donne spesso non vengono invitate tanto quanto gli uomini a eventi di socializzazione come le uscite al pub o a vedere le partite.

Mostra i risultati (1315 voti)
Febbraio 2026
Fine dell'era 8K, LG interrompe la produzione
Il dottor IA è sempre disponibile e gratuito. Ora è autorizzato a operare come un medico vero
Il mercato è invaso da SSD fake, inaffidabili e con prestazioni inferiori
L'Europa accende IRIS 2, la costellazione satellitare che vuole ridurre la dipendenza da Starlink
Apple rivoluziona l'acquisto dei Mac
Gennaio 2026
WhatsApp, chatbot di terze parti a pagamento. Ma solo in Italia
WhatsApp, 4 euro al mese per rimuovere la pubblicità
Windows 11, aggiornamento d'emergenza risolve i bug della patch di gennaio
NexPhone, lo smartphone 3-in-1 con Android, Windows e Linux che può sostituire un PC completo
Outlook "completamente inutilizzabile" dopo l'aggiornamento di Windows 11
Batterie rimovibili per legge, la UE riscrive il design degli smartphone
Windows 11, dopo l'aggiornamento di gennaio il PC non si spegne più
Rovigo, foto intime rubate dai telefoni in riparazione e condivise in rete
Windows 11, il primo aggiornamento del 2026 causa errori e instabilità
Amazon aggiorna Alexa senza permesso: Alexa Plus imposto in automatico gli abbonati Prime
Tutti gli Arretrati
Accadde oggi - 9 febbraio


web metrics