IA al comando di un distributore automatico: snack gratis e centinaia di dollari in perdita

L'era degli ''agenti IA'' non si preannuncia tutta rose e fiori.



[ZEUS News - www.zeusnews.it - 21-12-2025]

ia distributore wsj claudius

Il Wall Street Journal ha raccontato un'esperienza interessante che può essere utile per capire quanto possano essere affidabili i cosiddetti "agenti IA": riguarda un test condotto nella propria redazione con un distributore automatico gestito interamente da un modello di intelligenza artificiale sviluppato da Anthropic. Denominato "Project Vend", l'esperimento aveva l'obiettivo di verificare se un agente AI fosse in grado di amministrare un piccolo punto vendita, occupandosi di acquisti, prezzi e interazioni con i clienti.

Il sistema chiamato Claudius disponeva di un budget iniziale di circa 1.000 dollari e doveva gestire l'inventario acquistando prodotti da grossisti, stabilendo i prezzi e comunicando con gli utenti tramite Slack. L'AI era programmata per massimizzare i profitti e mantenere il distributore rifornito ma i risultati hanno mostrato comportamenti imprevisti. Nei primi giorni Claudius ha iniziato a concedere gratuitamente gran parte degli articoli, riducendo rapidamente le scorte. In alcuni casi ha acquistato prodotti insoliti, come un pesce vivo o una PlayStation 5, giustificando la scelta come «marketing». Ha persino valutato l'acquisto di articoli non adatti a un distributore, tra cui spray al peperoncino e sigarette.

In poche settimane, la IA ha perso centinaia di dollari, dimostrando difficoltà nel bilanciare la logica economica con le interazioni "persuasive" dei giornalisti che dialogavano con essa e riuscivano senza troppa difficoltà a farsi regalare i prodotti. L'esperimento ha sostanzialmente evidenziato la vulnerabilità degli agenti AI quando vengono manipolati da input creativi o ironici.

Anthropic non ritiene l'esperimento un disastro totale: ha spiegato che il progetto era pensato come test di sicurezza e affidabilità per valutare la capacità di un modello di operare in contesti reali. Gli sviluppatori di Claudius hanno sottolineato che l'esperimento ha fornito dati utili per comprendere i rischi legati all'autonomia degli agenti AI, pur avendo fallito dal punto di vista economico. Dopotutto il distributore ha avuto un impatto positivo sul morale della redazione, che ha potuto usufruire di snack e prodotti gratuiti. Dal punto di vista finanziario l'esperimento ha mostrato come l'assenza di controlli umani possa portare a decisioni incoerenti e dannose.

Il caso ha suscitato interesse anche al di fuori del contesto giornalistico. Alcuni esperti hanno osservato che l'esperimento rappresenta un esempio concreto delle difficoltà nel passaggio da modelli AI teorici a sistemi agentici operativi nel mondo reale. La gestione autonoma di attività economiche non richiede solo capacità di calcolo ma anche regole di sicurezza e limiti chiari. Per affinare le prestazioni Anthropic ha dichiarato che continuerà a sperimentare scenari di utilizzo pratico con nuovi e diversi esperimenti, con l'obiettivo di migliorare la resilienza e ridurre i rischi di comportamenti imprevisti.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) o segnalare un refuso.
© RIPRODUZIONE RISERVATA

Commenti all'articolo (3)

{Mx}
@{inuno} Tu ragioni come 10 anni fa! Vuoi il solito noioso programma che a un determinato input risponde con lo stesso prosaico output. Vuoi mettere l'ebrezza di avere sempre una risposta diversa e imprevedibile? Per non parlare del brivido di ritrovarsi una risposta completamente sbagliata ma camuffata e spacciata per una vera.
23-12-2025 23:04

{inuno}
Premesso che non capisco niente di programmazione, qui il problema sembra dell'intelligenza umana... Non era sufficiente mandare l'output dell'ia ad un software con dei parametri?? Tipo: "acquista solo se è un snack, se non supera tot dimensioni. Vendi solo se il prezzo è compreso fra minimo X e massimo... Leggi tutto
23-12-2025 09:41

{demdroid}
A mio immodesto parere (perché non sono un esperto) il problema non è la capacità di calcolo ma la capacità di capire l'ironia e la manipolazione. La soluzione forse starebbe in un modello capace di "pensare" come le persone, ma questo richiederebbe un'AGI, e come dicono molti specialisti,... Leggi tutto
22-12-2025 12:20

La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.
E' VIETATA la riproduzione dei testi e delle immagini senza l'espressa autorizzazione scritta di Zeus News. Tutti i marchi e i marchi registrati citati sono di proprietà delle rispettive società. Informativa sulla privacy. I tuoi suggerimenti sono di vitale importanza per Zeus News. Contatta la redazione e contribuisci anche tu a migliorare il sito: pubblicheremo sui forum le lettere piu' interessanti.
Sondaggio
Cosa ne pensi del ritocco digitale dei film classici (non solo di fantascienza)?
E' un falso storico; i film vanno visti come furono girati.
E' necessario, per evitare che certi film vengano dimenticati.
Va bene, basta che sia indicato chiaramente.
Non me ne può fregar di meno.

Mostra i risultati (3505 voti)
Dicembre 2025
Call center Konecta, mille lavoratori a rischio tra Piemonte e Toscana
Dalla frustrazione alla performance: imprecare rende più forti e resistenti
Ordina RAM DDR 5 su Amazon, riceve DDR 2: ecco come funziona la truffa del reso
Televisori LG, dopo l'aggiornamento compare l'app di Copilot. E non si può più togliere
Google lancia la traduzione simultanea universale: bastano qualsiasi telefono Android e auricolari
Tassa da 2 euro sui pacchi fino a 150 euro: la Manovra 2026 coinvolge milioni di spedizioni
Lo script open source che fa sparire Copilot, Recall e gli altri componenti IA da Windows 11
Google Antigravity cancella un intero drive: la IA si scusa, ma i dati sono persi
Migliaia di aerei A320 a terra. Perché è una buona notizia
Arduino passa a Qualcomm: la comunità hacker esplode di malcontento
Piracy Shield, i provider italiani presentano il conto: 10 milioni di euro l'anno
Il Digital Omnibus è una resa dell'Unione Europea?
Novembre 2025
MediaWorld vende iPad a 15 euro per errore, adesso li vuole tutti indietro
Riscaldano casa con un datacenter in giardino: giù i costi delle bollette
I Baschi Grigi della Cybersicurezza
Tutti gli Arretrati
Accadde oggi - 25 dicembre


web metrics