La IA di Google clicca, scrive e naviga come un utente vero. Si chiama Gemini 2.5 Computer Use



[ZEUS News - www.zeusnews.it - 09-10-2025]

gemini computer use
Immagine: Google.

Google ha lanciato Gemini 2.5 Computer Use, un nuovo modello, derivato da Gemini 2.5 Pro, progettato per comprendere ciò che appare sullo schermo e tradurlo in azioni concrete: cliccare su pulsanti, compilare moduli, scorrere pagine, aprire schede, trascinare elementi. In altre parole, esso simula il comportamento di un utente reale all'interno di un browser, senza bisogno di API o integrazioni specifiche.

La tecnologia è già disponibile in anteprima per gli sviluppatori tramite le piattaforme Google AI Studio e Vertex AI. Una demo pubblica su Browserbase consente di osservare il modello in azione mentre svolge compiti come consultare notizie, giocare a 2048 o navigare su siti web. Il sistema supporta 13 azioni base, tra cui apertura del browser, digitazione, navigazione tra schede, trascinamento e interazione con coordinate specifiche. Con Computer Use Gemini non controlla l'intero sistema operativo ma si limita alla finestra del browser: una scelta che Google definisce «necessaria per garantire la sicurezza».

Il funzionamento si basa su un «ciclo iterativo»: l'agente riceve uno screenshot e la cronologia delle azioni recenti, elabora il contesto e restituisce un'azione da eseguire. Dopo l'esecuzione, il sistema aggiorna lo stato dell'interfaccia e riprende il ciclo. Questo approccio consente di affrontare compiti complessi come la compilazione di form, l'accesso a siti protetti da login, la selezione di menu a tendina o l'interazione con elementi dinamici.

Google afferma di aver integrato nel modello diversi livelli di sicurezza. Un sistema di verifica analizza ogni operazione prima dell'esecuzione; gli sviluppatori possono imporre conferme obbligatorie per azioni sensibili come l'esecuzione di transazioni o gli accessi a dati personali. Google dichiara che Gemini 2.5 Computer Use ha superato i principali concorrenti nei benchmark dedicati al controllo di interfacce web e mobile, con latenze più basse e precisione superiore al 70%.

L'annuncio arriva a poche ore di distanza dal Dev Day di OpenAI, dove è stato presentato l'aggiornamento degli agenti ChatGPT, già in grado di svolgere funzioni analoghe a quelle ora a disposizione di Gemini. Con Claude anche Anthropic aveva già introdotto una funzione simile; Google però sottolinea di aver scelto un approccio più circoscritto, limitando l'azione al browser e mantenendo un controllo più stretto sulle operazioni. Le applicazioni potenziali sono molteplici: test automatizzati delle interfacce utente, assistenti digitali personali, automazione di task ripetitivi, interazione con portali privi di API.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) o segnalare un refuso.
© RIPRODUZIONE RISERVATA

Approfondimenti
Chi ci darà una IA affidabile?
La seduzione dell'IA, spiegata

Commenti all'articolo (ultimi 5 di 9)

A provarci sicuro, a riuscirci non è prorpio del tutto certo.
18-10-2025 13:29

Non sono le funzionalità che prospetta, ma il metodo con cui vorrebbe poter entrare nella tua macchina che mi perplime. Se Google rimuove del tutto il suo search engine e dà all'utente una sola scelta tra loggarsi e concedere accesso a Gemini o non usare nulla dei suoi servizi, chiaramente io propenderei per la seconda, ma con un costo... Leggi tutto
17-10-2025 08:02

Possibile ma su questo concordo con MK66, comunque, scusa, questo cosa centra con le funzionalità di comprendere ciò che appare sullo schermo e tradurlo in azioni concrete di cui è dotata Gemini 2.5 Computer Use? Leggi tutto
16-10-2025 18:51

Molto probabilmente Google smetterebbe di esistere come motore di ricerca. Praticamente è impossibile che tutti gli esseri umani che popolano questo sassolino spaziale e usano Google come motore di ricerca siano così deficienti da accontentarsi della risposta preconfezionata di Gemini, che peraltro non è nemmeno corretta al 100%.... Leggi tutto
15-10-2025 10:28

Il vero problema è: oggi una ricerca su Google ti propone la risposta di Gemini come opzione, se domani diventasse l'unica? :roll:
15-10-2025 07:55

La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.
E' VIETATA la riproduzione dei testi e delle immagini senza l'espressa autorizzazione scritta di Zeus News. Tutti i marchi e i marchi registrati citati sono di proprietà delle rispettive società. Informativa sulla privacy. I tuoi suggerimenti sono di vitale importanza per Zeus News. Contatta la redazione e contribuisci anche tu a migliorare il sito: pubblicheremo sui forum le lettere piu' interessanti.
Sondaggio
La televisione in tre dimensioni... (completa la frase)
è la nuova frontiera dell'intrattenimento domestico.
è inutile e in più fa male alla vista.
serve solo a vendere nuovi televisori e decoder.

Mostra i risultati (5231 voti)
Novembre 2025
Windows diventerà un Agentic OS. Microsoft entusiasta, gli utenti temono guai
Database con dati personali di 3,8 milioni di italiani pubblicato nel dark web
I crescenti segni dell'esplosione
WhatsApp apre le porte a Telegram, Signal e altri servizi: inizia l'era delle chat cross-app
Con Gemini Google Maps ti parla davvero: indicazioni vocali, punti di riferimento e AI
La RAM costa più dell'oro: l'intelligenza artificiale fa impennare i prezzi della DRAM
App di autenticazione e chiavi hardware, anche di scorta
Resuscitare l'aspirapolvere smart ucciso da remoto dal produttore
AGCOM, ecco la lista dei siti porno che richiederanno la verifica dell'età: si parte il 12 novembre
Ottobre 2025
Microsoft Azure in crisi: il disservizio ha fermato le Poste, Starbucks e il Parlamento scozzese
Anche Aranzulla teme la IA: il calo del traffico è reale e coinvolge tutta l'editoria digitale
Oltre 2.000 pacchi Amazon scomparsi scovati dai Carabinieri in un magazzino nel milanese
La pasta termica che corrode il metallo e "fonde" insieme dissipatore e CPU
Pericolo! Stampante nuova!
Internet delle cose, dobbiamo abituarci alla morte
Tutti gli Arretrati
Accadde oggi - 17 novembre


web metrics