La IA di Google clicca, scrive e naviga come un utente vero. Si chiama Gemini 2.5 Computer Use



[ZEUS News - www.zeusnews.it - 09-10-2025]

gemini computer use
Immagine: Google.

Google ha lanciato Gemini 2.5 Computer Use, un nuovo modello, derivato da Gemini 2.5 Pro, progettato per comprendere ciò che appare sullo schermo e tradurlo in azioni concrete: cliccare su pulsanti, compilare moduli, scorrere pagine, aprire schede, trascinare elementi. In altre parole, esso simula il comportamento di un utente reale all'interno di un browser, senza bisogno di API o integrazioni specifiche.

La tecnologia è già disponibile in anteprima per gli sviluppatori tramite le piattaforme Google AI Studio e Vertex AI. Una demo pubblica su Browserbase consente di osservare il modello in azione mentre svolge compiti come consultare notizie, giocare a 2048 o navigare su siti web. Il sistema supporta 13 azioni base, tra cui apertura del browser, digitazione, navigazione tra schede, trascinamento e interazione con coordinate specifiche. Con Computer Use Gemini non controlla l'intero sistema operativo ma si limita alla finestra del browser: una scelta che Google definisce «necessaria per garantire la sicurezza».

Il funzionamento si basa su un «ciclo iterativo»: l'agente riceve uno screenshot e la cronologia delle azioni recenti, elabora il contesto e restituisce un'azione da eseguire. Dopo l'esecuzione, il sistema aggiorna lo stato dell'interfaccia e riprende il ciclo. Questo approccio consente di affrontare compiti complessi come la compilazione di form, l'accesso a siti protetti da login, la selezione di menu a tendina o l'interazione con elementi dinamici.

Google afferma di aver integrato nel modello diversi livelli di sicurezza. Un sistema di verifica analizza ogni operazione prima dell'esecuzione; gli sviluppatori possono imporre conferme obbligatorie per azioni sensibili come l'esecuzione di transazioni o gli accessi a dati personali. Google dichiara che Gemini 2.5 Computer Use ha superato i principali concorrenti nei benchmark dedicati al controllo di interfacce web e mobile, con latenze più basse e precisione superiore al 70%.

L'annuncio arriva a poche ore di distanza dal Dev Day di OpenAI, dove è stato presentato l'aggiornamento degli agenti ChatGPT, già in grado di svolgere funzioni analoghe a quelle ora a disposizione di Gemini. Con Claude anche Anthropic aveva già introdotto una funzione simile; Google però sottolinea di aver scelto un approccio più circoscritto, limitando l'azione al browser e mantenendo un controllo più stretto sulle operazioni. Le applicazioni potenziali sono molteplici: test automatizzati delle interfacce utente, assistenti digitali personali, automazione di task ripetitivi, interazione con portali privi di API.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) o segnalare un refuso.
© RIPRODUZIONE RISERVATA

Approfondimenti
Chi ci darà una IA affidabile?
La seduzione dell'IA, spiegata

Commenti all'articolo (ultimi 5 di 9)

A provarci sicuro, a riuscirci non è prorpio del tutto certo.
18-10-2025 13:29

Non sono le funzionalità che prospetta, ma il metodo con cui vorrebbe poter entrare nella tua macchina che mi perplime. Se Google rimuove del tutto il suo search engine e dà all'utente una sola scelta tra loggarsi e concedere accesso a Gemini o non usare nulla dei suoi servizi, chiaramente io propenderei per la seconda, ma con un costo... Leggi tutto
17-10-2025 08:02

Possibile ma su questo concordo con MK66, comunque, scusa, questo cosa centra con le funzionalità di comprendere ciò che appare sullo schermo e tradurlo in azioni concrete di cui è dotata Gemini 2.5 Computer Use? Leggi tutto
16-10-2025 18:51

Molto probabilmente Google smetterebbe di esistere come motore di ricerca. Praticamente è impossibile che tutti gli esseri umani che popolano questo sassolino spaziale e usano Google come motore di ricerca siano così deficienti da accontentarsi della risposta preconfezionata di Gemini, che peraltro non è nemmeno corretta al 100%.... Leggi tutto
15-10-2025 10:28

Il vero problema è: oggi una ricerca su Google ti propone la risposta di Gemini come opzione, se domani diventasse l'unica? :roll:
15-10-2025 07:55

La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.
E' VIETATA la riproduzione dei testi e delle immagini senza l'espressa autorizzazione scritta di Zeus News. Tutti i marchi e i marchi registrati citati sono di proprietà delle rispettive società. Informativa sulla privacy. I tuoi suggerimenti sono di vitale importanza per Zeus News. Contatta la redazione e contribuisci anche tu a migliorare il sito: pubblicheremo sui forum le lettere piu' interessanti.
Sondaggio
Con quale di queste affermazioni concordi maggiormente?
Il Governo sta facendo troppo poco per portare la banda larga anche nelle zone più remote.
Il Governo riuscirà a migliorare la diffusione della banda larga.
Il Governo vorrebbe fare di più per la diffusione della banda larga, ma mancano le risorse.
Il Governo non sta facendo abbastanza per reperire risorse per la banda larga.
Al Governo non frega nulla della banda larga a meno che qualche lobby o qualche gruppo finanziario o industriale gliela chieda; a quel punto troverà il modo di mettere una nuova tassa ai pensionati o ai lavoratori dipendenti per reperire i fondi.

Mostra i risultati (3584 voti)
Novembre 2025
I Baschi Grigi della Cybersicurezza
Telemarketing aggressivo, operativo il filtro che impedisce lo spoofing dei numeri mobili
Cloudflare in tilt. Migliaia di siti irraggiungibili, servizi bloccati in tutto il mondo
E se Internet sparisse?
Windows diventerà un Agentic OS. Microsoft entusiasta, gli utenti temono guai
Database con dati personali di 3,8 milioni di italiani pubblicato nel dark web
I crescenti segni dell'esplosione
WhatsApp apre le porte a Telegram, Signal e altri servizi: inizia l'era delle chat cross-app
Con Gemini Google Maps ti parla davvero: indicazioni vocali, punti di riferimento e AI
La RAM costa più dell'oro: l'intelligenza artificiale fa impennare i prezzi della DRAM
App di autenticazione e chiavi hardware, anche di scorta
Resuscitare l'aspirapolvere smart ucciso da remoto dal produttore
AGCOM, ecco la lista dei siti porno che richiederanno la verifica dell'età: si parte il 12 novembre
Ottobre 2025
Microsoft Azure in crisi: il disservizio ha fermato le Poste, Starbucks e il Parlamento scozzese
Anche Aranzulla teme la IA: il calo del traffico è reale e coinvolge tutta l'editoria digitale
Tutti gli Arretrati
Accadde oggi - 24 novembre


web metrics