La IA di Google clicca, scrive e naviga come un utente vero. Si chiama Gemini 2.5 Computer Use



[ZEUS News - www.zeusnews.it - 09-10-2025]

gemini computer use
Immagine: Google.

Google ha lanciato Gemini 2.5 Computer Use, un nuovo modello, derivato da Gemini 2.5 Pro, progettato per comprendere ciò che appare sullo schermo e tradurlo in azioni concrete: cliccare su pulsanti, compilare moduli, scorrere pagine, aprire schede, trascinare elementi. In altre parole, esso simula il comportamento di un utente reale all'interno di un browser, senza bisogno di API o integrazioni specifiche.

La tecnologia è già disponibile in anteprima per gli sviluppatori tramite le piattaforme Google AI Studio e Vertex AI. Una demo pubblica su Browserbase consente di osservare il modello in azione mentre svolge compiti come consultare notizie, giocare a 2048 o navigare su siti web. Il sistema supporta 13 azioni base, tra cui apertura del browser, digitazione, navigazione tra schede, trascinamento e interazione con coordinate specifiche. Con Computer Use Gemini non controlla l'intero sistema operativo ma si limita alla finestra del browser: una scelta che Google definisce «necessaria per garantire la sicurezza».

Il funzionamento si basa su un «ciclo iterativo»: l'agente riceve uno screenshot e la cronologia delle azioni recenti, elabora il contesto e restituisce un'azione da eseguire. Dopo l'esecuzione, il sistema aggiorna lo stato dell'interfaccia e riprende il ciclo. Questo approccio consente di affrontare compiti complessi come la compilazione di form, l'accesso a siti protetti da login, la selezione di menu a tendina o l'interazione con elementi dinamici.

Google afferma di aver integrato nel modello diversi livelli di sicurezza. Un sistema di verifica analizza ogni operazione prima dell'esecuzione; gli sviluppatori possono imporre conferme obbligatorie per azioni sensibili come l'esecuzione di transazioni o gli accessi a dati personali. Google dichiara che Gemini 2.5 Computer Use ha superato i principali concorrenti nei benchmark dedicati al controllo di interfacce web e mobile, con latenze più basse e precisione superiore al 70%.

L'annuncio arriva a poche ore di distanza dal Dev Day di OpenAI, dove è stato presentato l'aggiornamento degli agenti ChatGPT, già in grado di svolgere funzioni analoghe a quelle ora a disposizione di Gemini. Con Claude anche Anthropic aveva già introdotto una funzione simile; Google però sottolinea di aver scelto un approccio più circoscritto, limitando l'azione al browser e mantenendo un controllo più stretto sulle operazioni. Le applicazioni potenziali sono molteplici: test automatizzati delle interfacce utente, assistenti digitali personali, automazione di task ripetitivi, interazione con portali privi di API.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) o segnalare un refuso.
© RIPRODUZIONE RISERVATA

Approfondimenti
Chi ci darà una IA affidabile?
La seduzione dell'IA, spiegata

Commenti all'articolo (ultimi 5 di 9)

A provarci sicuro, a riuscirci non è prorpio del tutto certo.
18-10-2025 13:29

Non sono le funzionalità che prospetta, ma il metodo con cui vorrebbe poter entrare nella tua macchina che mi perplime. Se Google rimuove del tutto il suo search engine e dà all'utente una sola scelta tra loggarsi e concedere accesso a Gemini o non usare nulla dei suoi servizi, chiaramente io propenderei per la seconda, ma con un costo... Leggi tutto
17-10-2025 08:02

Possibile ma su questo concordo con MK66, comunque, scusa, questo cosa centra con le funzionalità di comprendere ciò che appare sullo schermo e tradurlo in azioni concrete di cui è dotata Gemini 2.5 Computer Use? Leggi tutto
16-10-2025 18:51

Molto probabilmente Google smetterebbe di esistere come motore di ricerca. Praticamente è impossibile che tutti gli esseri umani che popolano questo sassolino spaziale e usano Google come motore di ricerca siano così deficienti da accontentarsi della risposta preconfezionata di Gemini, che peraltro non è nemmeno corretta al 100%.... Leggi tutto
15-10-2025 10:28

Il vero problema è: oggi una ricerca su Google ti propone la risposta di Gemini come opzione, se domani diventasse l'unica? :roll:
15-10-2025 07:55

La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.
E' VIETATA la riproduzione dei testi e delle immagini senza l'espressa autorizzazione scritta di Zeus News. Tutti i marchi e i marchi registrati citati sono di proprietà delle rispettive società. Informativa sulla privacy. I tuoi suggerimenti sono di vitale importanza per Zeus News. Contatta la redazione e contribuisci anche tu a migliorare il sito: pubblicheremo sui forum le lettere piu' interessanti.
Sondaggio
L'auto che si guida da sola... (completa la frase)
ci permetterà di sfruttare il tempo perso guidando, magari in coda.
ci toglierà l'ultimo brandello di privacy.
ci farà viaggiare più sicuri.
ci esporrà a nuovi pericoli, dovuti ai bug o agli attacchi degli hacker.
ci consentirà di ridurre l'inquinamento.
ci priverà dell'autonomia.
sarà accettabile solo se ci permetterà sempre di scegliere la guida manuale.
sarà sicura solo se non permetterà mai la guida manuale.

Mostra i risultati (6262 voti)
Aprile 2026
Google sanzionerà i siti che manipolano il tasto Indietro
Verbatim e I-O Data puntano sul Blu-ray: rinasce un mercato dato per morto
La Francia abbandona Windows
Router TP-Link compromessi in tutto il mondo: così gli hacker russi sottraggono le credenziali
Attività sessuali, persone svestite o alla toilette, carte di credito
Oracle licenzia 30.000 dipendenti via email
Marzo 2026
Windows 11 avrà una barra delle applicazioni compatta in stile Windows 10
CPU Intel e AMD introvabili
Mozilla lancia la VPN gratuita in Firefox
Windows 11, vacilla l'obbligo dell'account Microsoft
Attacco informatico paralizza gli etilometri con alcolock: migliaia di veicoli fermi
La Ricerca Live di Google arriva in Italia
Samsung ritira il Galaxy Z TriFold dopo tre mesi
Linea fissa TIM, in arrivo la rimodulazione: rincari di 2,99 euro a partire da maggio
DR-DOS torna in vita: riscritto da zero in assembly, non usa codice legacy e non è open source
Tutti gli Arretrati
Accadde oggi - 16 aprile


web metrics