L'effetto ''uncanny valley'' delle IA è solo un ricordo del passato.
[ZEUS News - www.zeusnews.it - 28-08-2025]
Google ha recentemente annunciato il lancio di Gemini 2.5 Flash Image: è un modello di intelligenza artificiale per la generazione e l'editing di immagini, soprannominato Nano Banana durante una campagna virale che ha catturato l'attenzione degli utenti online. Il modello è integrato nell'app Gemini per utenti gratuiti e a pagamento ed è disponibile per sviluppatori tramite Gemini API, Google AI Studio e Vertex AI. Nano Banana si distingue per la sua capacità di offrire un controllo creativo senza precedenti, affrontando uno dei problemi principali dell'editing AI: la coerenza dei soggetti attraverso modifiche multiple, con risultati che lo posizionano al primo posto nella classifica LMArena per l'editing di immagini.
Il nome Nano Banana è emerso come una sorta di "mistero virale" sui social media, in particolare sulla piattaforma X, dove il modello è stato testato in forma anonima su lla una piattaforma di valutazione crowdsourced LMArena. La sua comparsa ha generato entusiasmo, alimentato da post criptici come quello del CEO di Google Sundar Pichai: il 26 agosto ha condiviso tre emoji di banane, scatenando speculazioni e meme. Il CEO di DeepMind Demis Hassabis ha ulteriormente amplificato l'hype con un post che mostrava un'immagine microscopica, lasciando intendere che Nano Banana fosse un progetto innovativo. Google ha poi confermato che il modello era dietro lo pseudonimo, ufficialmente chiamato Gemini 2.5 Flash Image, sfruttando l'attenzione virale per promuovere il suo lancio. Quanto al nome, si riferisce al fatto che il modello avrebbe fatto impazzire («going bananas») gli utenti per la sua qualità.
Il modello si basa sul feedback ricevuto da Gemini 2.0 Flash, introdotto all'inizio del 2025: aveva già impressionato per la sua bassa latenza e facilità d'uso ma mancava di precisione in alcune modifiche di immagini. Nano Banana risponde a queste critiche offrendo funzionalità come la coerenza dei soggetti, la fusione di immagini e l'editing multi-turn per migliorare passo-passo l'immagine generata, suggerendo modifiche successive: tutte funzioni progettate per migliorare la qualità e la flessibilità creativa.
Gemini 2.5 Flash Image si distingue per quattro funzionalità chiave, la prima delle quali è la coerenza dei soggetti. Nano Banana garantisce che il volto di una persona, un animale domestico o un oggetto rimanga riconoscibile anche dopo modifiche significative. Un utente può caricare la foto di una persona e cambiarne l'abbigliamento, lo sfondo o l'epoca senza distorsioni innaturali. Poi c'è l'editing multi-turn: il modello permette di effettuare modifiche successive sullo stesso soggetto senza perdere la coerenza. Un utente può chiedere di aggiungere un cappello al soggetto di una foto, poi cambiare lo sfondo in una spiaggia e infine magari inserire un oggetto come una chitarra, ottenendo sempre risultati fluidi e coerenti. Ciò è particolarmente utile per progetti creativi o di branding che richiedono iterazioni multiple.
Nano Banana supporta la fusione di immagini: consente di combinare elementi di più immagini in un'unica scena. Si può prendere una persona da una foto, un animale da un'altra e uno sfondo da una terza, creando una composizione armoniosa. Un caso d'uso pratico è l'arredamento: si può aggiungere un divano o una lampada a una foto di una stanza per visualizzare il risultato di un restyling. Infine, c'è la "conoscenza del mondo": sfruttando l'intelligenza di Gemini il modello comprende istruzioni complesse in linguaggio naturale e può interpretare riferimenti culturali o tecnici. Per esempio, un prompt come «trasforma questa foto in un dipinto rinascimentale» produrrà un risultato che riflette accuratamente lo stile artistico richiesto.
Queste funzionalità sono supportate da un'interfaccia intuitiva nell'app Gemini, dove gli utenti possono caricare una foto e usare il comando Reimagine seguito da una descrizione per ottenere modifiche precise. Il modello è accessibile sia su Android e iOS che tramite browser web. Nano Banana è disponibile gratuitamente per gli utenti dell'app Gemini con limitazioni per i piani gratuiti, mentre gli abbonati a pagamento hanno accesso illimitato. Per sviluppatori e imprese il modello è integrato in Gemini API, Google AI Studio e Vertex AI, con un costo di 30 dollari per 1 milione di token di output. Ogni immagine generata richiede circa 1.290 token, pari a 0,039 dollari per immagine. Google ha annunciato partnership con piattaforme come OpenRouter e fal.ai per estendere l'accesso; l'integrazione con Adobe Firefly ed Express è prevista a partire da settembre. Per garantire la trasparenza tutte le immagini generate o modificate con Nano Banana includono un watermark visibile e un SynthID digitale invisibile, che consente di identificare i contenuti AI anche dopo modifiche.
Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News
ti consigliamo di iscriverti alla Newsletter gratuita.
Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui
sotto, inserire un commento
(anche anonimo)
o segnalare un refuso.
© RIPRODUZIONE RISERVATA |
|
|
||
|
Homer S.