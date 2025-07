L'ultima versione del modello Veo 3 aggiunge audio e dialoghi sincronizzati con le immagini.

Integrato nell'app Gemini, il modello di generazione video Veo 3 di Google ha appena guadagnato una nuova funzione: ora è in grado di trasformare immagini statiche in video dinamici di otto secondi, completi di audio sincronizzato. Dal punto di vista degli utenti il processo è intuitivo: si accede all'app Gemini, si seleziona l'opzione Video dalla barra dei comandi, si carica un'immagine e si descrive il tipo di movimento o scena desiderata tramite un prompt testuale.

Per esempio, la foto di una scatola può essere animata in un video che mostra l'oggetto in movimento in un contesto specifico, come un'ambientazione naturale o urbana; si possono aggiungere effetti sonori, dialoghi o musica generati dall'IA, in maniera analoga a quanto mostrato nel video di presentazione che riportiamo in fondo all'articolo. Veo 3 è capace di integrare audio contestuale come il rumore del vento, il canto degli uccelli o una colonna sonora orchestrale: con questa tecnologia si distingue dai predecessori e offre un'esperienza più realistica.

Veo 3 è capace di generare video fino a 1080p con «transizioni fluide e dettagli visivi accurati, mantenendo coerenza narrativa e stilistica». Gli utenti possono specificare non solo il movimento ma anche lo stile visivo: per esempio un'estetica vintage o cinematografica. Si possono persino controllare movimenti di camera come panoramiche o zoom. La possibilità di caricare immagini di riferimento consente di mantenere la coerenza visiva, per esempio con personaggi o ambientazioni ricorrenti.

Al momento l'accesso a Veo 3 è limitato agli abbonati ai piani Google AI Pro (21,99 euro al mese) e Google AI Ultra (274,99 euro al mese). Il primo offre fino a 10 generazioni video di prova e il secondo un accesso più esteso senza limiti giornalieri rigidi. In Italia la funzione è disponibile tramite l'app Gemini per Android, iOS e web. Google ha implementato misure di sicurezza per garantire un uso responsabile: ogni video generato include una filigrana visibile e una digitale SynthID che consente di identificare i contenuti creati dall'IA. Queste precauzioni rispondono alle crescenti preoccupazioni legate alla produzione di deepfake e alla necessità di trasparenza nell'uso di contenuti generati artificialmente.

Sebbene il lancio della funzionalità sia appena avvenuto, già sono emerse le prime critiche. Queste non riguardano tanto gli aspetti tecnici quanto quelli etici: l'addestramento di Veo 3 e Gemini utilizza un vasto dataset di video di YouTube: Google non offre ai creatori di contenuti la possibilità di negare il consenso per l'utilizzo in questo ambito. Se un video generato da Veo 3 riproduce elementi di opere esistenti, chi ne detiene i diritti? La questione rimane aperta: Google si limita a sottolineare il rispetto degli accordi con i creatori, senza fornire dettagli su compensazioni o meccanismi di opt-out.

L'impatto di strumenti come Veo 3 sull'industria creativa è oggetto di dibattito. La tecnologia da un lato semplifica la produzione video, rendendola accessibile anche a chi non ha competenze di editing; dall'altro solleva timori tra i professionisti del settore. Uno studio dell'Animation Guild del 2024 prevede che entro il 2026 l'IA possa mettere a rischio oltre 100.000 posti di lavoro nei settori del cinema, della televisione e dell'animazione. Stanno emergendo come nuovo ruolo creativo i "prompt engineer": figure specializzate nel dire alla IA in modo efficace che cosa fare. Ma la delega di decisioni artistiche a un algoritmo sembra sminuire il valore del contributo umano tradizionale.