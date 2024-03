Sora genera video sintetici perfetti in HD.

[ZEUS News - www.zeusnews.it - 18-03-2024] Commenti (7)

Immagine generata con Diffusion Art

Questo è un articolo su più pagine: ti invitiamo a leggere la pagina iniziale

Sora genera video sintetici perfetti in HD

Una delle prime cose che si notano in questi video dimostrativi, una volta superato lo shock iniziale, è che manca l'audio, che a quanto pare Sora non è ancora in grado di generare sincronizzandolo con le immagini. Ma l'audio si può sempre generare in seguito, usando tecniche tradizionali, come il doppiaggio o il foley, il lavoro dei rumoristi.

L'altra particolarità di questi video sintetici di OpenAI è la fluidità dei movimenti delle persone e degli animali, che risulta leggermente dissonante rispetto alla realtà. In altri di questi video dimostrativi, un gatto e un cane corrono e saltano, ma c'è qualcosa che non va nei loro movimenti: sono quasi perfetti, ma è un quasi che rompe completamente l'illusione.

Il nostro cervello ha milioni di anni di esperienza e di evoluzione su cui contare per il riconoscimento dei movimenti delle persone e degli animali familiari, e per ora i video sintetici, a differenza delle foto sintetiche, sono nel pieno della cosiddetta uncanny valley o valle inquietante, ossia quella teoria, proposta dal professore di robotica Masahiro Mori ben 54 anni fa, nel 1970, secondo la quale un oggetto animato produce una risposta emotiva favorevole se non somiglia affatto a un essere umano o a un animale reale oppure se è assolutamente identico a quello reale, ma produce invece repulsione, inquietudine e rifiuto se è molto simile ma non identico all'originale. Quella zona di quasi-somiglianza è la Valle Inquietante, situata fra i due pianori della credibilità.

I personaggi digitali di Toy Story, per esempio, funzionano emotivamente perché non hanno la pretesa di essere persone reali: sono giocattoli e quindi i loro movimenti possono essere innaturali e anche caricaturali senza causare disagio o disorientamento. Gli animali sintetici fantastici di Avatar e di altri film risultano credibili perché non abbiamo alcun termine di paragone con la realtà. Invece gli animali fotorealistici del remake del Re Leone o della Sirenetta, o anche l'Indiana Jones ringiovanito del Quadrante del Destino, per quanto siano il frutto di immense fatiche di tecnici e animatori, spesso stentano a convincerci: basta un minimo movimento innaturale per spezzare la magia, l'empatia e l'immedesimazione.

La terza anomalia di questi video di OpenAI emerge soltanto se si ha l'occhio estremamente allenato e ci si sofferma sui dettagli: alcune persone sullo sfondo appaiono dal nulla e poi svaniscono, e la donna che cammina per le vie di Tokyo a un certo punto inverte le proprie gambe. Tutte cose che al primo colpo d'occhio non verranno notate da nessuno, specialmente se la scena fa parte di una sequenza che ha un montaggio molto dinamico, ma sono cose che rendono questi video inadatti a un uso per un film o un telefilm di qualità.

Il quarto aspetto insolito di Sora è la sua fisica, ossia il modo in cui gli oggetti si comportano. Uno dei video rilasciati da OpenAI mostra un bicchiere appoggiato su un tavolo. Di colpo il liquido rosso contenuto nel bicchiere attraversa il vetro del bicchiere e si spande sul tavolo, senza motivo, mentre il bicchiere fa un salto altrettanto senza motivo, si inclina e poi ricade sul tavolo flettendosi, cosa che un bicchiere di vetro non farebbe mai.

Da questo e altri esempi risulta chiaro che Sora non permette ancora di sostituire in tutto e per tutto il lavoro manuale delle persone, ma produce già ora risultati sufficienti per le riprese generiche. Martin Scorsese o Christopher Nolan non hanno motivo di preoccuparsi, perché realizzano prodotti finemente cesellati, ma Sora mette invece a repentaglio tutto il mondo delle riprese stock, ossia degli spezzoni generici che vengono realizzati e venduti per esempio per creare i video industriali o promozionali o le panoramiche e le riprese ambientali nei telefilm.

Ti invitiamo a leggere la pagina successiva di questo articolo:

Nicchie e autenticità