La IA di Microsoft che fa parlare (e cantare) le fotografie

Così la Gioconda di Leonardo può cantare Paparazzi di Lil Wayne.



[ZEUS News - www.zeusnews.it - 22-04-2024]

vasa 1 gioconda paparazzi microsoft
Immagine: Microsoft.

Si chiama VASA-1 l'ultimo esperimento di Microsoft in tema di Intelligenza Artificiale e, come i suoi stessi creatori ammettono, ha un grande potenziale per essere adoperato in maniera impropria.

VASA-1 è infatti capace di trasformare una singola fotografia e un file audio in un video in cui la persona ritratta nella foto è animata e parla.

La IA può infatti attribuire all'immagine espressioni facciali, movimenti della testa e movimenti della labbra appropriati alle parole pronunciate o, se è per questo, alla canzone cantata: i vari esempi creati dai ricercatori di Microsoft sono visibili sulla pagina ufficiale del progetto.

Un'osservazione attenta permette di notare qualche difetto: in certi casi la sincronizzazione tra l'audio e i movimenti simulati non è perfetta, ma il potenziale per creare dei deepfake sempre più vicini alla realtà (soprattutto se sottoposti a un esame superficiale) è evidente.

Proprio per questo motivo i creatori di VASA-1 hanno deciso di non rendere pubblicamente disponibili le API, né di consentire l'accesso alle funzionalità della IA sotto forma di dimostrazione, per lo meno fino a che non potranno essere certi che questa tecnologia sia adoperata «in modo responsabile e in base alle norme vigenti».

Per quanto riguarda invece gli usi positivi per i quali VASA-1 è pensata, i ricercatori pensano alla possibilità di «migliorare l'accessibilità per quanti hanno difficoltà di comunicazione», per esempio creato un avatar che possa parlare a nome dell'utente.

Accoppiando il sistema a una IA generativa, inoltre, si otterrebbe una "persona artificiale" che possa fare compagnia o addirittura «supporto terapeutico» a chi ne avesse bisogno.

VASA-1 non funziona soltanto sulle foto: è in grado di animare anche i disegni e le opere d'arte; un esperimento è stato infatti condotto animando la Gioconda di Leonardo da Vinci, che per l'occasione si è esibita cantando Paparazzi di Lil Wayne (usando la voce di Anne Hathaway).

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) o segnalare un refuso.
© RIPRODUZIONE RISERVATA

Approfondimenti
L’intelligenza artificiale di Microsoft trasforma le immagini in poesia

Commenti all'articolo (0)


La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.
E' VIETATA la riproduzione dei testi e delle immagini senza l'espressa autorizzazione scritta di Zeus News. Tutti i marchi e i marchi registrati citati sono di proprietà delle rispettive società. Informativa sulla privacy. I tuoi suggerimenti sono di vitale importanza per Zeus News. Contatta la redazione e contribuisci anche tu a migliorare il sito: pubblicheremo sui forum le lettere piu' interessanti.
Sondaggio
Negli ultimi 12 mesi hai danneggiato accidentalmente un oggetto tecnologico portatile? (per esempio smartphone, fotocamera, notebook, tablet, ebook reader)
S, mi caduto a terra.
S, mi caduto in acqua (o ci ho versato dei liquidi).
S, ci ho lasciato giocare un bambino.
S, mi ci sono seduto sopra.
S, mentre lo lanciavo a un amico (o sulla scrivania).
No.

Mostra i risultati (2468 voti)
Aprile 2024
TIM, altre ''rimodulazioni'' in arrivo
L'algoritmo di ricarica che raddoppia la vita utile delle batterie
Hype e Banca Sella, disservizi a profusione
Falla nei NAS D-Link, ma la patch non arriverà mai
La navigazione in incognito non è in incognito
Le tre stimmate della posta elettronica
Amazon abbandona i negozi coi cassieri a distanza
Marzo 2024
Buone azioni e serrature ridicole
Il piano Merlyn, ovvero la liquidazione di Tim
Falla nelle serrature elettroniche, milioni di stanze d'hotel a rischio
L'antenato di ChatGPT in un foglio Excel
La valle inquietante
La crisi di Tim e la divisione sindacale
La fine del mondo, virtuale
WhatsApp e Messenger aprono agli altri servizi di chat
Tutti gli Arretrati
Accadde oggi - 22 aprile


web metrics