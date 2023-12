La demo di Gemini è fin troppo impressionante: infatti è stata realizzata con qualche trucco.

Lo scorso 6 dicembre, Google ha pubblicato su YouTube un video (che riportiamo in fondo all'articolo) per dimostrare le strabilianti capacità della nuova «IA multimodale» Gemini.

Il video è davvero impressionante: guadandolo, si vede Gemini interagire con l'utente in tempo reale conversando con lui, riconoscendo per esempio "al volo" quanto viene disegnato su un foglio, aggiustando le risposte in base all'aumentare dei particolari e riuscendo poi a distinguere tra immagini e oggetti fisici.

Il problema è che le cose, in realtà, non sono andate esattamente come mostrato nel video. L'impressione è che ci sia una conversazione tra l'utente e la IA; la realtà è che il tutto è invece avvenuto tramite la digitazione di istruzioni ben più articolate di quelle enunciate nel video.

Ancora: l'impressione è che Gemini capisca le brevi istruzioni fornite e risponda in maniera altrettanto concisa e precisa; la realtà è che le risposte reali non sono diverse da quelle più articolate e meno precise di altre IA.

Aggiungiamo poi il fatto che, se dal video si trae l'impressione che Gemini riconosca quanto succede in tempo reale, in realtà alla IA vengono passate immagini statiche su cui applicare i propri algoritmi di riconoscimento.

Né si può ignorare che le interazioni tra l'uomo e la macchina paiono avvenire con tempistiche del tutto analoghe a quelle di un'interazione tra due esseri umani: ciò perché i ritardi nella risposta, dovuti all'elaborazione, sono stati tagliati nel montaggio del video.

Certo, un'avvertenza posta all'inizio del filmato recita: «Per questa demo, la latenza è stata ridotta, e le risposte di Gemini sono state accorciate per brevità», ma l'impressione che Google abbia voluto distrarre gli utenti con un po' di prestidigitazione è piuttosto forte.

Chiamata in causa da CNBC, Google si è difesa dicendo che il video è soltanto una «rappresentazione illustrativa delle possibilità di interazione con Gemini, basata su prompt multimodali reali e su risultati di test»: l'azienda insomma non ha mentito, ma ha "abbellito" un po' l'esperienza, senza pretendere di mostrare un resoconto accurato di come si interagisce con la IA.

Perché mai fare una cosa del genere? La risposta sta ancora nella dichiarazione resa a CNBC: perché il 13 dicembre Gemini Pro andrà online. Mostrando meraviglie, è più facile suscitare interesse e sottoscrizioni.

Il trucco non sminuisce eccessivamente le capacità di Gemini, ma spinge a chiedersi perché mai Google sia stata disposta a rischiare una figuraccia che è già arrivata ma che sarebbe arrivata comunque nel prossimo futuro, poiché questo genere di artefatti non restano nascosti a lungo e certamente non lo saranno dopo il 13 dicembre, quando gli sviluppatori potranno "mettere le mani" direttamente sulla IA.