La prima novità di GPT-4o è che la velocità di generazione delle risposte è aumentata, tanto che secondo OpenAI ora l'interazione con il chatbot è paragonabile a quella che si può avere con un essere umano, senza pause prima che la risposta a una domanda inizia ad apparire.

«GPT-4o fornisce un'intelligenza di livello GPT-4, ma è molto più veloce», ha dichiarato Mira Murati, CTO di OpenAI, durante la dimostrazione pubblica. «Riteniamo che GPT-4o ci mostri il futuro della collaborazione, in cui l'interazione diventa molto più naturale e molto più semplice».

Con GPT-4o si può infatti semplicemente parlare, anziché dover utilizzare per forza la tastiera; e ugualmente il bot può rispondere a voce, peraltro in un modo che - stando alla demo - suona sorprendentemente naturale.

Anche la flessibilità è aumentata. Come spiega il sito ufficiale, «È ora possibile scattare una foto di un menu in una lingua diversa e parlare con GPT-4o per tradurlo, conoscere la storia e il significato del cibo e ottenere consigli. In futuro, i miglioramenti consentiranno una conversazione vocale più naturale e in tempo reale e la possibilità di conversare con ChatGPT tramite video in tempo reale. Ad esempio, potrete mostrare a ChatGPT una partita sportiva in diretta e chiedergli di spiegarvi le regole».

La capacità di supportare diversi input - testuali, video, audio - è uno dei punti di forza del nuovo modello, che è dunque capace di elaborare le diverse fonti di informazione fornite per fornire una risposta coerente che tenga conto di tutte.

GPT-4o, come dicevamo, sarà progressivamente disponibile anche tramite il livello gratuito di ChatGPT con cui si può interagire tramite il sito web ma, per gli utenti di Mac, esiste ora anche un'app che consente di utilizzarlo. La versione per Windows arriverà in un secondo tempo.