GPT-2 funziona all'interno di un enorme foglio di calcolo liberamente scaricabile da GitHub.

C'è stato un tempo in cui le capacità di GPT-2 apparivano così strabilianti da farle ritenere addirittura pericolose, al punto che OpenAI si diceva incerta sulla bontà della decisione di renderla pubblica.

Poi la febbre da IA s'è impadronita del mondo tecnologico, GPT-2 s'è evoluto in GPT-3, GPT-3.5 e GPT-4, e al contrario di quanto succedeva nel 2019 ora è difficile trovare un ambito che non voglia avere un "pezzettino" di IA in sé.

Sebbene a questo punto GPT-2 sia ormai sorpassato, esso può ancora avere una propria utilità, o così almeno pensa Ishan Anand, programmatore e «dipendente dai fogli di calcolo», come si definisce.

Anand ha infatti messo a disposizione su GitHub un gigantesco foglio di calcolo in formato Excel, che pesa 1,25 GByte, che implementa le funzioni di GPT-2.

Nonostante le limitazioni dovute all'età della IA e al fatto che le sue capacità sono state ulteriormente ridotte rispetto al GPT-2 che era disponibile cinque anni fa, Anand ritiene che il suo esperimento possa essere una buona introduzione «a basso tasso di codice» al mondo dei modelli linguistici (LLM) per chiunque ne abbia un interesse personale o professionale.

È bene ricordare che GPT-2 non è un chatbot. L'era di ChatGPT è iniziata con la revisione successiva della IA. Inoltre, il foglio di Anand supporta 124 milioni di parametri: sono molti, ma decisamente meno degli 1,5 miliardi di parametri supportati dall'originale (a loro volta un'inezia rispetto ai 175 miliardi di parametri di GPT-3).

Anche se non si poteva conversare con esso, GPT-2 fece scalpore perché fu il primo caso in cui pubblicamente una intelligenza artificiale riuscì a generare testi in maniera convincente e verosimile; ottenuto un paragrafo di partenza, era in grado di farlo proseguire in maniera coerente a livello di espressione e di contenuto.

L'opera di Anand lavora più fogli all'interno dello stesso file Excel: nel primo, l'utente inserisce il proprio input (il limite di parole inseribili è fissato a 10); poi si viene guidati nelle fasi successive, dalla tokenizzazione delle parole al posizionamento del testo, fino a ottenere la previsione della parola finale della sequenza.

Il procedimento completo è spiegato in un video (in inglese) realizzato da Anand stesso e che riportiamo qui sotto.