Uno dei due richiede appena 16 Gbyte di RAM.
[ZEUS News - www.zeusnews.it - 07-08-2025]
OpenAI ha rilasciato due nuovi modelli open-source di intelligenza artificiale, GPT-OSS-120b e GPT-OSS-20b, capaci a certe condizioni di funzionare direttamente su laptop e smartphone. Questi modelli, disponibili gratuitamente su piattaforme come Hugging Face, segnano una svolta rispetto alla tradizionale dipendenza da server remoti ad alta potenza di calcolo, rendendo l'IA più accessibile a sviluppatori, ricercatori e utenti comuni, anche se chiaramente non si possono pretendere le prestazioni dei modelli più avanzati che hanno a disposizione intere server farm per la loro esecuzione.
Il modello più piccolo, GPT-OSS-20b, con circa 21 miliardi di parametri, è ottimizzato per dispositivi con risorse limitate: richiede appena 16 GB di memoria per funzionare. Ciò lo rende compatibile con la maggior parte dei laptop moderni e persino con alcuni smartphone di fascia alta, come quelli dotati di processori Qualcomm Snapdragon di ultima generazione. Le sue prestazioni, secondo OpenAI, sono paragonabili a quelle del modello proprietario o3-mini, con punteggi di 2516 nei test di codifica di Codeforces con strumenti e 2230 senza strumenti, superando leggermente il predecessore in ambiti specifici come la matematica e le domande relative alla salute.
Il modello più grande, GPT-OSS-120b, con circa 117 miliardi di parametri, richiede invece una GPU con 80 GB di VRAM o un laptop di fascia alta, come i Copilot+ PC con processori AMD Ryzen AI 300. Questo modello eguaglia le capacità di ragionamento di o4-mini, con un punteggio di 2622 su Codeforces e prestazioni superiori in domini specifici come la matematica competitiva e la salute. Entrambi i modelli utilizzano un'architettura di tipo "mixture-of-experts", che ottimizza la velocità di elaborazione, rendendoli efficienti anche su hardware non specializzato.
Un aspetto importante di questo rilascio è la compatibilità con una vasta gamma di piattaforme e framework. I modelli supportano implementazioni in PyTorch, Metal di Apple, e linguaggi come Rust e Python, oltre a essere compatibili con chip di NVIDIA, AMD, Cerebras e Groq. La quantizzazione nativa in formato MXFP4 e l'integrazione con renderer open-source come Harmony semplificano l'adozione su diversi dispositivi. Per gli sviluppatori, OpenAI ha reso disponibili documentazioni dettagliate su piattaforme come Hugging Face, vLLM, Ollama e llama.cpp, facilitando l'integrazione e il fine-tuning dei modelli per casi d'uso specifici. Inoltre, per chi desidera testare le capacità dei modelli senza installarli, OpenAI offre un playground interattivo su gpt-oss.com<&/a>, che permette di esplorare le funzionalità in modo immediato.
La scelta di rilasciare modelli open-source sotto licenza Apache 2.0, che consente utilizzi sia sperimentali che commerciali, riflette l'impegno sempre dichiarato daOpenAI, ma finora forse poco visibile, verso un'IA più aperta e accessibile. L'approccio si allinea con la missione dichiarata dell'azienda, fondata nel 2015 per promuovere un'intelligenza artificiale generale (AGI) che porti benefici collettivi. OpenAI afferma di aver condotto test rigorosi per garantire la sicurezza dei modelli, includendo un protocollo di worst-case fine-tuning, che simula utilizzi potenzialmente dannosi in settori come l'informatica e la biologia. I risultati di questi test saranno pubblicati in documenti di sicurezza e schede di sistema, per garantire trasparenza e responsabilità.
OpenAI invita comunque quanti vogliano adoperare i due nuovi modlli a porre sempre attenzione al materiale generato: l'azienda ha infatti segnalato un tasso di "allucinazioni" - risposte non accurate o inventate - compreso tra il 49% e il 53% nei test interni sulla conoscenza delle persone, un valore significativamente più alto rispetto ai modelli di ragionamento proprietari come o3 e o4-mini. D'altra parte, nei benchmark come Humanity's Last Exam, i modelli open-source hanno dimostrato un'accuratezza competitiva, rendendoli strumenti validi per sviluppatori e ricercatori che desiderano personalizzare l'IA per esigenze specifiche. La possibilità di eseguire questi modelli localmente offre poi vantaggi significativi in termini di privacy, poiché i dati non vengono inviati a server remoti, e di costi, eliminando (per certe esigenze) la necessità di abbonamenti a servizi cloud.
Sam Altman ha dichiarato che il rilascio di questi modelli è un passo verso un'ecosistema AI più aperto, capace di ridurre le barriere per sviluppatori, startup e organizzazioni in mercati emergenti o ambienti ad alta sicurezza. È d'altra parte già stato fatto notare che l'apertura dei modelli potrebbe comportare rischi, come l'uso improprio in contesti non regolamentati. OpenAI sembra aver anticipato queste preoccupazioni, implementando misure di sicurezza e collaborando con organizzazioni esterne per testare i modelli.
Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News
ti consigliamo di iscriverti alla Newsletter gratuita.
Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui
sotto, inserire un commento
(anche anonimo)
o segnalare un refuso.
© RIPRODUZIONE RISERVATA |
|
|
||
|