Jalapeño, il primo chip di OpenAI: più efficienza e meno costi operativi

Così ChatGPT punta a smarcarsi da Nvidia.



[ZEUS News - www.zeusnews.it - 30-06-2026]

OpenAI sta cercando di staccarsi da Nvidia, da cui dipende per i chip che consentono a ChatGPT di esistere, e ha così presentato Jalapeño, il suo primo chip personalizzato. Il processore, sviluppato in collaborazione con Broadcom, è un ASIC ottimizzato esclusivamente per l'inferenza, già in grado di eseguire carichi di lavoro di produzione come il modello GPT‑5.3‑Codex‑Spark, secondo i test preliminari. Il chip nasce anche con l'obiettivo di migliorare l'efficienza energetica e il rapporto prestazioni/Watt nelle operazioni di inferenza, la fase in cui un modello già addestrato risponde alle richieste degli utenti. A differenza delle GPU generaliste, Jalapeño è costruito attorno ai pattern computazionali e ai flussi di token tipici dei modelli linguistici di grandi dimensioni. L'architettura privilegia la riduzione degli spostamenti di dati, l'ottimizzazione della memoria e la gestione del networking interno ai server.

Secondo OpenAI, il progetto è stato completato in circa nove mesi, un tempo insolitamente rapido per un ASIC ad alte prestazioni. La società afferma di aver utilizzato i propri modelli per accelerare parti del processo di progettazione, integrando generazione e ottimizzazione automatica nelle fasi preliminari. Broadcom ha curato l'implementazione del silicio e la produzione, mentre Celestica si occuperà dell'assemblaggio dei rack destinati ai data center. I primi test indicano che Jalapeño offre prestazioni per Watt significativamente superiori rispetto alle soluzioni attuali. Il CEO di Broadcom, Hock Tan, ha dichiarato che il chip raggiunge livelli comparabili alle GPU Nvidia Blackwell e alle TPU di Google. OpenAI prevede di pubblicare un rapporto tecnico dettagliato nei prossimi mesi, quando saranno disponibili misurazioni definitive.

Il processore è pensato per essere meno flessibile di una GPU, ma più efficiente su un insieme ristretto di operazioni critiche per i servizi dell'azienda. L'ottimizzazione riguarda i kernel LLM, la gestione della memoriae la comunicazione interna ai nodi. L'obiettivo è aumentare il numero di token elaborati per watt, riducendo i costi operativi dei servizi come ChatGPT, Codex e le API. Jalapeño vuole rappresentare inoltre il primo passo di una piattaforma hardware multi‑generazionale che OpenAI intende distribuire su larga scala entro la fine del 2026. La roadmap prevede sistemi installati a livello di gigawatt nei data center dei partner, con successive iterazioni del chip sviluppate insieme a Broadcom e integrate nell'infrastruttura cloud di Microsoft.

Il progetto si inserisce in una tendenza più ampia del settore: Google, Amazon e Meta stanno già investendo in chip proprietari per ridurre i costi e controllare l'intera catena tecnologica. OpenAI segue la stessa direzione, puntando a una maggiore autonomia nella gestione dell'hardware necessario per i propri modelli. La società ha dichiarato che «progettare più parti dello stack permette di servire più intelligenza con maggiore efficienza», come affermato dal presidente Greg Brockman. OpenAI ha dichiarato che Jalapeño è progettato per funzionare con tutti i modelli linguistici attuali e futuri, grazie a un'architettura flessibile ma focalizzata sulle esigenze dell'inferenza. La società prevede che il chip diventerà parte integrante della propria infrastruttura, insieme ai data center e ai sistemi software che già gestisce internamente.

Il progetto è anche un tassello della strategia di lungo periodo dell'azienda, che punta a costruire un'infrastruttura completa, dai modelli ai prodotti fino ai chip. L'obiettivo dichiarato è rendere l'intelligenza artificiale più accessibile, affidabile e sostenibile, riducendo al tempo stesso la dipendenza da fornitori esterni e migliorando la prevedibilità dei costi operativi.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) o segnalare un refuso.
© RIPRODUZIONE RISERVATA

Approfondimenti
OpenAI lancia il piano Pro intermedio
OpenAI cancella la versione erotica di ChatGPT
OpenAI spegne Sora. Troppi costi, pochi utenti

Commenti all'articolo (1)


La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.
E' VIETATA la riproduzione dei testi e delle immagini senza l'espressa autorizzazione scritta di Zeus News. Tutti i marchi e i marchi registrati citati sono di proprietà delle rispettive società. Informativa sulla privacy. I tuoi suggerimenti sono di vitale importanza per Zeus News. Contatta la redazione e contribuisci anche tu a migliorare il sito: pubblicheremo sui forum le lettere piu' interessanti.
Sondaggio
Secondo te, come nascono la maggior parte delle bufale che girano su Internet?
Come scherzi rivolti esclusivamente ad amici e conoscenti (che poi involontariamente li propagano in giro)
Dalla "buona volontà" di persone che credono di fare un favore al mondo diffondendo dicerie e stranezze dandole automaticamente per buone
Dalla curiosità di vedere se una propria invenzione possa diventare "famosa" sulla rete, ma anche quanta gente ci arriverà a credere e con che velocità si propagherà
Dalla volontà di creare disinformazione su determinati argomenti
Altro (specificare)

Mostra i risultati (2488 voti)
Giugno 2026
Hackerata Trenitalia, rubati i dati di viaggio dei passeggeri
L'UE approva l'euro digitale
L'avanzata delle dark factory: 1300 lavoratori sostituiti da 50 robot
Il telefono minimalista di Commodore che sfida gli smartphone tradizionali
Recesso online, obbligatorio il pulsante su tutti gli e-commerce
Il simulatore di volo di Google Earth
Windows Ready Print rivoluziona la stampa: addio ai driver proprietari
Debutta Euro-Office tra le proteste di LibreOffice
Lo strumento che ti dice quali modelli IA puoi eseguire davvero sul tuo PC
ChatGPT, arriva Lockdown Mode
Iliad lancia il suo FWA: modem 5G, attivazione rapida e velocità fino a 300 Mbps
Microsoft: sistema operativo e app sono al capolinea. È l'ora degli agenti IA
Quousque tandem abutere, Ursula, patientia nostra?
Grave falla in 7-Zip
Maggio 2026
Denunce ai Carabinieri sull'app IO
Tutti gli Arretrati
Accadde oggi - 30 giugno


web metrics