Più potente e meno costosa delle alternative americane, è disponibile nel web, su iOS e Android. Ed è anche open source.

28-01-2025

Immagine generata con DiffusionArt

Ha suscitato qualcosa di simile al panico il lancio di DeepSeek, l'intelligenza artificiale cinese che ha debuttato in questi giorni.

La sua apparizione ha fatto tremare addirittura il trono su cui stava seduta tranquilla Nvidia, convinta di avere una supremazia pressoché inattaccabile nel campo dell'hardware necessario per il funzionamento degli esigenti - in termini di risorse - modelli di IA.

DeepSeek rappresenta una novità non soltanto perché, a detta di chi la sta mettendo alla prova, fornisce risposte generalmente più accurate rispetto alla concorrenza, ma anche perché il suo modello open source v3, rilasciato a Dicembre, richiede hardware molto meno potente rispetto a rivali come o1 di OpenAI e per il addestramento sono stati spesi appena 6 milioni di dollari: per fare un confronto, si tratta di circa un decimo di quanto speso da Meta per il suo modello più recente.

Marc Andreessen, co-autore del primo browser web Mosaic e investitore nel mondo della tecnologia, su X ha paragonato l'arrivo di DeepSeek al lancio dello Sputnik durante la Guerra Fredda da parte dell'Unione Sovietica: come questo destabilizzò le certezze americane, rivelando come gli USA fossero stati battuti sul tempo nel lancio del primo satellite, così DeepSeek mostra quanto avanti nel campo della IA sia la Cina.

Prova concreta di quanto affermato è la situazione delle Borse, dove le azioni di diverse aziende americane impegnate nella IA, come Nvidia, hanno perso bruscamente valore. Poco importa che questo possa venire recuperato nei prossimi giorni: un rivale temibile è apparso.

DeepSeek si può utilizzare dal sito web ufficiale oppure tramite l'app dedicata per iOS e Android, tenendo chiaramente ben presente che il funzionamento di questa IA è sottoposto alle regole imposte dal governo cinese, a partire dalla censura di tutti quegli argomenti ritenuti scomodi.

A parte questo dettaglio funziona esattamente come qualunque altro LLM, e può essere usata per conversare, generare testi e produrre codice.

«DeepSeek ha travolto il mercato perché fa di più con meno» ha sintetizzato Giuseppe Sette, esperto di IA per Reflexivity, spiegando che questo risultato è ottenuto grazie alla tecnica nota come inference-time computing che, in sintesi, «attiva soltanto le porzioni del modello importanti per una data richiesta, facendo risparmiare denaro e potenza di calcolo».

«E ha mostrato» - ha concluso Sette - «che, con la IA, nei prossimi anni continueranno a esserci sorprese».