Immagine: Apertus

La Svizzera ha lanciato Apertus, un modello linguistico di grandi dimensioni (LLM) completamente open-source, sviluppato da istituzioni pubbliche come il Politecnico Federale di Losanna (EPFL), il Politecnico Federale di Zurigo (ETH Zurich) e il Centro Svizzero di Calcolo Scientifico (CSCS). "Apertus" vuol dire proprio quel che sembra: viene dal latino - significa appunto aperto - e sta a indicare la trasparenza, il rispetto della privacy e il supporto a oltre 1.000 lingue che contraddistinguono il modello. Con un addestramento su 15 trilioni di token e un investimento di oltre 10 milioni di ore GPU sul supercomputer Alps, Apertus si propone come un'infrastruttura digitale pubblica, paragonabile a strade o reti elettriche.

Apertus è stato progettato con tre principi fondamentali: trasparenza, supporto a più lingue e rispetto delle norme. A differenza di molti modelli proprietari, come ChatGPT di OpenAI o Claude di Anthropic, che limitano l'accesso a pesi del modello, dati di addestramento e processi interni, Apertus rende tutto pubblico sotto una licenza Apache 2.0, che consente l'uso commerciale e accademico. Sono inclusi documentazione completa, codice sorgente, dataset di addestramento e persino checkpoint intermedi, permettendo a ricercatori e sviluppatori di verificare ogni fase del processo e adattare il modello alle proprie esigenze.

Il modello è disponibile in due versioni: una con 8 miliardi di parametri, adatta a utenti individuali o dispositivi con risorse limitate, e una con 70 miliardi di parametri, paragonabile per capacità a Llama 3 di Meta (2024). L'addestramento su 15 trilioni di token, di cui il 40% in lingue diverse dall'inglese, rende Apertus uno degli LLM più inclusivi dal punto di vista linguistico, coprendo anche lingue meno rappresentate come il romancio, una delle quattro lingue ufficiali svizzere. Un elemento distintivo è il rispetto della privacy e delle normative. Apertus utilizza esclusivamente dati pubblici, filtrati per escludere informazioni personali e rispettare le richieste di opt-out dai siti web, anche retroattivamente. Questo approccio risponde alle critiche mosse ad altre aziende di IA, accusate di scraping non autorizzato. Apertus è conforme alle leggi svizzere sulla protezione dei dati, al diritto d'autore e all'EU AI Act, rendendolo una scelta adatta per settori regolamentati come la finanza e la sanità.

Apertus è il risultato della Swiss AI Initiative, un progetto collaborativo che coinvolge oltre 800 ricercatori da più di 10 istituzioni accademiche svizzere, finanziato con oltre 10 milioni di ore GPU sul supercomputer Alps del CSCS a Lugano e dal Consiglio dei Politecnici Federali (ETH Board). La collaborazione tra EPFL, ETH Zurich e CSCS, insieme al supporto di Swisscom, ha permesso di creare un modello che non vuole essere un semplice prodotto commerciale, ma un'infrastruttura per l'innovazione, come sottolineato da Thomas Schulthess, direttore del CSCS: «Apertus non è un caso convenzionale di trasferimento tecnologico, ma un motore di innovazione per ricerca, società e industria». Il modello è accessibile tramite la piattaforma Swiss AI di Swisscom, che offre un'interfaccia dedicata per hackathon e clienti aziendali, e attraverso Hugging Face, un hub globale per modelli AI. Inoltre, la Public AI Inference Utility consente l'accesso a sviluppatori e istituzioni internazionali, con l'intenzione di promuovere un movimento globale per un'IA pubblica.

Apertus si propone come una base per sviluppare applicazioni come chatbot, sistemi di traduzione e strumenti educativi. La sua natura open-source permette a ricercatori, aziende e hobbisti di personalizzarlo per esigenze specifiche, come l'analisi di dati in contesti multilingue o lo sviluppo di modelli specializzati in settori come sanità, diritto o ricerca climatica. La Swiss AI Initiative prevede inoltre di aggiornare regolarmente Apertus, con versioni future che esploreranno adattamenti specifici per settori come la sanità e l'educazione, mantenendo i principi di trasparenza e accessibilità. Gli eventi Swiss {ai} Weeks, una serie di hackathon e workshop in 24 città svizzere, offriranno agli sviluppatori l'opportunità di testare il modello e contribuire al suo miglioramento.

Apertus è interessante perché rappresenta un modello alternativo nel panorama dell'IA, dominato da giganti tecnologici come OpenAI e Google. La sua trasparenza risponde alle crescenti preoccupazioni su bias, opacità dei dati e conformità legale. La completa apertura solleva sfide: senza le protezioni integrate dei modelli proprietari, la supervisione della comunità sarà cruciale per prevenire abusi. Inoltre la dipendenza da risorse computazionali avanzate per il modello a 70 miliardi di parametri potrebbe limitarne l'accesso per utenti con hardware meno potente.