Il collasso delle IA

Cassandra Crossing/ Un dettaglio tecnico delle false IA sarà decisivo per cambiarne forse il modello di sviluppo, ma certamente quello di business.



[ZEUS News - www.zeusnews.it - 10-11-2023]

cassandra collasso ia 01

Cassandra, come i 24 inscalfibili lettori ricorderanno bene, ha da sempre sostenuto una posizione estremamente critica sulle attuali false intelligenze artificiali, cioè sui grandi modelli linguistici che vengono costantemente abusati per motivi commerciali.

Il problema delle false IA attuali non è quello di funzionare male; in effetti funzionano molto bene, se usate per fare quello per cui sono nate, cioè elaborare testi, come correttori ortografici "on steroid" quali effettivamente sono.

Il problema è piuttosto la campagna di marketing, globale e senza pari nella storia, con cui i modelli linguistici sono stati trasformati in occasioni di business, senza nessuna considerazione sui vantaggi e sui costi sociali che questo comporterà. Senza nessuno scrupolo, insomma. Un film già visto e rivisto, purtroppo.

Tanto per cambiare e non annoiare troppo, Cassandra oggi racconterà un fatto tecnico poco noto sui modelli linguistici, che mette addirittura in dubbio il modello di marketing delle false intelligenze artificiali, e che questo marketing di rapina possa durare a lungo. Il titolo di questa elucubrazione infatti, non è la solita iperbole, ma il nome di un fenomeno scientifico e dimostrato. Come spesso accade, per raccontare un argomento tecnico sono necessarie alcune premesse. Lettore avvertito...

Nella data economy è indispensabile, per poter fare ricerca e sviluppo, utilizzare basi di dati "di test". Questo una volta non creava problemi; si prendevano, anzi predavano i primi dati "veri" che capitavano e li si usava. Poi li si pubblicava, magari cedendoli ad altri ricercatori e così via.

Tutto bene apparentemente, ma cosa succedeva se si faceva ricerca medica? O sociologica? O altri tipi di ricerca che dovessero trattare dati medici, genetici, o altri dati sensibili e particolari? Succedeva che dati critici, oggi abbastanza ben difesi dal GDPR e da altre norme, venissero elaborati, condivisi, diffusi e rielaborati al di fuori di ogni controllo. La stessa trascuratezza era già accaduta nei primi laboratori nucleari per la ricerca militare, in cui gli addetti ai lavori trasportavano radioisotopi in buste di plastica, magari tenute in tasca.

D'altra parte anche il corpo di Maria Curie si trova in una bara di piombo, e i suoi diari devo essere conservati sotto schermi antiradiazioni. La ricerca ha sempre esposto a rischi i primi scopritori, e magari anche altre persone; fa parte delle regole del gioco.

Tornando al nostro problema, la ricerca "allegra" dei data scientist ha esposto non loro ma le persone i cui dati venivano usati a una nuova specie di rischio; la perdita e l'abuso dei propri dati particolari, medici, genetici e via dicendo. Grazie anche al GDPR sono poi stati presi provvedimenti, ma il problema di base era che i dati per la ricerca erano, sono e saranno sempre indispensabili. Che fare allora?

I ricercatori del settore hanno cominciato a utilizzare nuove tecniche di anonimizzazione dei dati, molto sbandierate come soluzione, ma che in realtà si sono dimostrate molto deboli, visto che altri ricercatori hanno sviluppato, con relativa facilità, tecniche di deanonimizzazione e reidentificazione dei dati che funzionavano benissimo. Come nota a margine, non a caso nel 2010 la deanonimizzazione è stato il tema principale di numerosi convegni, incluso e-privacy che descriveva il suo tema così:

Recenti progressi nelle tecniche di incrocio di dati personali, ben riassunte nella fondamentale ricerca di Paul Ohm "Broken promises of privacy: responding to the surprising failure of anonymization" hanno non scosso ma abbattuto completamente l'edificio tecnico-normativo della 196/2003, migrato però in parte anche nel GDPR, che considera l'anonimizzazione la più sofisticata barriera eretta a difesa dei dati personali e sensibili.

Per poter quindi usare dati realistici, indispensabili per la ricerca, chi doveva trovare a tutti i costi una soluzione partorì una delle più grandi supercazzole scientifiche mai concepite: i dati sintetici, cioè dati realistici creati tramite metodi informatici.

È chiaro a tutti (tranne che agli specialisti) che nei dati sintetici, come nell'Appartamento spagnolo, uno trova solo quello che porta. Se sono dati, c'è solo l'informazione che ci si mette, non altro: non altre informazioni che possano essere estratte, come avviene per dati veri. Le premesse, per i fottuti eroi che sono arrivati a leggere fin qui (come direbbe la Regina Rossa), sono finalmente terminate.

Ti invitiamo a leggere la pagina successiva di questo articolo:
Dati sintetici, veleno per le IA

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) o segnalare un refuso.
© RIPRODUZIONE RISERVATA

Approfondimenti
E-privacy 2012 si trasferisce a Milano
Big Brother Award, al via l'edizione 2011
Il Grande Fratello bussa alle porte anche quest'anno
Trofei Big Brother Awards in vendita su eBay
Big Brother Awards: Facebook e Carlucci fanno incetta di premi
E-privacy 2009 e il controllo totale di Internet

Commenti all'articolo (ultimi 5 di 17)

{Enrico}
l'effetto Garbage in Garbage out ha fatto soffrire chi ha usato DB o comunque file di output da quando esistono i computer difficile che non ne fossero immuni anche le AI!
4-4-2024 17:05

Torno a ribadire che i dati falsi ( profili inventati su Facebook, o sui Meetic), i dati scemi come moltissimi presenti su TikTok, le elucubrazioni dei cronisti parlamentari, i dati sintetici, le Maskirovska dei Russi, le bugie della pubblicità e le sparate dei gossip, sono un continuo danneggiare le possibilità di crescita delle... Leggi tutto
27-3-2024 10:09

{Shrdna}
Purtroppo non se ne esce, la IA e' uno strumento, puo' essere configurato male e produrre risultati dannosi, oppure puo' essere configurato bene ma sfruttato male con conseguenze negative. Per quanto riguarda l'inquinamento della cultura e dell'infosfera e di chi deve/puo' discernere la verita' dei... Leggi tutto
26-3-2024 12:57

ah, ecco... ora mi torna... è che io di quei lavori... leggo solo risultati e conseguenze, non certo i processi
25-11-2023 09:50

La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.
E' VIETATA la riproduzione dei testi e delle immagini senza l'espressa autorizzazione scritta di Zeus News. Tutti i marchi e i marchi registrati citati sono di proprietà delle rispettive società. Informativa sulla privacy. I tuoi suggerimenti sono di vitale importanza per Zeus News. Contatta la redazione e contribuisci anche tu a migliorare il sito: pubblicheremo sui forum le lettere piu' interessanti.
Sondaggio
Quanto usi il tablet?
Molto. Ce l'ho sempre con me.
Almeno una volta al giorno.
Non tutti i giorni.
Raramente.
Non lo uso quasi mai.
Non ho un tablet.

Mostra i risultati (2379 voti)
Aprile 2024
Enel nel mirino dell'Antitrust per le bollette esagerate
TIM, altre ''rimodulazioni'' in arrivo
L'algoritmo di ricarica che raddoppia la vita utile delle batterie
Hype e Banca Sella, disservizi a profusione
Falla nei NAS D-Link, ma la patch non arriverà mai
La navigazione in incognito non è in incognito
Le tre stimmate della posta elettronica
Amazon abbandona i negozi coi cassieri a distanza
Marzo 2024
Buone azioni e serrature ridicole
Il piano Merlyn, ovvero la liquidazione di Tim
Falla nelle serrature elettroniche, milioni di stanze d'hotel a rischio
L'antenato di ChatGPT in un foglio Excel
La valle inquietante
La crisi di Tim e la divisione sindacale
La fine del mondo, virtuale
Tutti gli Arretrati
Accadde oggi - 27 aprile


web metrics