Il collasso delle IA

Cassandra Crossing/ Un dettaglio tecnico delle false IA sarà decisivo per cambiarne forse il modello di sviluppo, ma certamente quello di business.



[ZEUS News - www.zeusnews.it - 10-11-2023]

cassandra collasso ia 01

Cassandra, come i 24 inscalfibili lettori ricorderanno bene, ha da sempre sostenuto una posizione estremamente critica sulle attuali false intelligenze artificiali, cioè sui grandi modelli linguistici che vengono costantemente abusati per motivi commerciali.

Il problema delle false IA attuali non è quello di funzionare male; in effetti funzionano molto bene, se usate per fare quello per cui sono nate, cioè elaborare testi, come correttori ortografici "on steroid" quali effettivamente sono.

Il problema è piuttosto la campagna di marketing, globale e senza pari nella storia, con cui i modelli linguistici sono stati trasformati in occasioni di business, senza nessuna considerazione sui vantaggi e sui costi sociali che questo comporterà. Senza nessuno scrupolo, insomma. Un film già visto e rivisto, purtroppo.

Tanto per cambiare e non annoiare troppo, Cassandra oggi racconterà un fatto tecnico poco noto sui modelli linguistici, che mette addirittura in dubbio il modello di marketing delle false intelligenze artificiali, e che questo marketing di rapina possa durare a lungo. Il titolo di questa elucubrazione infatti, non è la solita iperbole, ma il nome di un fenomeno scientifico e dimostrato. Come spesso accade, per raccontare un argomento tecnico sono necessarie alcune premesse. Lettore avvertito...

Nella data economy è indispensabile, per poter fare ricerca e sviluppo, utilizzare basi di dati "di test". Questo una volta non creava problemi; si prendevano, anzi predavano i primi dati "veri" che capitavano e li si usava. Poi li si pubblicava, magari cedendoli ad altri ricercatori e così via.

Tutto bene apparentemente, ma cosa succedeva se si faceva ricerca medica? O sociologica? O altri tipi di ricerca che dovessero trattare dati medici, genetici, o altri dati sensibili e particolari? Succedeva che dati critici, oggi abbastanza ben difesi dal GDPR e da altre norme, venissero elaborati, condivisi, diffusi e rielaborati al di fuori di ogni controllo. La stessa trascuratezza era già accaduta nei primi laboratori nucleari per la ricerca militare, in cui gli addetti ai lavori trasportavano radioisotopi in buste di plastica, magari tenute in tasca.

D'altra parte anche il corpo di Maria Curie si trova in una bara di piombo, e i suoi diari devo essere conservati sotto schermi antiradiazioni. La ricerca ha sempre esposto a rischi i primi scopritori, e magari anche altre persone; fa parte delle regole del gioco.

Tornando al nostro problema, la ricerca "allegra" dei data scientist ha esposto non loro ma le persone i cui dati venivano usati a una nuova specie di rischio; la perdita e l'abuso dei propri dati particolari, medici, genetici e via dicendo. Grazie anche al GDPR sono poi stati presi provvedimenti, ma il problema di base era che i dati per la ricerca erano, sono e saranno sempre indispensabili. Che fare allora?

I ricercatori del settore hanno cominciato a utilizzare nuove tecniche di anonimizzazione dei dati, molto sbandierate come soluzione, ma che in realtà si sono dimostrate molto deboli, visto che altri ricercatori hanno sviluppato, con relativa facilità, tecniche di deanonimizzazione e reidentificazione dei dati che funzionavano benissimo. Come nota a margine, non a caso nel 2010 la deanonimizzazione è stato il tema principale di numerosi convegni, incluso e-privacy che descriveva il suo tema così:

Recenti progressi nelle tecniche di incrocio di dati personali, ben riassunte nella fondamentale ricerca di Paul Ohm "Broken promises of privacy: responding to the surprising failure of anonymization" hanno non scosso ma abbattuto completamente l'edificio tecnico-normativo della 196/2003, migrato però in parte anche nel GDPR, che considera l'anonimizzazione la più sofisticata barriera eretta a difesa dei dati personali e sensibili.

Per poter quindi usare dati realistici, indispensabili per la ricerca, chi doveva trovare a tutti i costi una soluzione partorì una delle più grandi supercazzole scientifiche mai concepite: i dati sintetici, cioè dati realistici creati tramite metodi informatici.

È chiaro a tutti (tranne che agli specialisti) che nei dati sintetici, come nell'Appartamento spagnolo, uno trova solo quello che porta. Se sono dati, c'è solo l'informazione che ci si mette, non altro: non altre informazioni che possano essere estratte, come avviene per dati veri. Le premesse, per i fottuti eroi che sono arrivati a leggere fin qui (come direbbe la Regina Rossa), sono finalmente terminate.

Ti invitiamo a leggere la pagina successiva di questo articolo:
Dati sintetici, veleno per le IA

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) o segnalare un refuso.
© RIPRODUZIONE RISERVATA

Approfondimenti
E-privacy 2012 si trasferisce a Milano
Big Brother Award, al via l'edizione 2011
Il Grande Fratello bussa alle porte anche quest'anno
Trofei Big Brother Awards in vendita su eBay
Big Brother Awards: Facebook e Carlucci fanno incetta di premi
E-privacy 2009 e il controllo totale di Internet

Commenti all'articolo (ultimi 5 di 14)

ah, ecco... ora mi torna... Ŕ che io di quei lavori... leggo solo risultati e conseguenze, non certo i processi
25-11-2023 09:50

Dipende sempre da chi la usa, se uno scienziato avrÓ interessa ad inserire nella algoritmo di analisi dati certi e provati, se invece chi la usa Ŕ un influencer da TikTok lo riempirÓ di cazzate, e tali robe riceverÓ indietro dall'algoritmo. :wink: Leggi tutto
21-11-2023 14:42

C'Ŕ invece chi la usa solo con... strutto. :sbonk: Leggi tutto
20-11-2023 14:51

In teoria no. Ma c'Ŕ il pericolo che qualche idiota le programmi! :twisted: Leggi tutto
14-11-2023 11:03

probabilmente ho qualche problema di comprendonio e non ho capito quanto Ŕ scritto nell'articolo, perchŔ l'AI in lavori scientifici che leggo e studio viene usata e con costrutto.
13-11-2023 22:44

La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.
E' VIETATA la riproduzione dei testi e delle immagini senza l'espressa autorizzazione scritta di Zeus News. Tutti i marchi e i marchi registrati citati sono di proprietà delle rispettive società. Informativa sulla privacy. I tuoi suggerimenti sono di vitale importanza per Zeus News. Contatta la redazione e contribuisci anche tu a migliorare il sito: pubblicheremo sui forum le lettere piu' interessanti.
Sondaggio
Qual Ŕ la pi¨ grande inquietudine che hai a casa e che la domotica potrebbe risolvere?
Sentirsi insicuri in casa quando si Ŕ lý da soli.
Che le persone lascino le luci accese quando non serve.
Dimenticarsi se le porte sono state chiuse a chiave o se le finestre sono state chiuse a dovere.
Familiari anziani non autosufficienti quando in casa sono soli.
Preoccuparsi della sicurezza quando siamo lontani.
Perdere tempo a girare per casa ad accendere o spegnere le luci.
Preoccuparsi che le attrezzature della cucina (per esempio il forno) siano state lasciate accese accidentalmente.
Preoccuparsi che la casa sembri vuota quando siamo lontani.
Possibili incidenti nelle zone della casa che non sono adeguatamente illuminate durante la notte.
La casa Ŕ troppo calda o troppo fredda per il dovuto comfort.

Mostra i risultati (1104 voti)
Dicembre 2023
Windows 10, Microsoft vara il supporto esteso oltre il 2025
YouTube Playables è realtà
Novembre 2023
Google Drive, scomparsi i file degli ultimi sei mesi
Dopo videochat con una bella ragazza, ora mi ricatta con le mie immagini intime
Windows, problemi con le licenze dopo la fine degli upgrade gratuiti
Office 2024 esiste, e non richiede un abbonamento
Google, meno di un mese alla "grande pulizia" degli account
La voce di John Lennon è da considerare autentica o sintetica?
Ottobre 2023
Windows 10, una petizione per allungare il supporto
Addio password, benvenuta passkey?
Nokia licenzierà 14.000 persone
Amazon, dal 2024 consegne coi droni anche in Italia
Microsoft Edge curiosa nei dati degli altri browser a ogni avvio
Canonical ritira Ubuntu 23.10 per “discorsi d'odio”
Windows 11, basta un comando per aggirare i controlli sull'hardware
Tutti gli Arretrati
Accadde oggi - 8 dicembre


web metrics