Microsoft accusata di leggere i documenti Word allo scopo di addestrare l'IA

I fatti fin qui.

Articolo multipagina1 / 3

[ZEUS News - www.zeusnews.it - 29-11-2024]

Immagine generata con Merlin AI

Le intelligenze artificiali hanno bisogno di dati sui quali addestrarsi. Tanti, tanti dati: più ne hanno, più diventano capaci di fornire risposte utili. Un'intelligenza artificiale che elabora testi, per esempio, deve acquisire non miliardi, ma migliaia di miliardi di parole per funzionare decentemente.

Procurarsi così tanto testo non è facile, e quindi le aziende che sviluppano intelligenze artificiali pescano dove possono: non solo libri digitalizzati ma anche pagine Web, articoli di Wikipedia, post sui social network. E ancora non basta. Secondo le indagini del New York Times [link diretto con paywall; copia su Archive.is], OpenAI, l'azienda che sviluppa ChatGPT, aveva già esaurito nel 2021 ogni fonte di testo in inglese pubblicamente disponibile su Internet.

Per sfamare l'appetito incontenibile della sua intelligenza artificiale, OpenAI ha creato uno strumento di riconoscimento vocale, chiamato Whisper, che trascriveva il parlato dei video di YouTube e quindi produceva nuovi testi sui quali continuare ad addestrare ChatGPT. Whisper ha trascritto oltre un milione di ore di video di YouTube, e dall'addestramento basato su quei testi è nato ChatGPT 4.

Questa stessa trascrizione di massa l'ha fatta anche Google, che inoltre ha cambiato le proprie condizioni di servizio per poter acquisire anche i contenuti dei documenti pubblici scritti su Google Docs, le recensioni dei ristoranti di Google Maps, e altro ancora [New York Times].

Non perderti anche:

Cloudflare: l'IA sta distruggendo il web

Da Adobe una web app per impedire alla IA l'uso delle immagini

Edge riprogetta la pagina Nuova Scheda con un tocco di Copilot

Da Microsoft una IA che non ha bisogno di GPU

Da parte sua, Meta ha avvisato noi utenti che da giugno di quest'anno usa tutto quello che scriviamo pubblicamente su Facebook e Instagram per l'addestramento delle sue intelligenze artificiali, a meno che ciascuno di noi non presenti formale opposizione, come ho raccontato nella puntata del 7 giugno 2024.

Insomma, la fame di dati delle intelligenze artificiali non si placa, e le grandi aziende del settore sono disposte a compromessi legalmente discutibili pur di poter mettere le mani sui dati che servono. Per esempio, la legalità di usare massicciamente i contenuti creati dagli YouTuber senza alcun compenso o riconoscimento è perlomeno controversa. Microsoft e OpenAI sono state portate in tribunale negli Stati Uniti con l'accusa di aver addestrato il loro strumento di intelligenza artificiale Copilot usando milioni di righe di codice di programmazione pubblicate sulla piattaforma GitHub senza il consenso dei creatori di quelle righe di codice e violando la licenza open source adottata da quei creatori [Vice.com].

In parole povere, il boom dell'intelligenza artificiale che stiamo vivendo, e i profitti stratosferici di alcune aziende del settore, si basano in gran parte su un saccheggio senza precedenti della fatica di qualcun altro. E quel qualcun altro, spesso, siamo noi.

Per approfondire:

Copilot ora ricorda quello che gli dici

Windows 11 e l'update che disinstalla Copilot per sbaglio

Apple, la IA ''fatta in casa'' non è poi così intellig...

Il giorno che la IA si rifiutò di eseguire un comando

In questo scenario è arrivata un'accusa molto specifica che, se confermata, rischia di toccarci molto da vicino. L'accusa è che se scriviamo un testo usando Word di Microsoft, quel testo può essere letto e usato per addestrare le intelligenze artificiali dell'azienda.

Questo vorrebbe dire che qualunque lettera confidenziale, referto medico, articolo di giornale, documentazione aziendale riservata, pubblicazione scientifica sotto embargo sarebbe a rischio di essere ingerita nel ventre senza fondo delle IA, dal quale si è già visto che può essere poi rigurgitata, per errore o per dolo, rendendo pubblici i nostri dati riservati, tant'è vero che il già citato New York Times è in causa con OpenAI e con Microsoft perché nei testi generati da ChatGPT e da Copilot compaiono interi blocchi di testi di articoli della testata, ricopiati pari pari [Harvard Law Review].

Vediamo su cosa si basa quest'accusa.

Per approfondire:

La IA di Mistral diventa open source per sfidare DeepSeek

Oscar, vittoria per l'open source grazie a Flow

Office, spunta una versione gratis ma con la pubblicità

Reddit, un paywall per proteggere contenuti esclusivi

Ti invitiamo a leggere la pagina successiva di questo articolo:
Le modalità di utilizzo dei dati personali

Proposte di lettura:

Google Maps si adegua a Trump

GitHub Copilot gratuito per tutti gli utenti di Visual Studio Code

ChatGPT Search ora è disponibile per tutti

Il router completamente open source

Articolo multipagina

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) o segnalare un refuso.

Paolo Attivissimo

Commenti all'articolo (ultimi 5 di 48)

zeross

Ma puoi vivere anche in un camper in un parcheggio di roulotte in riva al mare, magari della sicilia, forse non è cosi male? :roll:
7-2-2025 18:26

{issimo}

Se non clicchi su "accetto" in una gran parte delle clausole che riguardano un po' tutto, dal software alle automobili alla casa, l'unico posto dove puoi vivere è la foresta amazzonica, almeno fino a quando esisterà. Clicco su "accetto" sul minimo dei contratti possibile, pur non essendo... Leggi tutto
5-2-2025 10:18

{laz}

Sempre attivissimo, dettagliato e circostanziato.
29-12-2024 09:22

zeross

Già tra i paesi esclusi metti almeno un terzo della popolazione mondiale, poi c'è da dire che quando una accetta le clausole contrattuali dichiara espressamente di aver letto le condizioni contrattuali quindi ha accettato e conosciuto anche questa opzione specifica, e non si può invocare come scusante il fatto che una clicca su accetto... Leggi tutto
26-12-2024 15:42

Leggi gli altri 43 commenti nel forum Office e LibreOffice
Inserisci un commento - anche se NON sei registrato

La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.


Sicurezza(4 commenti) Così i truffatori sfruttano ChatGPT	News(13 commenti) Debutta Euro-Office tra le proteste di LibreOffice

Segnalazioni(2 commenti)

Lo strumento che ti dice quali modelli IA puoi eseguire davvero sul tuo PC

News(6 commenti)

ChatGPT, arriva Lockdown Mode

Flash(12 commenti)

Iliad lancia il suo FWA: modem 5G, attivazione rapida e velocità fino a 300 Mbps

Flash(3 commenti)

GoPro in crisi: conti in rosso e ipotesi di vendita

E' VIETATA la riproduzione dei testi e delle immagini senza l'espressa autorizzazione scritta di Zeus News. Tutti i marchi e i marchi registrati citati sono di proprietà delle rispettive società. Informativa sulla privacy. I tuoi suggerimenti sono di vitale importanza per Zeus News. Contatta la redazione e contribuisci anche tu a migliorare il sito: pubblicheremo sui forum le lettere piu' interessanti.

Hai a disposizione ancora caratteri. Per inserire commenti più lunghi (e senza CAPTCHA), iscriviti.
Il tuo nome:		La tua email: