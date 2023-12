Per l'addestramento del modello sono state usate 1,1 miliardi di foto caricate dagli utenti sul social network.

Se avete pubblicato fotografie su Facebook e Instagram, ci sono buone probabilità che siano state usate per addestrare la IA che Meta ha appena reso pubblicamente disponibile per la generazione di immagini.

Accessibile all'indirizzo imagine.meta.com (ma, al momento in cui scriviamo, non dall'Italia) per chiunque abbia un account Meta, sotto molti punti di vista è l'ennesimo concorrente di IA generative come DALL-E, Midjourney o Stable Diffusion: a fronte di un input testuale genera un'immagine che lo rappresenti visivamente.

Ciò che è particolarmente interessante in questo servizio è che esso è stato costruito sul modello noto come Emu, il quale è stato addestrato sottoponendogli 1,1 miliardi di immagini ricavate dalle foto pubblicate dagli utenti di Facebook e Instagram sui loro profili.

Il dibattito relativo alla correttezza circa l'uso di immagini per l'addestramento degli LLM senza l'esplicito consenso di chi quelle immagini ha prodotto è tuttora in corso, ed è particolarmente sentito da quegli artisti che hanno visto le proprie opere venire usate dalle IA generative senza alcun rispetto per il copyright.

Nel caso di Emu, la questione si sposta dal diritto d'autore alla privacy, poiché frequentemente le immagini pubblicate dagli utenti sui social network contengono soggetti e situazioni che, pur non essendo strettamente "privati" (dopotutto sono state caricate su Facebook o Instagram), generalmente non sono nemmeno pensati per essere considerati di pubblico dominio.

Per difendersi preventivamente dalle accuse, Meta ha fatto sapere che la selezioni delle immagini da adoperare per l'addestramento ha escluso esplicitamente quelle inserite in post e conversazioni contrassegnati come «privati».

«Abbiamo cercato di escludere i dati che mostrino una grande presenza di informazioni personali» ha dichiarato Nick Clegg, presidente della divisione Global Affairs di Meta e sottolineando che la «grande maggioranza» dei contenuti usati erano contrassegnati come "pubblici".

Clegg sembra più preoccupato circa il fronte del diritto d'autore: ha infatti affermato di aspettarsi «una discreta quantità di controversie» circa la possibilità che «i contenuti creativi siano protetti o meno dall'attuale concezione del "fair use"».

Né la IA generativa né Emu sono open source, nonostante le ripetute e anche recenti assicurazioni da parte di Meta circa il proprio, entusiastico supporto alle tecnologie a sorgente aperto.