Come proteggere le tue immagini dai generatori artistici AI

Pubblicato: 2023-03-24
Scrivania Amazon allestita dal CES 2023 con opere d'arte sul muro.
Hannah Stryker / How-To Geek
Puoi provare alcune cose per proteggere la tua arte dai generatori di intelligenza artificiale:
  • Opt-out dei set di dati di formazione con uno strumento come HaveIBeenTrained.com.
  • Utilizza un file "robots.txt" per allontanare i web crawler, molti dei quali vengono utilizzati in primo luogo per creare set di dati.
  • Copyright la tua opera d'arte e sfida gli sviluppatori di questi strumenti in tribunale (o partecipando a cause legali collettive esistenti).
  • Carica solo immagini con filigrana aggressiva.
  • Evita innanzitutto di mettere la tua arte su Internet.

I generatori di arte artificiale potrebbero non essere in grado di imitare la creatività umana, ma sicuramente possono fregarti. Questa è una preoccupazione sia per gli artisti che per coloro che temono la conquista dell'IA, ma potrebbe non essere tutto perduto.

Come proteggere l'arte protetta da copyright dall'intelligenza artificiale

I generatori di arte AI non sono niente senza i set di dati su cui sono stati addestrati. Ciò comporta il prelievo di un enorme campione di opere d'arte esistenti e la contestualizzazione in un modo che consenta agli esseri umani di utilizzare suggerimenti del linguaggio naturale per creare opere d'arte simili. Puoi provarlo tu stesso utilizzando un'app di arte generativa come DALL-E 2 o Midjourney di OpenAI.

Abbiamo chiesto a DALL-E 2 di produrre "un'immagine di Elmo da Sesame Street nello stile di Pablo Picasso" ed ecco cosa abbiamo ottenuto (sì, questo è stato il migliore del gruppo):

Elmo nello stile di Pablo Picasso per gentile concessione di OpenAI DALL-E 2

Essere in grado di creare opere d'arte nello stile di artisti morti potrebbe non sollevare troppi campanelli d'allarme, in particolare in uno stile così riconoscibile. Ma per gli artisti moderni che condividono le loro creazioni tramite artisti del calibro di ArtStation, DeviantArt, Behance, siti Web personali e pagine di social media come Instagram o Facebook, è molto più preoccupante.

Quindi cosa puoi fare per proteggere le tue creazioni dall'essere utilizzate per addestrare un'intelligenza artificiale che può sputare creazioni molto più velocemente di te?

Rinuncia ai set di dati di addestramento

Puoi scegliere di rinunciare a due dei più grandi set di dati di addestramento a immagini aperte su Internet, LAION-400M e LAION-5B utilizzando HaveIBeenTrained.com. Questi set di dati sono utilizzati da alcuni dei più grandi generatori di immagini sul Web, tra cui Stable Diffusion e Google Imagen. Poiché sono veramente aperti, vengono utilizzati anche da molti altri strumenti di intelligenza artificiale generativa.

Sfortunatamente, il processo per farlo è lento e noioso. Dovrai prima registrarti per un account e quindi cercare o caricare un'immagine per trovare le corrispondenze all'interno del set di dati. È quindi possibile fare clic con il pulsante destro del mouse sull'immagine nel browser Web desktop e scegliere l'opzione "Aggiungi a My Opt-Outs". In alternativa, puoi concedere al set di dati il ​​permesso esplicito di utilizzare un'immagine facendo invece clic su "Aggiungi a I miei opt-in".

Disattiva i set di dati con HaveIBeenTrained.com

Dovrai farlo per ogni immagine che trovi, quindi può essere un processo scrupoloso se sei un artista con una grande mole di lavoro. Quanto tempo ci vorrà realisticamente dipende in ultima analisi da quanto è facile filtrare il tuo lavoro, il che potrebbe essere più semplice se hai un lavoro associato a un nome o progetto univoco, un grande seguito online e così via.

Sebbene questi due enormi set di dati siano un ottimo punto di partenza, sono tutt'altro che gli unici utilizzati. Gli individui possono creare i propri set di dati e alcuni lo fanno per replicare un particolare artista o stile artistico. Alcune aziende come OpenAI non rivelano affatto quali set di dati utilizzano i loro strumenti, quindi non c'è modo di combatterli.

Usa Robots.txt per respingere i crawler

Un file robots.txt è un piccolo documento di testo che viene inserito nella directory principale di un sito Web per indicare ai web crawler dove sono autorizzati o meno ad andare. Sebbene Google affermi esplicitamente che "non è un meccanismo per tenere una pagina web fuori da Google", potresti comunque provare a usarlo per tenere i web crawler lontani dalla tua opera d'arte se la stai ospitando sul tuo sito web.

Come suggerisce il nome, i web crawler eseguono la scansione del Web alla ricerca di contenuti da indicizzare. I motori di ricerca sono tutt'altro che gli unici crawler e i crawler vengono utilizzati anche per creare set di dati molto simili ai set di dati LAION-400M e LAION-5B sopra menzionati. Il problema principale con robots.txt è che si basa sul web crawler che rispetta la tua richiesta.

Uno dei set di dati più grandi in circolazione è Common Crawl, i cui dati sono stati utilizzati per costruire i set di dati di LAION. Il processo di scansione del Web è in corso, con LAION che afferma che il suo set di dati LAION-400M attuale (al momento della stesura) è stato creato "da pagine Web casuali scansionate tra il 2014 e il 2021".

Common Crawl afferma di rispettare robots.txt e il protocollo di esclusione dei robot sia in termini di blocco dei contenuti che di ritardo della scansione (per risparmiare sulla larghezza di banda). Puoi farlo creando una regola per l'agente utente "CCBot" nel tuo file Robots.txt. Ovviamente, niente di tutto questo ti aiuterà se non stai ospitando autonomamente la tua opera d'arte.

Google Search Central ha una guida pratica per creare un file robots.txt, oppure puoi utilizzare un sito web come Robots.txt Generator di Ryte per crearne uno per te. Puoi consentire o disabilitare agenti utente specifici da directory specifiche o semplicemente bloccare tutto con un carattere jolly (*). Ad esempio, un file robots.txt che blocca tutti i file nella tua directory /images/ da Common Crawl pur consentendo ad altri crawler di indicizzare il tuo sito web direbbe:

 Agente utente: CCbot
Non consentire: /immagini/

Agente utente: *
Permettere: /

Mappa del sito: https://www.example.com/sitemap.xml

Ciò non sconfiggerà i crawler che hanno già visitato il tuo sito Web, ma dovrebbe impedire a Common Crawl di indicizzare la tua cartella /images/ (e qualsiasi nuovo caricamento dall'ultima scansione) in futuro.

Copyright la tua opera d'arte

Anche se il diritto d'autore è implicito nel lavoro che hai creato, anche fare di tutto per proteggere il tuo lavoro potrebbe valere la pena. Negli Stati Uniti puoi farlo registrando le tue opere su Copyright.gov. Puoi inviare fino a 10 opere inedite in una singola domanda, tieni presente che l'elaborazione delle tue opere può richiedere del tempo (al momento circa un anno).

Avere registrato il copyright per il tuo lavoro ti dà più di una gamba su cui stare in questioni che coinvolgono i tribunali. Questa è l'idea alla base di un'azione legale collettiva intentata contro Stability AI (sviluppatore di Stable Diffusion e DreamStudio, finanziatore di LAION), DeviantArt (una piattaforma per artisti e sviluppatore di DreamUp) e Midjourney, un'app di arte generativa per conto degli artisti interessati .

Diversi tipi di lavoro che puoi proteggere su Copyright.gov

Puoi leggere tutto sulla causa su StableDiffusionLitigation.com e se ritieni che il tuo lavoro sia stato utilizzato per addestrare questi generatori, potresti avere motivi per unirti all'azione collettiva contattando il team legale. Avere richiesto la registrazione della tua arte presso l'US Copyright Office è un primo passo importante se vuoi percorrere questa strada.

Come altre pratiche che hanno attratto gli avvocati in passato - pirateria, jailbreak, condivisione di file - è improbabile che una causa possa fermare del tutto la pratica. La difesa probabilmente sosterrà che questi strumenti sono stati addestrati su materiale "fair use" raccolto da siti web pubblici. Dovremo aspettare e vedere per scoprire quali effetti avranno azioni legali come queste se ce ne saranno.

Filigrana aggressiva

Se carichi la tua opera d'arte solo con qualche filigrana autodistruttiva aggressiva o borderline presente, la grafica inclusa nei set di dati rifletterà questo. In definitiva, questo dipende in gran parte dal motivo per cui la tua opera d'arte viene caricata in primo luogo. Se stai creando opere d'arte non commerciali per il divertimento di Internet, questo sembra in definitiva controproducente.

Una ridicola filigrana How-To Geek
Tim Brookes / How-To Geek

Tuttavia, se vendi dipinti del mondo reale e desideri un mezzo per esporli online prima della vendita, potrebbe essere di aiuto. Certamente sminuirà l'opera d'arte finita, quindi è qualcosa che dovrai considerare da solo.

Non caricare la tua arte su Internet

Questo potrebbe sembrare ridicolo (e lo è) ma se la tua opera d'arte non viene mai caricata su Internet, non c'è alcuna possibilità che venga catturata nella rete e utilizzata per addestrare l'IA. Ovviamente, guadagnarsi da vivere come artista senza utilizzare Internet per condividere le tue opere d'arte potrebbe essere quasi impossibile (soprattutto se lavori su un supporto digitale).

Per gli artisti che lavorano sulla musica, questo è impossibile. Anche se lavori con materiali tradizionali come l'olio o l'acquerello, non si sa se qualcuno scatterà una foto di un pezzo finito e lo caricherà da solo.

L'arte AI può essere protetta da copyright?

La questione se l'output dell'IA generativa possa essere protetto da copyright è complessa. Una cosa generalmente accettata è che lo strumento di intelligenza artificiale utilizzato per generare l'arte raramente ha diritti sull'output.

Questo è chiaramente indicato nei termini di servizio della maggior parte degli strumenti, inclusa Stable Diffusion:

Ad eccezione di quanto stabilito nel presente documento, il Licenziante non rivendica alcun diritto sull'output generato dall'utente utilizzando il modello. Sei responsabile dell'output che generi e dei suoi successivi utilizzi. Nessun utilizzo dell'output può contravvenire a qualsiasi disposizione indicata nella Licenza.

La licenza prosegue vietando qualsiasi uso che "violi qualsiasi legge o regolamento nazionale, federale, statale, locale o internazionale applicabile" che includerebbe la legge sul copyright.

A metà viaggio:

Tu possiedi tutti i Beni che crei con i Servizi, nella misura possibile ai sensi della legge vigente. Ciò esclude l'upscaling delle immagini di altri, le cui immagini rimangono di proprietà dei creatori originali dell'asset.

E OpenAI (DALL-E 2):

Come tra le parti e nella misura consentita dalla legge applicabile, tu possiedi tutto l'Input e, soggetto al rispetto dei presenti Termini, OpenAI ti assegna tutti i suoi diritti, titoli e interessi in e verso l'Output.

In termini di copyright di qualsiasi cosa tu abbia creato con uno strumento di questo tipo, l'US Copyright Office ha dichiarato che il copyright si applica solo all'arte creata da esseri umani (insieme ad altri requisiti, come l'originalità):

Nei casi in cui viene rivendicata la paternità non umana, le corti d'appello hanno stabilito che il copyright non protegge le presunte creazioni.

La legge è in continua evoluzione, quindi questo potrebbe essere sfidato con successo in futuro. Vale anche la pena notare che gli elementi di un prodotto finale che non sono il prodotto di un generatore di intelligenza artificiale (come la trama o il dialogo) possono ancora essere protetti da copyright anche se altri elementi (come la grafica o la musica) non lo sono.

I generatori di arte artificiale possono usare la mia arte protetta da copyright?

La domanda non è necessariamente "possono" i generatori di intelligenza artificiale utilizzare la tua arte protetta da copyright, ma "usano" già la tua arte protetta da copyright . La risposta a questa domanda, come molti artisti hanno scoperto, è un clamoroso sì. Sopra abbiamo discusso alcuni metodi per escludere i set di dati e impedire ai crawler di indicizzare i tuoi contenuti, ma queste tecniche dipendono in ultima analisi da chi è al timone rispettando le tue preferenze.

Puoi scoprire se la tua arte è inclusa nei più grandi set di dati pubblici di immagini utilizzando HaveIBeenTrained.com. Carica una delle tue opere d'arte più note o cerca il tuo nome, titolo dell'opera, webcomic o altra creazione e dai un'occhiata. Se vedi la tua opera d'arte apparire sul sito web, la tua arte è inclusa in un set di dati utilizzato da Stable Diffusion e altri.

Questo per non parlare delle altre applicazioni di arte generativa che non rivelano quali set di dati sono in uso (come DALL-E di OpenAI). Puoi sempre provare un suggerimento come "grafica nello stile del tuo nome" per vedere se si presenta qualcosa di familiare.

Gli strumenti imminenti possono aiutare a sconfiggere i generatori artistici AI

Potrebbe esserci qualche speranza per gli artisti che arrivano sotto forma di strumenti che possono rendere più difficile per un'intelligenza artificiale generativa riprodurre opere d'arte basate su immagini in un set di dati. Sfortunatamente, queste soluzioni non sono ancora disponibili (al momento in cui scrivo) e non si sa quanto saranno efficaci a lungo termine. Gli strumenti di intelligenza artificiale si evolvono rapidamente, quindi è possibile che possano evolversi per aggirare tali protezioni.

Il primo è Glaze, un progetto dell'Università di Chicago che "aggiunge modifiche molto piccole" alle opere d'arte prima di essere caricate. Gli sviluppatori si riferiscono a questi cambiamenti come a un "mantello di stile" e osservano che l'opera d'arte appare, all'occhio umano, quasi identica all'originale, mentre induce l'IA a interpretare erroneamente lo stile come quello di un altro.

Glaze Project per l'occultamento delle immagini
Progetto Glaze / Università di Chicago

Glaze verrà rilasciato come applicazione per Mac e Windows, in modo che le opere d'arte possano essere "occultate" senza mai lasciare il computer dell'artista. Gli sviluppatori affermano che non commercializzeranno lo strumento, quindi sarà gratuito per chiunque. Il progetto Glaze considera lo strumento come "un primo passo necessario verso strumenti di protezione incentrati sull'artista per resistere al mimetismo dell'IA".

Un'altra tecnica, come delineato nel blog Pursuit dell'Università di Melbourne, descrive l'uso sottile del rumore che "cambia i pixel in un'immagine appena sufficienti per confondere l'IA e trasformarla in un'immagine 'impreparabile'". L'istituzione afferma di aver escogitato una tecnica che sfrutta una debolezza nei modelli e si spinge fino a descrivere strumenti come Stable Diffusion come "studenti pigri".

Questa tecnica ha una vasta gamma di potenziali usi, tra cui opere d'arte visive ma anche audio e fotografie che ti identificano personalmente. È importante riconoscere che queste tecniche sono ancora agli inizi in termini di sviluppo, quindi dovremo aspettare e vedere di cosa sono veramente capaci.

L'ascesa dei robot

Le app di arte generativa possono creare opere d'arte in un batter d'occhio, ma non sono veramente creative come lo sono gli esseri umani. ChatGPT potrebbe essere in grado di scrivere il tuo curriculum, ma dovrai correggerlo attentamente perché il chatbot spesso sbaglia con sicurezza.

La linea di fondo è che le attuali soluzioni AI possono essere utili ma sono anche deboli.