Cum să vă protejați imaginile de generatoarele de artă AI
Publicat: 2023-03-24- Renunțați la seturile de date de instruire cu un instrument precum HaveIBeenTrained.com.
- Utilizați un fișier „robots.txt” pentru a evita crawlerele web, dintre care multe sunt folosite pentru a crea seturi de date în primul rând.
- Drepturi de autor asupra operei dvs. de artă și contestați dezvoltatorii acestor instrumente în instanță (sau participați la procesele de acțiune colectivă existente).
- Încărcați numai imagini cu filigran agresiv.
- Evitați să vă puneți arta pe internet în primul rând.
S-ar putea ca generatorii de artă AI să nu reușească să demonstreze creativitatea umană, dar cu siguranță te pot înșela. Aceasta este o îngrijorare atât pentru artiști, cât și pentru cei care se tem de preluarea AI, dar este posibil să nu fie totul pierdut.
Cum să protejați arta protejată prin drepturi de autor de AI
Generatorii de artă AI nu sunt nimic fără seturile de date pe care au fost instruiți. Aceasta implică luarea unui eșantion uriaș de lucrări de artă existente și contextualizarea acesteia într-un mod care să permită oamenilor să folosească indicații din limbaj natural pentru a crea lucrări de artă similare. Puteți încerca singuri folosind o aplicație de artă generativă precum DALL-E 2 sau Midjourney de la OpenAI.
Am cerut lui DALL-E 2 să producă „o poză cu Elmo din Sesame Street în stilul lui Pablo Picasso” și iată ce am primit (da, acesta a fost cel mai bun din grup):
A putea crea opere de artă în stilul artiștilor morți ar putea să nu trezească prea multe clopote de alarmă, în special într-un stil care este atât de recunoscut. Dar pentru artiștii moderni care își împărtășesc creațiile prin ArtStation, DeviantArt, Behance, site-uri web personale și pagini de rețele sociale precum Instagram sau Facebook, este mult mai îngrijorător.
Deci, ce poți face pentru a-ți proteja propriile creații de a fi folosite pentru a antrena un AI care poate scuipa creații mult mai repede decât poți tu?
Renunțați la seturile de date de instruire
Puteți alege să renunțați la două dintre cele mai mari seturi de date de antrenament cu imagini deschise de pe internet, LAION-400M și LAION-5B, folosind HaveIBeenTrained.com. Aceste seturi de date sunt folosite de unii dintre cei mai mari generatori de imagini de pe web, inclusiv Stable Diffusion și Google Imagen. Deoarece sunt cu adevărat deschise, multe alte instrumente AI generative le folosesc și.
Din păcate, procesul de a face acest lucru este lent și plictisitor. Va trebui mai întâi să vă creați un cont și apoi să căutați sau să încărcați o imagine pentru a găsi potriviri în setul de date. Puteți apoi să faceți clic dreapta pe imagine în browser-ul dvs. de pe desktop și să alegeți opțiunea „Adăugați la renunțările mele”. Alternativ, puteți acorda setului de date permisiunea explicită de a utiliza o imagine făcând clic pe „Adăugați la Opt-Ins-urile mele”.
Va trebui să faceți acest lucru pentru fiecare imagine pe care o găsiți, așa că poate fi un proces minuțios dacă sunteți un artist cu o mulțime de lucrări. Cât timp va dura, în mod realist, depinde în cele din urmă de cât de ușor este să vă filtrați munca, ceea ce ar putea fi mai ușor dacă aveți o muncă asociată cu un nume sau un proiect unic, o mare urmărire online și așa mai departe.
Deși aceste două seturi de date masive sunt un loc minunat pentru a începe, ele sunt departe de a fi singurele care sunt utilizate. Persoanele fizice își pot crea propriile seturi de date, iar unii fac pentru a reproduce un anumit artist sau stil de artă. Unele companii precum OpenAI nu dezvăluie deloc ce seturi de date folosesc instrumentele lor, așa că nu există nicio modalitate de a le combate.
Utilizați Robots.txt pentru a evita crawlerele
Un fișier robots.txt este un mic document text care este plasat în directorul rădăcină al unui site web pentru a le spune crawlerilor web unde au sau nu li se permite să meargă. Deși Google afirmă în mod explicit că „nu este un mecanism pentru a menține o pagină web în afara Google”, poate doriți totuși să încercați și să o utilizați pentru a ține crawlerele web departe de opera dvs. de artă dacă o găzduiți pe propriul site web.
După cum sugerează și numele, crawlerele web accesează cu crawlere web în căutarea conținutului pentru indexare. Motoarele de căutare sunt departe de singurele crawler-uri, iar crawlerele sunt, de asemenea, folosite pentru a crea seturi de date, la fel ca seturile de date LAION-400M și LAION-5B menționate mai sus. Principala problemă cu robots.txt este că se bazează pe crawler-ul web care vă respectă solicitarea.
Unul dintre cele mai mari seturi de date din jur este Common Crawl, datele din care au fost folosite pentru a construi seturile de date LAION. Procesul de accesare cu crawlere a web-ului este unul continuu, LAION afirmând că setul de date LAION-400M actual (la momentul scrierii acestui articol) a fost creat „din pagini web aleatorii accesate cu crawlere între 2014 și 2021”.
Common Crawl afirmă că respectă robots.txt și Robots Exclusion Protocol atât în ceea ce privește blocarea conținutului, cât și întârzierea accesării cu crawlere (pentru a economisi lățime de bandă). Puteți face acest lucru creând o regulă pentru agentul utilizator „CCBot” în fișierul dvs. Robots.txt. Desigur, nimic din toate acestea nu vă va ajuta dacă nu vă autogăzduiți opera de artă.
Google Search Central are un ghid la îndemână pentru crearea unui fișier robots.txt sau puteți utiliza un site web precum Generatorul Robots.txt de la Ryte pentru a crea unul pentru dvs. Puteți permite sau dezactiva agenți de utilizator anumiți din anumite directoare sau pur și simplu blocați totul cu un wildcard (*). De exemplu, un fișier robots.txt care blochează toate fișierele din directorul dvs. /images/ din Common Crawl, permițând totuși altor crawler-uri să indexeze site-ul dvs. web ar citi:
Agent utilizator: CCbot Nu permiteți: /imagini/ Agent utilizator: * Permite: / Harta site-ului: https://www.example.com/sitemap.xml
Acest lucru nu va învinge crawlerele care v-au vizitat deja site-ul web, dar ar trebui să împiedice Common Crawl să vă indexeze folderul /images/ (și orice încărcări noi de la ultima accesare cu crawlere) în viitor.
Drepturi de autor pentru lucrarea dvs. de artă
Deși drepturile de autor sunt implicate în munca pe care ați creat-o, de asemenea, poate merita efortul să vă depășiți dreptul de autor pentru munca dvs. În SUA, puteți face acest lucru înregistrându-vă lucrările la Copyright.gov. Puteți depune până la 10 lucrări nepublicate într-o singură cerere, trebuie doar să știți că poate dura ceva timp (în prezent aproximativ un an) până când lucrările dvs. sunt procesate.
Înregistrarea drepturilor de autor asupra lucrării dvs. vă oferă mai mult un picior de sprijin în problemele care implică instanțe. Aceasta este ideea din spatele unui proces colectiv intentat împotriva Stability AI (dezvoltatorul Stable Diffusion și DreamStudio, finanțator al LAION), DeviantArt (o platformă pentru artiști și dezvoltator DreamUp) și Midjourney, o aplicație de artă generativă în numele artiștilor afectați. .
Puteți citi totul despre proces la StableDiffusionLitigation.com și, dacă credeți că munca dvs. a fost folosită pentru a instrui acești generatori, este posibil să aveți motive să vă alăturați acțiunii colective, contactând echipa juridică. A fi aplicat pentru înregistrarea artei dvs. la Oficiul pentru Drepturi de Autor din SUA este un prim pas important dacă doriți să urmați această cale.
La fel ca și alte practici care au atras avocații în trecut – piraterie, jailbreaking, partajare de fișiere – este puțin probabil ca un proces să oprească complet practica. Apărarea va argumenta probabil că aceste instrumente au fost instruite pe materiale de „utilizare corectă” adunate de pe site-uri web destinate publicului. Va trebui să așteptăm și să vedem pentru a afla ce efect vor avea procese ca acestea, dacă există.
Watermarking agresiv
Dacă încărcați opera de artă doar cu un filigran agresiv sau autodistructiv, opera de artă inclusă în seturile de date va reflecta acest lucru. În cele din urmă, acest lucru depinde în mare măsură de motivul pentru care lucrarea dvs. de artă este încărcată în primul rând. Dacă creați opere de artă necomercial pentru a vă bucura de internet, acest lucru pare în cele din urmă auto-înfrângător.
Cu toate acestea, dacă vindeți picturi din lumea reală și doriți un mijloc de a le expune online înainte de vânzare, poate ajuta oarecum. Cu siguranță va scădea de la opera de artă finită, așa că este ceva ce va trebui să luați în considerare pentru dvs.
Nu vă încărcați arta pe Internet
Acest lucru ar putea suna ridicol (și este), dar dacă opera ta de artă nu este încărcată niciodată pe internet, nu există nicio șansă să fie prinsă în net și folosită pentru a antrena AI. Desigur, a-ți câștiga existența ca artist fără a folosi internetul pentru a-ți partaja opera de artă ar putea fi aproape imposibil (mai ales dacă lucrezi pe un mediu digital).
Pentru artiștii care lucrează la muzică, aceasta este o imposibilitate. Chiar dacă lucrați cu materiale tradiționale, cum ar fi uleiul sau acuarela, nu se știe dacă cineva va face o poză a unei piese finite și o va încărca el însuși.
Arta AI poate fi protejată prin drepturi de autor?
Întrebarea dacă producția AI generativă poate fi protejată prin drepturi de autor este una complexă. Un lucru care este în general acceptat este că instrumentul AI utilizat pentru a genera arta are rareori drepturi asupra rezultatului.
Acest lucru este precizat clar în termenii și condițiile majorității instrumentelor, inclusiv Stable Diffusion:
Cu excepția celor menționate aici, Licențiatorul nu pretinde niciun drept asupra Ieșirii pe care le generați folosind Modelul. Sunteți responsabil pentru ieșirea pe care o generați și pentru utilizările ulterioare ale acesteia. Nicio utilizare a ieșirii nu poate încălca nicio prevedere, așa cum este menționată în licență.
Licența continuă să interzică orice utilizare care „încalcă orice lege sau reglementare națională, federală, statală, locală sau internațională aplicabilă”, care ar include legea drepturilor de autor.
Mijlocul călătoriei:
Dețineți toate Activele pe care le creați cu Serviciile, în măsura posibilului în conformitate cu legislația în vigoare. Acest lucru exclude extinderea imaginilor altora, imagini care rămân deținute de creatorii inițiali de materiale.
Și OpenAI (DALL-E 2):
Între părți și în măsura permisă de legea aplicabilă, dețineți toate Intrările și, sub rezerva respectării de către dvs. a acești Termeni, OpenAI vă cesionează prin prezenta toate drepturile, titlurile și interesul său asupra și către Ieșire.
În ceea ce privește drepturile de autor pentru orice ați creat cu un astfel de instrument, Oficiul pentru Drepturi de Autor din SUA a declarat că drepturile de autor se aplică numai artei create de oameni (împreună cu alte cerințe, cum ar fi originalitatea):
În cazurile în care se revendică calitatea de autor non-umană, instanțele de apel au constatat că dreptul de autor nu protejează presupusele creații.
Legea este în continuă evoluție, așa că acest lucru poate fi contestat cu succes în viitor. De asemenea, merită remarcat faptul că elementele unui produs final care nu sunt produsul unui generator AI (cum ar fi intriga sau dialogul) pot fi încă protejate prin drepturi de autor, chiar dacă alte elemente (cum ar fi opera de artă sau muzica) nu sunt.
Pot generatorii de artă AI să folosească arta mea protejată prin drepturi de autor?
Întrebarea nu este neapărat „pot” generatorii AI să vă folosească arta protejată prin drepturi de autor, dar „îți folosesc” deja arta protejată prin drepturi de autor. Răspunsul la această întrebare, după cum au aflat mulți artiști, este un da răsunător. Mai sus am discutat câteva metode de a renunța la seturile de date și de a împiedica crawler-urile să indexeze conținutul dvs., dar aceste tehnici depind în cele din urmă de respectarea preferințelor dvs.
Puteți afla dacă arta dvs. este inclusă în cele mai mari seturi de date publice de imagini folosind HaveIBeenTrained.com. Încărcați una dintre lucrările dvs. de artă mai cunoscute sau căutați numele, titlul operei de artă, comicul web sau altă creație și aruncați o privire. Dacă vedeți că opera dvs. de artă apare pe site, arta dvs. este inclusă într-un set de date utilizat de Stable Diffusion și alții.
Asta pentru a nu spune nimic despre celelalte aplicații de artă generativă care nu dezvăluie ce seturi de date sunt utilizate (cum ar fi DALL-E de la OpenAI). Puteți încerca oricând o solicitare precum „opera de artă în stilul numelui tău” pentru a vedea dacă apare ceva familiar.
Instrumentele viitoare pot ajuta la învingerea generatoarelor de artă AI
S-ar putea să existe o oarecare speranță pentru artiști care vin sub formă de instrumente care pot îngreuna pentru o IA generativă reproducerea operelor de artă bazate pe imagini dintr-un set de date. Din păcate, aceste soluții nu sunt încă aici (la momentul scrierii) și nu se știe cât de eficiente vor fi pe termen lung. Instrumentele AI evoluează rapid, așa că este posibil ca acestea să evolueze pentru a evita astfel de garanții.
Primul este Glaze, un proiect de la Universitatea din Chicago care „adaugă modificări foarte mici” lucrărilor de artă înainte de a fi încărcat. Dezvoltatorii se referă la aceste schimbări drept o „pelerina de stil” și notează că opera de artă pare - pentru ochiul uman - aproape identică cu originalul, determinând, în același timp, AI să interpreteze greșit stilul ca pe cel al altuia.
Glaze va fi lansat ca o aplicație pentru Mac și Windows, astfel încât lucrările de artă pot fi „ascunde” fără a părăsi computerul artistului. Dezvoltatorii spun că nu vor comercializa instrumentul, așa că va fi folosit gratuit pentru oricine. Proiectul Glaze consideră instrumentul ca „un prim pas necesar către instrumente de protecție centrate pe artist pentru a rezista mimetării AI”.
O altă tehnică, așa cum este subliniată în blogul Pursuit al Universității din Melbourne, descrie utilizarea subtilă a zgomotului care „schimbă suficienți pixeli dintr-o imagine pentru a deruta AI și a o transforma într-o imagine „de neînvățat””. Instituția susține că a venit cu o tehnică care exploatează o slăbiciune a modelelor și merge până la a descrie instrumente precum Stable Diffusion drept „învățători leneși”.
Această tehnică are o gamă largă de utilizări potențiale, inclusiv lucrări de artă vizuală, dar și audio și fotografii care vă identifică personal. Este important să recunoaștem că aceste tehnici sunt încă timpurii în ceea ce privește dezvoltarea, așa că va trebui să așteptăm și să vedem de ce sunt cu adevărat capabili.
Rise of the Robots
Aplicațiile de artă generativă pot crea opere de artă în cel mai scurt timp, dar nu sunt cu adevărat creative în același mod în care sunt oamenii. ChatGPT poate să vă scrie CV-ul, dar va trebui să-l corectați cu atenție, deoarece chatbot-ul greșește adesea cu încredere.
Concluzia este că soluțiile actuale de AI pot fi utile, dar sunt și slabe.