Jak chronić swoje obrazy przed generatorami grafiki AI
Opublikowany: 2023-03-24- Zrezygnuj z treningowych zestawów danych za pomocą narzędzia takiego jak HaveIBeenTrained.com.
- Użyj pliku „robots.txt”, aby odeprzeć roboty indeksujące, z których wiele jest używanych przede wszystkim do tworzenia zbiorów danych.
- Korzystaj z praw autorskich do swoich dzieł sztuki i walcz z twórcami tych narzędzi w sądzie (lub dołączaj do istniejących pozwów zbiorowych).
- Przesyłaj tylko agresywne obrazy ze znakami wodnymi.
- Przede wszystkim unikaj umieszczania swojej sztuki w Internecie.
Generatory grafiki AI mogą nie być w stanie naśladować ludzkiej kreatywności, ale z pewnością mogą cię oskubać. Jest to zmartwienie zarówno dla artystów, jak i tych, którzy boją się przejęcia sztucznej inteligencji, ale nie wszystko może być stracone.
Jak chronić sztukę chronioną prawem autorskim przed sztuczną inteligencją
Generatory grafiki AI są niczym bez zestawów danych, na których zostały przeszkolone. Wiąże się to z pobraniem ogromnej próbki istniejących dzieł sztuki i kontekstualizacją ich w sposób, który pozwala ludziom używać wskazówek języka naturalnego do tworzenia podobnych dzieł sztuki. Możesz spróbować samemu, korzystając z aplikacji do tworzenia grafiki generatywnej, takiej jak DALL-E 2 lub Midjourney firmy OpenAI.
Poprosiliśmy DALL-E 2 o wyprodukowanie „zdjęcia Elma z Ulicy Sezamkowej w stylu Pabla Picassa” i oto, co otrzymaliśmy (tak, to było najlepsze z całej gamy):
Możliwość tworzenia dzieł sztuki w stylu zmarłych artystów może nie budzić zbyt wielu dzwonków alarmowych, szczególnie w stylu, który jest tak rozpoznawalny. Ale dla współczesnych artystów, którzy dzielą się swoimi dziełami za pośrednictwem ArtStation, DeviantArt, Behance, osobistych stron internetowych i stron mediów społecznościowych, takich jak Instagram czy Facebook, jest to o wiele bardziej niepokojące.
Co więc możesz zrobić, aby chronić własne kreacje przed wykorzystaniem do szkolenia sztucznej inteligencji, która może wypluwać kreacje znacznie szybciej niż ty?
Zrezygnuj z treningowych zestawów danych
Możesz zrezygnować z dwóch największych otwartych zestawów danych szkoleniowych w Internecie, LAION-400M i LAION-5B, korzystając z witryny HaveIBeenTrained.com. Te zestawy danych są używane przez jedne z największych generatorów obrazów w sieci, w tym Stable Diffusion i Google Imagen. Ponieważ są one naprawdę otwarte, korzysta z nich również wiele innych generatywnych narzędzi sztucznej inteligencji.
Niestety proces ten jest powolny i żmudny. Najpierw musisz założyć konto, a następnie wyszukać lub przesłać obraz, aby znaleźć dopasowania w zbiorze danych. Następnie możesz kliknąć obraz prawym przyciskiem myszy w przeglądarce internetowej na komputerze i wybrać opcję „Dodaj do moich rezygnacji”. Alternatywnie możesz udzielić zbiorowi danych wyraźnego pozwolenia na użycie obrazu, klikając zamiast tego „Dodaj do moich opcji”.
Musisz to zrobić dla każdego znalezionego obrazu, więc może to być żmudny proces, jeśli jesteś artystą z dużym dorobkiem. To, jak długo to realistycznie zajmie, ostatecznie zależy od tego, jak łatwo jest odfiltrować twoją pracę, co może być łatwiejsze, jeśli masz pracę powiązaną z unikalną nazwą lub projektem, dużą liczbą obserwujących online i tak dalej.
Chociaż te dwa ogromne zestawy danych są doskonałym miejscem do rozpoczęcia, nie są one jedynymi, które są używane. Poszczególne osoby mogą tworzyć własne zestawy danych, a niektóre robią to w celu powielenia określonego artysty lub stylu sztuki. Niektóre firmy, takie jak OpenAI, w ogóle nie ujawniają, z jakich zestawów danych korzystają ich narzędzia, więc nie ma sposobu, aby z nimi walczyć.
Użyj pliku Robots.txt, aby odeprzeć roboty
Plik robots.txt to mały dokument tekstowy, który jest umieszczany w katalogu głównym witryny internetowej, aby informować roboty indeksujące, gdzie mogą lub nie mogą iść. Chociaż Google wyraźnie stwierdza, że „nie jest to mechanizm do utrzymywania strony internetowej z dala od Google”, nadal możesz chcieć go użyć do powstrzymania robotów indeksujących z dala od Twojej grafiki, jeśli hostujesz ją we własnej witrynie.
Jak sama nazwa może sugerować, roboty indeksujące przeszukują sieć w poszukiwaniu treści do indeksowania. Wyszukiwarki nie są jedynymi robotami indeksującymi, a roboty indeksujące są również używane do tworzenia zbiorów danych, podobnie jak wspomniane wyżej zestawy danych LAION-400M i LAION-5B. Główny problem z plikiem robots.txt polega na tym, że polega on na respektowaniu Twojej prośby przez robota sieciowego.
Jednym z największych dostępnych zbiorów danych jest Common Crawl, z którego dane zostały wykorzystane do skonstruowania zbiorów danych LAION. Proces indeksowania sieci trwa, a LAION twierdzi, że aktualny (w chwili pisania tego tekstu) zestaw danych LAION-400M został utworzony „z losowych stron internetowych przeszukanych w latach 2014-2021”.
Common Crawl twierdzi, że przestrzega pliku robots.txt i protokołu Robots Exclusion Protocol zarówno pod względem blokowania treści, jak i opóźniania indeksowania (aby zaoszczędzić na przepustowości). Możesz to zrobić, tworząc regułę dla agenta użytkownika „CCBot” w pliku Robots.txt. Oczywiście nic z tego nie pomoże, jeśli nie hostujesz swoich dzieł sztuki.
Google Search Central zawiera przydatny przewodnik tworzenia pliku robots.txt. Możesz też skorzystać z witryny internetowej, takiej jak Generator Robots.txt firmy Ryte, aby go utworzyć. Możesz zezwolić lub wyłączyć określone programy użytkownika z określonych katalogów lub po prostu zablokować wszystko za pomocą symbolu wieloznacznego (*). Na przykład plik robots.txt, który blokuje wszystkie pliki w Twoim katalogu /images/ przed Common Crawl, jednocześnie umożliwiając innym robotom indeksowanie Twojej witryny, powinien brzmieć następująco:
Klient użytkownika: CCbot Nie zezwalaj: /obrazy/ Agent użytkownika: * Umożliwić: / Mapa witryny: https://www.example.com/sitemap.xml
Nie pokona to robotów indeksujących, które już odwiedziły Twoją witrynę, ale powinno uniemożliwić Common Crawl indeksowanie Twojego folderu /images/ (i wszelkich nowych plików przesłanych od ostatniego indeksowania) w przyszłości.
Prawa autorskie do Twojej grafiki
Chociaż prawa autorskie są implikowane w tworzonych przez Ciebie pracach, zrobienie wszystkiego, co w Twojej mocy, aby uzyskać prawa autorskie do swojej pracy, może być również warte wysiłku. W Stanach Zjednoczonych możesz to zrobić, rejestrując swoje prace na stronie Copyright.gov. W jednym zgłoszeniu możesz zgłosić do 10 niepublikowanych prac, pamiętaj tylko, że przetworzenie Twoich prac może zająć trochę czasu (obecnie około roku).
Zarejestrowanie praw autorskich do Twojej pracy daje Ci większą przewagę w sprawach, które dotyczą sądów. Taka jest idea pozwu zbiorowego wniesionego przeciwko Stability AI (twórcy Stable Diffusion i DreamStudio, fundatorowi LAION), DeviantArt (platforma dla artystów i twórca DreamUp) oraz Midjourney, aplikacji do generatywnej grafiki w imieniu poszkodowanych artystów .
Możesz przeczytać wszystko o pozwie na StableDiffusionLitigation.com, a jeśli uważasz, że twoja praca została wykorzystana do szkolenia tych generatorów, możesz mieć podstawy do przyłączenia się do pozwu zbiorowego, kontaktując się z zespołem prawnym. Złożenie wniosku o zarejestrowanie dzieła sztuki w Urzędzie ds. Praw Autorskich Stanów Zjednoczonych jest ważnym pierwszym krokiem, jeśli chcesz pójść tą drogą.
Podobnie jak inne praktyki, które przyciągały prawników w przeszłości – piractwo, włamywanie się do więzienia, udostępnianie plików – jest mało prawdopodobne, aby pozew całkowicie zaprzestał tej praktyki. Obrona prawdopodobnie będzie argumentować, że narzędzia te zostały przeszkolone na materiałach „dozwolonego użytku” zebranych z publicznych stron internetowych. Będziemy musieli poczekać i zobaczyć, aby dowiedzieć się, jaki wpływ będą miały takie procesy sądowe, jeśli w ogóle.
Agresywne znaki wodne
Jeśli kiedykolwiek prześlesz swoje dzieło sztuki z jakimś agresywnym lub graniczącym z autodestrukcją znakiem wodnym, grafika zawarta w zbiorach danych będzie to odzwierciedlać. Ostatecznie zależy to w dużej mierze od tego, dlaczego Twoja grafika jest przesyłana w pierwszej kolejności. Jeśli tworzysz dzieła sztuki niekomercyjnie dla przyjemności korzystania z Internetu, wydaje się to ostatecznie samobójcze.
Jeśli jednak sprzedajesz obrazy z prawdziwego świata i chcesz wystawić je online przed sprzedażą, może to nieco pomóc. Z pewnością odciągnie to uwagę od gotowej grafiki, więc jest to coś, co musisz sam rozważyć.
Nie przesyłaj swojej sztuki do Internetu
Może to zabrzmieć śmiesznie (i tak jest), ale jeśli Twoja grafika nigdy nie zostanie przesłana do Internetu, nie ma szans, że zostanie złapana w sieci i wykorzystana do szkolenia sztucznej inteligencji. Oczywiście zarabianie na życie jako artysta bez korzystania z Internetu do udostępniania dzieł sztuki może być prawie niemożliwe (zwłaszcza jeśli pracujesz w środowisku cyfrowym).
Dla artystów zajmujących się muzyką jest to niemożliwe. Nawet jeśli pracujesz z tradycyjnymi materiałami, takimi jak olej czy akwarela, nie wiadomo, czy ktoś zrobi zdjęcie gotowego dzieła i sam je prześle.
Czy sztuka AI może być chroniona prawem autorskim?
Kwestia, czy dane wyjściowe generatywnej sztucznej inteligencji mogą być objęte prawami autorskimi, jest złożona. Jedną z ogólnie akceptowanych rzeczy jest to, że narzędzie sztucznej inteligencji używane do generowania grafiki rzadko ma jakiekolwiek prawa do danych wyjściowych.
Jest to wyraźnie określone w warunkach korzystania z większości narzędzi, w tym Stable Diffusion:
Z wyjątkiem przypadków określonych w niniejszym dokumencie Licencjodawca nie rości sobie żadnych praw do Wytworów generowanych przez Użytkownika przy użyciu Modelu. Ponosisz odpowiedzialność za generowane przez siebie dane wyjściowe i ich późniejsze wykorzystanie. Żadne wykorzystanie wyników nie może być sprzeczne z żadnymi postanowieniami Licencji.
Licencja zabrania jakiegokolwiek użytkowania, które „narusza wszelkie obowiązujące krajowe, federalne, stanowe, lokalne lub międzynarodowe przepisy lub regulacje”, w tym prawa autorskie.
W połowie podróży:
Jesteś właścicielem wszystkich Zasobów, które tworzysz za pomocą Usług, w zakresie, w jakim jest to możliwe zgodnie z obowiązującym prawem. Wyklucza to skalowanie w górę obrazów innych osób, które to obrazy pozostają własnością oryginalnych twórców Zasobów.
I OpenAI (DALL-E 2):
Pomiędzy stronami i w zakresie dozwolonym przez obowiązujące prawo jesteś właścicielem wszystkich danych wejściowych i z zastrzeżeniem przestrzegania przez Ciebie niniejszych Warunków, OpenAI niniejszym przenosi na ciebie wszystkie swoje prawa, tytuły i udziały w danych wyjściowych.
Jeśli chodzi o prawa autorskie do wszystkiego, co stworzyłeś za pomocą takiego narzędzia, Urząd ds. Praw Autorskich Stanów Zjednoczonych stwierdził, że prawa autorskie dotyczą tylko dzieł sztuki stworzonych przez ludzi (wraz z innymi wymaganiami, takimi jak oryginalność):
W przypadkach, w których twierdzi się, że autorstwo nie pochodzi od człowieka, sądy apelacyjne stwierdziły, że prawo autorskie nie chroni domniemanych dzieł.
Prawo stale ewoluuje, więc w przyszłości może to być skutecznie kwestionowane. Warto również zauważyć, że elementy produktu końcowego, które nie są produktem generatora sztucznej inteligencji (takie jak fabuła lub dialogi), nadal mogą być objęte prawami autorskimi, nawet jeśli inne elementy (takie jak grafika lub muzyka) nie są.
Czy generatory grafiki AI mogą korzystać z moich dzieł chronionych prawem autorskim?
Pytanie niekoniecznie brzmi: „czy” generatory sztucznej inteligencji mogą korzystać z twoich dzieł chronionych prawem autorskim, ale „czy” już korzystają z twoich dzieł chronionych prawem autorskim. Odpowiedź na to pytanie, jak przekonało się wielu artystów, brzmi zdecydowanie tak. Powyżej omówiliśmy niektóre metody rezygnacji ze zbiorów danych i uniemożliwienia robotom indeksującym indeksowanie treści, ale te techniki ostatecznie zależą od tego, kto stoi u steru, szanując Twoje preferencje.
Możesz dowiedzieć się, czy Twoja grafika znajduje się w największych publicznych zbiorach danych obrazów, korzystając z HaveIBeenTrained.com. Prześlij jedno ze swoich bardziej znanych dzieł sztuki lub wyszukaj swoje imię i nazwisko, tytuł dzieła, komiks internetowy lub inne dzieło i obejrzyj je. Jeśli widzisz, że Twoja grafika pojawia się w witrynie, oznacza to, że znajduje się ona w zbiorze danych używanym przez firmę Stable Diffusion i inne podmioty.
Nie mówiąc już o innych aplikacjach generatywnych, które nie ujawniają używanych zestawów danych (jak DALL-E OpenAI). Zawsze możesz wypróbować monit typu „grafika w stylu Twojego imienia”, aby zobaczyć, czy pojawi się coś znajomego.
Nadchodzące narzędzia mogą pomóc pokonać generatory grafiki AI
Artyści mogą mieć nadzieję na pojawienie się narzędzi, które mogą utrudnić generatywnej sztucznej inteligencji reprodukcję dzieł sztuki na podstawie obrazów w zbiorze danych. Niestety, tych rozwiązań jeszcze nie ma (w chwili pisania tego tekstu) i nie wiadomo, jak skuteczne będą w dłuższej perspektywie. Narzędzia sztucznej inteligencji szybko ewoluują, więc możliwe, że będą ewoluować w celu obejścia takich zabezpieczeń.
Pierwszym z nich jest Glaze, projekt z University of Chicago, który „dodaje bardzo małe zmiany” do grafiki przed jej przesłaniem. Twórcy nazywają te zmiany „płaszczem stylu” i zauważają, że grafika wydaje się – dla ludzkiego oka – prawie identyczna z oryginałem, podczas gdy sztuczna inteligencja błędnie interpretuje styl jako inny.
Glaze zostanie wydany jako aplikacja dla komputerów Mac i Windows, dzięki czemu można „zamaskować” grafikę bez opuszczania komputera artysty. Deweloperzy twierdzą, że nie będą komercjalizować narzędzia, więc będzie ono bezpłatne dla każdego. Projekt Glaze postrzega to narzędzie jako „niezbędny pierwszy krok w kierunku narzędzi ochrony skoncentrowanych na artystach, aby oprzeć się naśladowaniu sztucznej inteligencji”.
Inna technika opisana na blogu Pursuit University of Melbourne opisuje subtelne wykorzystanie szumu, który „zmienia tyle pikseli na obrazie, aby zmylić sztuczną inteligencję i przekształcić go w„ niemożliwy do nauczenia ”obraz”. Instytucja twierdzi, że wymyśliła technikę, która wykorzystuje słabość modeli i posuwa się nawet do opisywania narzędzi takich jak Stable Diffusion jako „leniwych uczniów”.
Technika ta ma szeroki zakres potencjalnych zastosowań, w tym dzieła sztuki wizualnej, ale także dźwięk i zdjęcia, które umożliwiają identyfikację użytkownika. Ważne jest, aby zdać sobie sprawę, że te techniki są wciąż na wczesnym etapie rozwoju, więc będziemy musieli poczekać i zobaczyć, do czego naprawdę są zdolne.
Powstanie robotów
Aplikacje do tworzenia grafiki generatywnej mogą w mgnieniu oka tworzyć dzieła sztuki, ale nie są tak naprawdę kreatywne w taki sam sposób, jak ludzie. ChatGPT może być w stanie napisać Twoje CV, ale musisz je dokładnie sprawdzić, ponieważ chatbot często się myli.
Najważniejsze jest to, że obecne rozwiązania AI mogą być przydatne, ale są też słabe.