So schützen Sie Ihre Bilder vor KI-Kunstgeneratoren
Veröffentlicht: 2023-03-24- Deaktivieren Sie Trainingsdatensätze mit einem Tool wie HaveIBeenTrained.com.
- Verwenden Sie eine „robots.txt“-Datei, um Webcrawler abzuwehren, von denen viele in erster Linie zum Erstellen von Datensätzen verwendet werden.
- Machen Sie Ihr Kunstwerk urheberrechtlich geschützt und fordern Sie die Entwickler dieser Tools vor Gericht heraus (oder schließen Sie sich bestehenden Sammelklagen an).
- Laden Sie nur Bilder mit aggressiven Wasserzeichen hoch.
- Vermeide es von vornherein, deine Kunst ins Internet zu stellen.
KI-Kunstgeneratoren sind vielleicht nicht in der Lage, die menschliche Kreativität nachzuahmen, aber sie können Sie sicher über den Tisch ziehen. Dies ist eine Sorge sowohl für Künstler als auch für diejenigen, die die KI-Übernahme fürchten, aber möglicherweise ist nicht alles verloren.
So schützen Sie urheberrechtlich geschützte Kunst vor KI
KI-Kunstgeneratoren sind nichts ohne die Datensätze, auf denen sie trainiert wurden. Dazu gehört, eine riesige Stichprobe vorhandener Kunstwerke zu nehmen und sie so zu kontextualisieren, dass Menschen natürliche Sprachanweisungen verwenden können, um ähnliche Kunstwerke zu erstellen. Sie können es selbst mit einer generativen Kunst-App wie DALL-E 2 oder Midjourney von OpenAI ausprobieren.
Wir haben DALL-E 2 gebeten, „ein Bild von Elmo aus der Sesamstraße im Stil von Pablo Picasso“ zu produzieren, und hier ist, was wir bekommen haben (ja, das war das Beste von allen):
In der Lage zu sein, Kunstwerke im Stil toter Künstler zu schaffen, lässt vielleicht nicht allzu viele Alarmglocken läuten, besonders bei einem Stil, der so erkennbar ist. Aber für moderne Künstler, die ihre Kreationen über ArtStation, DeviantArt, Behance, persönliche Websites und Social-Media-Seiten wie Instagram oder Facebook teilen, ist es weitaus besorgniserregender.
Was können Sie also tun, um Ihre eigenen Kreationen davor zu schützen, dass sie zum Trainieren einer KI verwendet werden, die Kreationen viel schneller ausspucken kann als Sie?
Deaktivieren Sie Trainingsdatensätze
Sie können sich über HaveIBeenTrained.com von zwei der größten offenen Bildtrainingsdatensätze im Internet, LAION-400M und LAION-5B, abmelden. Diese Datensätze werden von einigen der größten Bildgeneratoren im Internet verwendet, darunter Stable Diffusion und Google Imagen. Da sie wirklich offen sind, werden sie auch von vielen anderen generativen KI-Tools verwendet.
Leider ist dieser Vorgang langsam und langwierig. Sie müssen sich zuerst für ein Konto anmelden und dann ein Bild suchen oder hochladen, um Übereinstimmungen im Datensatz zu finden. Sie können dann in Ihrem Desktop-Webbrowser mit der rechten Maustaste auf das Bild klicken und die Option „Zu meinen Opt-Outs hinzufügen“ auswählen. Alternativ können Sie dem Datensatz ausdrücklich die Erlaubnis erteilen, ein Bild zu verwenden, indem Sie stattdessen auf „Zu meinen Opt-Ins hinzufügen“ klicken.
Sie müssen dies für jedes Bild tun, das Sie finden, daher kann es ein mühsamer Prozess sein, wenn Sie ein Künstler mit einem großen Werkbestand sind. Wie lange es realistischerweise dauern wird, hängt letztendlich davon ab, wie einfach es ist, Ihre Arbeit herauszufiltern, was möglicherweise einfacher ist, wenn Sie Arbeit mit einem eindeutigen Namen oder Projekt, einer großen Online-Fangemeinde usw. haben.
Obwohl diese beiden riesigen Datensätze ein guter Ausgangspunkt sind, sind sie bei weitem nicht die einzigen, die verwendet werden. Einzelpersonen können ihre eigenen Datensätze erstellen, und einige tun dies, um einen bestimmten Künstler oder Kunststil zu replizieren. Einige Unternehmen wie OpenAI geben überhaupt nicht bekannt, welche Datensätze ihre Tools verwenden, daher gibt es keine Möglichkeit, diese zu bekämpfen.
Verwenden Sie Robots.txt, um Crawler abzuwehren
Eine robots.txt-Datei ist ein kleines Textdokument, das im Stammverzeichnis einer Website platziert wird, um Webcrawlern mitzuteilen, wohin sie gehen dürfen oder nicht. Obwohl Google ausdrücklich erklärt, dass „es kein Mechanismus ist, um eine Webseite von Google fernzuhalten“, möchten Sie vielleicht trotzdem versuchen, es zu verwenden, um Webcrawler von Ihrem Kunstwerk fernzuhalten, wenn Sie es auf Ihrer eigenen Website hosten.
Wie der Name vermuten lässt, durchsuchen Webcrawler das Web auf der Suche nach Inhalten für die Indexierung. Suchmaschinen sind bei weitem nicht die einzigen Crawler, und Crawler werden auch verwendet, um Datensätze ähnlich wie die oben erwähnten LAION-400M- und LAION-5B-Datensätze zu erstellen. Das Hauptproblem bei robots.txt besteht darin, dass es darauf angewiesen ist, dass der Webcrawler Ihre Anfrage respektiert.
Einer der größten Datensätze überhaupt ist Common Crawl, dessen Daten verwendet wurden, um die Datensätze von LAION zu erstellen. Der Prozess des Crawlens des Webs ist ein fortlaufender Prozess, wobei LAION angibt, dass sein aktueller (zum Zeitpunkt des Schreibens) LAION-400M-Datensatz „aus zufälligen Webseiten erstellt wurde, die zwischen 2014 und 2021 gecrawlt wurden“.
Common Crawl gibt an, dass es robots.txt und das Robots Exclusion Protocol respektiert, sowohl in Bezug auf das Blockieren von Inhalten als auch das Verzögern des Crawlings (um Bandbreite zu sparen). Sie können dies tun, indem Sie in Ihrer Robots.txt-Datei eine Regel für den Benutzeragenten „CCBot“ erstellen. Natürlich hilft nichts davon, wenn Sie Ihr Kunstwerk nicht selbst hosten.
Google Search Central bietet eine praktische Anleitung zum Erstellen einer robots.txt-Datei, oder Sie können eine Website wie den Robots.txt-Generator von Ryte verwenden, um eine für Sie zu erstellen. Sie können bestimmte Benutzeragenten aus bestimmten Verzeichnissen zulassen oder deaktivieren oder einfach alles mit einem Platzhalter (*) blockieren. Zum Beispiel würde eine robots.txt-Datei, die alle Dateien in Ihrem /images/-Verzeichnis für Common Crawl blockiert, während es anderen Crawlern weiterhin erlaubt, Ihre Website zu indizieren, lauten:
Benutzeragent: CCbot Nicht zulassen: /Bilder/ User-Agent: * Erlauben: / Sitemap: https://www.example.com/sitemap.xml
Dadurch werden Crawler, die Ihre Website bereits besucht haben, nicht besiegt, aber es sollte verhindern, dass Common Crawl Ihren /images/-Ordner (und alle neuen Uploads seit dem letzten Crawl) in Zukunft indiziert.
Copyright für Ihr Kunstwerk
Obwohl das Urheberrecht an den von Ihnen erstellten Arbeiten impliziert ist, kann es sich auch lohnen, sich die Mühe zu machen, Ihre Arbeit urheberrechtlich zu schützen. In den USA können Sie dies tun, indem Sie Ihre Werke bei Copyright.gov registrieren. Sie können bis zu 10 unveröffentlichte Arbeiten in einem einzigen Antrag einreichen, beachten Sie jedoch, dass die Bearbeitung Ihrer Arbeiten einige Zeit dauern kann (derzeit etwa ein Jahr).
Wenn Sie das Urheberrecht an Ihrer Arbeit registriert haben, haben Sie mehr Sicherheit in Angelegenheiten, die die Gerichte betreffen. Das ist die Idee hinter einer Sammelklage gegen Stability AI (Entwickler von Stable Diffusion und DreamStudio, Geldgeber von LAION), DeviantArt (eine Plattform für Künstler und Entwickler von DreamUp) und Midjourney, eine generative Kunst-App im Namen betroffener Künstler .
Sie können alles über die Klage auf StableDiffusionLitigation.com lesen, und wenn Sie glauben, dass Ihre Arbeit verwendet wurde, um diese Generatoren zu schulen, dann haben Sie möglicherweise Gründe, sich der Sammelklage anzuschließen, indem Sie sich an die Rechtsabteilung wenden. Die Registrierung Ihrer Kunst beim US Copyright Office ist ein wichtiger erster Schritt, wenn Sie diesen Weg einschlagen möchten.
Wie andere Praktiken, die Anwälte in der Vergangenheit angezogen haben – Piraterie, Jailbreaking, Filesharing – ist es unwahrscheinlich, dass eine Klage die Praxis vollständig beenden wird. Die Verteidigung wird wahrscheinlich argumentieren, dass diese Tools auf „Fair Use“-Material trainiert wurden, das von öffentlich zugänglichen Websites gesammelt wurde. Wir müssen abwarten, um herauszufinden, welche Auswirkungen Klagen wie diese haben werden, wenn überhaupt.
Aggressives Wasserzeichen
Wenn Sie Ihre Grafik immer nur mit einem aggressiven oder grenzwertig selbstzerstörerischen Wasserzeichen hochladen, wird dies in den Datensätzen enthaltene Grafik widerspiegeln. Letztendlich hängt dies weitgehend davon ab, warum Ihr Kunstwerk überhaupt hochgeladen wird. Wenn Sie Kunstwerke nicht kommerziell zum Vergnügen des Internets erstellen, scheint dies letztendlich selbstzerstörerisch zu sein.
Wenn Sie jedoch reale Gemälde verkaufen und sie vor dem Verkauf online ausstellen möchten, kann dies etwas hilfreich sein. Es wird sicherlich vom fertigen Kunstwerk ablenken, also müssen Sie es selbst in Betracht ziehen.
Laden Sie Ihre Kunst nicht im Internet hoch
Das mag lächerlich klingen (und ist es auch), aber wenn Ihr Kunstwerk überhaupt nie ins Internet hochgeladen wird, besteht keine Chance, dass es im Netz gefangen und zum Trainieren von KI verwendet wird. Natürlich ist es fast unmöglich, als Künstler seinen Lebensunterhalt zu verdienen, ohne das Internet zu nutzen, um Ihre Kunstwerke zu teilen (insbesondere wenn Sie mit einem digitalen Medium arbeiten).
Für Künstler, die an Musik arbeiten, ist dies eine Unmöglichkeit. Selbst wenn Sie mit traditionellen Materialien wie Öl oder Aquarell arbeiten, ist nicht abzusehen, ob jemand ein Bild von einem fertigen Stück macht und es selbst hochlädt.
Kann KI-Kunst urheberrechtlich geschützt werden?
Die Frage, ob der Output generativer KI urheberrechtlich geschützt werden kann, ist komplex. Eine Sache, die allgemein anerkannt ist, ist, dass das KI-Tool, das zum Generieren der Kunst verwendet wird, selten Rechte an der Ausgabe hat.
Dies wird in den Nutzungsbedingungen der meisten Tools, einschließlich Stable Diffusion, deutlich angegeben:
Außer wie hierin dargelegt beansprucht der Lizenzgeber keine Rechte an der Ausgabe, die Sie unter Verwendung des Modells generieren. Sie sind für die von Ihnen generierte Ausgabe und deren anschließende Verwendung verantwortlich. Keine Verwendung der Ausgabe darf gegen eine Bestimmung verstoßen, die in der Lizenz angegeben ist.
Die Lizenz verbietet weiterhin jede Nutzung, die „gegen geltendes nationales, bundesstaatliches, staatliches, lokales oder internationales Recht oder Vorschriften verstößt“, was das Urheberrecht einschließen würde.
Zwischendurch:
Sie besitzen alle Vermögenswerte, die Sie mit den Diensten erstellen, soweit dies nach geltendem Recht möglich ist. Dies schließt das Hochskalieren der Bilder anderer aus, da diese Bilder Eigentum der ursprünglichen Ersteller der Assets bleiben.
Und OpenAI (DALL-E 2):
Zwischen den Parteien und im gesetzlich zulässigen Umfang sind Sie Eigentümer aller Eingaben, und vorbehaltlich Ihrer Einhaltung dieser Bedingungen überträgt OpenAI Ihnen hiermit alle seine Rechte, Titel und Anteile an und an der Ausgabe.
In Bezug auf das Urheberrecht für alles, was Sie mit einem solchen Tool erstellt haben, hat das US Copyright Office erklärt, dass das Urheberrecht nur für von Menschen geschaffene Kunst gilt (zusammen mit anderen Anforderungen, wie Originalität):
In Fällen, in denen eine nichtmenschliche Urheberschaft geltend gemacht wird, haben Berufungsgerichte festgestellt, dass das Urheberrecht die angeblichen Schöpfungen nicht schützt.
Das Recht entwickelt sich ständig weiter, so dass dies in Zukunft erfolgreich in Frage gestellt werden kann. Es ist auch erwähnenswert, dass Elemente eines Endprodukts, die nicht das Produkt eines KI-Generators sind (wie Handlung oder Dialog), immer noch urheberrechtlich geschützt sein können, auch wenn andere Elemente (wie Kunstwerke oder Musik) dies nicht sind.
Können KI-Kunstgeneratoren meine urheberrechtlich geschützte Kunst verwenden?
Die Frage ist nicht unbedingt „können“ KI-Generatoren Ihre urheberrechtlich geschützten Kunstwerke verwenden, sondern „verwenden“ sie Ihre urheberrechtlich geschützten Kunstwerke bereits . Die Antwort auf diese Frage ist, wie viele Künstler herausgefunden haben, ein klares Ja. Oben haben wir einige Methoden besprochen, um Datensätze abzulehnen und Crawler daran zu hindern, Ihre Inhalte zu indizieren, aber diese Techniken hängen letztendlich davon ab, wer an der Spitze steht und Ihre Präferenzen respektiert.
Mit HaveIBeenTrained.com können Sie herausfinden, ob Ihre Kunst in den größten öffentlichen Bilddatensätzen enthalten ist. Laden Sie eines Ihrer bekannteren Kunstwerke hoch oder suchen Sie nach Ihrem Namen, dem Titel des Kunstwerks, Ihrem Webcomic oder einer anderen Kreation und werfen Sie einen Blick darauf. Wenn Sie Ihr Kunstwerk auf der Website sehen, ist Ihr Kunstwerk in einem Datensatz enthalten, der von Stable Diffusion und anderen verwendet wird.
Ganz zu schweigen von den anderen generativen Kunstanwendungen, die nicht offenlegen, welche Datensätze verwendet werden (wie DALL-E von OpenAI). Sie können jederzeit eine Eingabeaufforderung wie „Grafik im Stil Ihres Namens“ ausprobieren, um zu sehen, ob etwas Vertrautes auftaucht.
Kommende Tools können helfen, KI-Kunstgeneratoren zu besiegen
Für Künstler besteht möglicherweise eine gewisse Hoffnung in Form von Tools, die es einer generativen KI erschweren, Kunstwerke auf der Grundlage von Bildern in einem Datensatz zu reproduzieren. Leider sind diese Lösungen noch nicht da (zum Zeitpunkt des Schreibens) und es ist nicht abzusehen, wie effektiv sie langfristig sein werden. KI-Tools entwickeln sich schnell weiter, daher ist es möglich, dass sie sich weiterentwickeln, um solche Sicherheitsvorkehrungen zu umgehen.
Das erste ist Glaze, ein Projekt der University of Chicago, das Kunstwerken „sehr kleine Änderungen hinzufügt“, bevor sie hochgeladen werden. Die Entwickler bezeichnen diese Änderungen als „Style Cloak“ und stellen fest, dass das Kunstwerk – für das menschliche Auge – nahezu identisch mit dem Original erscheint, während die KI den Stil als den eines anderen missinterpretiert.
Glaze wird als Anwendung für Mac und Windows herausgebracht, sodass Kunstwerke „getarnt“ werden können, ohne den Computer des Künstlers verlassen zu müssen. Entwickler sagen, dass sie das Tool nicht kommerzialisieren werden, also wird es für jedermann kostenlos sein. Das Glaze-Projekt betrachtet das Tool als „einen notwendigen ersten Schritt in Richtung künstlerzentrierter Schutztools, um der KI-Nachahmung zu widerstehen“.
Eine andere Technik, die im Pursuit-Blog der University of Melbourne beschrieben wird, beschreibt die subtile Verwendung von Rauschen, das „gerade genug Pixel in einem Bild verändert, um die KI zu verwirren, und es in ein ‚nicht lernbares‘ Bild verwandelt“. Die Institution behauptet, eine Technik entwickelt zu haben, die eine Schwäche in den Modellen ausnutzt und so weit geht, Tools wie Stable Diffusion als „faule Lerner“ zu bezeichnen.
Diese Technik hat eine breite Palette von Einsatzmöglichkeiten, darunter visuelle Kunstwerke, aber auch Audio und Fotos, die Sie persönlich identifizieren. Es ist wichtig zu erkennen, dass diese Techniken in Bezug auf die Entwicklung noch am Anfang stehen, also müssen wir abwarten, wozu sie wirklich fähig sind.
Aufstieg der Roboter
Generative Kunst-Apps können im Handumdrehen Kunstwerke erstellen, aber sie sind nicht wirklich so kreativ wie Menschen. ChatGPT kann möglicherweise Ihren Lebenslauf schreiben, aber Sie müssen ihn sorgfältig Korrektur lesen, da der Chatbot oft sicher falsch liegt.
Unter dem Strich können die aktuellen KI-Lösungen nützlich sein, aber sie sind auch schwach.