Comment protéger vos images des générateurs d'art AI

Publié: 2023-03-24
Bureau Amazon mis en place à partir du CES 2023 avec des illustrations sur le mur.
Hannah Stryker / Geek pratique
Vous pouvez essayer plusieurs choses pour protéger votre art des générateurs d'IA :
  • Désactivez les ensembles de données de formation avec un outil comme HaveIBeenTrained.com.
  • Utilisez un fichier "robots.txt" pour éloigner les robots d'indexation, dont beaucoup sont utilisés pour créer des ensembles de données en premier lieu.
  • Protégez vos œuvres d'art et défiez les développeurs de ces outils devant les tribunaux (ou rejoignez les recours collectifs existants).
  • Ne téléchargez que des images avec un filigrane agressif.
  • Évitez de mettre votre art sur Internet en premier lieu.

Les générateurs d'art de l'IA ne sont peut-être pas capables de singer la créativité humaine, mais ils peuvent certainement vous arnaquer. C'est une inquiétude pour les artistes et ceux qui redoutent la prise de contrôle de l'IA, mais tout n'est peut-être pas perdu.

Comment protéger l'art protégé par le droit d'auteur de l'IA

Les générateurs d'art IA ne sont rien sans les ensembles de données sur lesquels ils ont été formés. Cela implique de prendre un énorme échantillon d'œuvres d'art existantes et de le contextualiser de manière à permettre aux humains d'utiliser des invites en langage naturel pour créer des œuvres d'art similaires. Vous pouvez l'essayer par vous-même en utilisant une application d'art génératif comme DALL-E 2 ou Midjourney d'OpenAI.

Nous avons demandé à DALL-E 2 de produire "une image d'Elmo de Sesame Street dans le style de Pablo Picasso" et voici ce que nous avons obtenu (oui, c'était le meilleur du groupe) :

Elmo dans le style de Pablo Picasso avec l'aimable autorisation d'OpenAI DALL-E 2

Être capable de créer des œuvres d'art dans le style d'artistes décédés ne déclenchera peut-être pas trop de sonnettes d'alarme, en particulier dans un style si reconnaissable. Mais pour les artistes modernes qui partagent leurs créations via ArtStation, DeviantArt, Behance, des sites Web personnels et des pages de médias sociaux comme Instagram ou Facebook, c'est beaucoup plus préoccupant.

Alors, que pouvez-vous faire pour empêcher que vos propres créations ne soient utilisées pour former une IA qui peut cracher des créations beaucoup plus rapidement que vous ?

Désactiver les ensembles de données d'entraînement

Vous pouvez choisir de vous retirer de deux des plus grands ensembles de données de formation d'images ouvertes sur Internet, LAION-400M et LAION-5B en utilisant HaveIBeenTrained.com. Ces ensembles de données sont utilisés par certains des plus grands générateurs d'images sur le Web, notamment Stable Diffusion et Google Imagen. Parce qu'ils sont vraiment ouverts, de nombreux autres outils d'IA générative les utilisent également.

Malheureusement, le processus de le faire est lent et fastidieux. Vous devrez d'abord créer un compte, puis rechercher ou télécharger une image pour trouver des correspondances dans l'ensemble de données. Vous pouvez ensuite cliquer avec le bouton droit sur l'image dans votre navigateur Web de bureau et choisir l'option "Ajouter à mes désinscriptions". Vous pouvez également autoriser explicitement l'ensemble de données à utiliser une image en cliquant sur "Ajouter à mes opt-ins" à la place.

Désactiver les ensembles de données avec HaveIBeenTrained.com

Vous devrez le faire pour chaque image que vous trouverez, donc cela peut être un processus fastidieux si vous êtes un artiste avec un grand nombre d'œuvres. Le temps que cela prendra de manière réaliste dépend en fin de compte de la facilité avec laquelle il est possible de filtrer votre travail, ce qui peut être plus facile si vous avez un travail associé à un nom ou à un projet unique, un grand nombre d'abonnés en ligne, etc.

Bien que ces deux ensembles de données massifs soient un excellent point de départ, ils sont loin d'être les seuls à être utilisés. Les individus peuvent créer leurs propres ensembles de données, et certains le font pour reproduire un artiste ou un style artistique particulier. Certaines entreprises comme OpenAI ne divulguent pas du tout les ensembles de données que leurs outils utilisent, il n'y a donc aucun moyen de les combattre.

Utilisez Robots.txt pour éloigner les robots

Un fichier robots.txt est un petit document texte qui est placé dans le répertoire racine d'un site Web pour indiquer aux robots d'exploration Web où ils sont autorisés ou non à aller. Bien que Google déclare explicitement que "ce n'est pas un mécanisme pour garder une page Web hors de Google", vous pouvez toujours essayer de l'utiliser pour éloigner les robots d'exploration Web de votre œuvre si vous l'hébergez sur votre propre site Web.

Comme son nom l'indique, les robots d'indexation parcourent le Web à la recherche de contenu à indexer. Les moteurs de recherche sont loin d'être les seuls crawlers, et les crawlers sont également utilisés pour créer des ensembles de données similaires aux ensembles de données LAION-400M et LAION-5B mentionnés ci-dessus. Le principal problème avec robots.txt est qu'il dépend du robot d'indexation qui respecte votre requête.

L'un des plus grands ensembles de données est Common Crawl, dont les données ont été utilisées pour construire les ensembles de données de LAION. Le processus d'exploration du Web est en cours, LAION déclarant que son ensemble de données LAION-400M actuel (au moment de la rédaction) a été créé "à partir de pages Web aléatoires explorées entre 2014 et 2021".

Common Crawl déclare respecter robots.txt et le protocole d'exclusion des robots à la fois en termes de blocage de contenu et de retardement de l'exploration (pour économiser de la bande passante). Vous pouvez le faire en créant une règle pour l'agent utilisateur "CCBot" dans votre fichier Robots.txt. Bien sûr, rien de tout cela ne vous aidera si vous n'hébergez pas vous-même votre œuvre d'art.

Google Search Central propose un guide pratique pour créer un fichier robots.txt, ou vous pouvez utiliser un site Web comme le générateur Robots.txt de Ryte pour en créer un pour vous. Vous pouvez autoriser ou désactiver des agents utilisateurs spécifiques à partir de répertoires spécifiques, ou simplement tout bloquer avec un caractère générique (*). Par exemple, un fichier robots.txt qui bloque tous les fichiers de votre répertoire /images/ de Common Crawl tout en permettant aux autres crawlers d'indexer votre site Web donnerait :

 Agent utilisateur : CCbot
Interdire : /images/

Agent utilisateur: *
Permettre: /

Plan du site : https://www.example.com/sitemap.xml

Cela ne va pas vaincre les robots d'exploration qui ont déjà visité votre site Web, mais cela devrait empêcher Common Crawl d'indexer votre dossier /images/ (et tout nouveau téléchargement depuis la dernière exploration) à l'avenir.

Droits d'auteur sur votre œuvre

Bien que le droit d'auteur soit implicite dans le travail que vous avez créé, faire tout votre possible pour protéger votre travail par le droit d'auteur peut également en valoir la peine. Aux États-Unis, vous pouvez le faire en enregistrant vos œuvres sur Copyright.gov. Vous pouvez soumettre jusqu'à 10 œuvres inédites dans une seule candidature, sachez simplement que le traitement de vos œuvres peut prendre un certain temps (actuellement environ un an).

Le fait d'avoir enregistré le droit d'auteur sur votre travail vous donne plus d'appui dans les affaires qui impliquent les tribunaux. C'est l'idée derrière un recours collectif intenté contre Stability AI (développeur de Stable Diffusion et DreamStudio, fondateur de LAION), DeviantArt (une plateforme pour artistes et développeur de DreamUp) et Midjourney, une application d'art génératif au nom des artistes concernés. .

Différents types d'œuvres que vous pouvez protéger par le droit d'auteur sur Copyright.gov

Vous pouvez tout savoir sur le procès sur StableDiffusionLitigation.com, et si vous pensez que votre travail a été utilisé pour former ces générateurs, vous pouvez avoir des raisons de rejoindre le recours collectif en contactant l'équipe juridique. Avoir demandé à enregistrer votre art auprès du US Copyright Office est une première étape importante si vous souhaitez emprunter cette voie.

Comme d'autres pratiques qui ont attiré les avocats dans le passé – piratage, jailbreaking, partage de fichiers – il est peu probable qu'un procès arrête complètement la pratique. La défense soutiendra probablement que ces outils ont été formés sur du matériel «d'utilisation équitable» recueilli sur des sites Web destinés au public. Nous devrons attendre et voir quel effet des poursuites comme celles-ci auront, le cas échéant.

Filigrane agressif

Si vous ne téléchargez votre illustration qu'avec un filigrane autodestructeur agressif ou limite, les illustrations incluses dans les ensembles de données le refléteront. En fin de compte, cela dépend en grande partie de la raison pour laquelle votre œuvre est téléchargée en premier lieu. Si vous créez des œuvres d'art à des fins non commerciales pour le plaisir d'Internet, cela semble finalement contre-productif.

Un filigrane ridicule How-To Geek
Tim Brookes / Geek pratique

Cependant, si vous vendez des peintures du monde réel et que vous voulez un moyen de les exposer en ligne avant la vente, cela peut aider quelque peu. Cela va certainement nuire à l'œuvre d'art finie, c'est donc quelque chose que vous devrez considérer par vous-même.

Ne téléchargez pas votre art sur Internet

Cela peut sembler ridicule (et ça l'est), mais si votre œuvre n'est jamais téléchargée sur Internet, il n'y a aucune chance qu'elle soit capturée sur le net et utilisée pour entraîner l'IA. Bien sûr, gagner sa vie en tant qu'artiste sans utiliser Internet pour partager vos œuvres d'art peut être presque impossible (surtout si vous travaillez sur un support numérique).

Pour les artistes travaillant sur la musique, c'est une impossibilité. Même si vous travaillez avec des matériaux traditionnels comme l'huile ou l'aquarelle, on ne sait pas si quelqu'un va prendre une photo d'une pièce finie et la télécharger lui-même.

L'art de l'IA peut-il être protégé par le droit d'auteur ?

La question de savoir si la sortie de l'IA générative peut être protégée par le droit d'auteur est complexe. Une chose qui est généralement acceptée est que l'outil d'IA utilisé pour générer l'art a rarement des droits sur la sortie.

Ceci est clairement indiqué dans les conditions d'utilisation de la plupart des outils, y compris Stable Diffusion :

Sauf indication contraire dans les présentes, le Concédant ne revendique aucun droit sur la Sortie que Vous générez à l'aide du Modèle. Vous êtes responsable de la sortie que vous générez et de ses utilisations ultérieures. Aucune utilisation de la sortie ne peut contrevenir à une disposition telle qu'énoncée dans la Licence.

La licence continue d'interdire toute utilisation qui "viole toute loi ou réglementation nationale, fédérale, étatique, locale ou internationale applicable", ce qui inclurait la loi sur le droit d'auteur.

Mi-parcours :

Vous possédez tous les actifs que vous créez avec les services, dans la mesure du possible en vertu de la loi en vigueur. Cela exclut la mise à l'échelle des images d'autres personnes, lesquelles images restent la propriété des créateurs d'actifs d'origine.

Et OpenAI (DALL-E 2) :

Entre les parties et dans la mesure permise par la loi applicable, vous êtes propriétaire de toutes les Entrées, et sous réserve de votre respect des présentes Conditions, OpenAI vous cède par la présente tous ses droits, titres et intérêts dans et sur les Sorties.

En ce qui concerne la protection par le droit d'auteur de tout ce que vous avez créé avec un tel outil, le US Copyright Office a déclaré que le droit d'auteur ne s'applique qu'à l'art créé par des humains (avec d'autres exigences, comme l'originalité) :

Dans les cas où la paternité non humaine est revendiquée, les cours d'appel ont conclu que le droit d'auteur ne protège pas les créations alléguées.

Le droit évolue constamment, ce qui pourrait être contesté avec succès à l'avenir. Il convient également de noter que les éléments d'un produit final qui ne sont pas le produit d'un générateur d'IA (comme l'intrigue ou le dialogue) peuvent toujours être protégés par le droit d'auteur même si d'autres éléments (comme les illustrations ou la musique) ne le sont pas.

Les générateurs d'art IA peuvent-ils utiliser mon art protégé par le droit d'auteur ?

La question n'est pas nécessairement "les générateurs d'IA peuvent-ils" utiliser votre art protégé par le droit d'auteur, mais "est-ce qu'ils utilisent déjà votre art protégé par le droit d'auteur . La réponse à cette question, comme de nombreux artistes l'ont découvert, est un oui retentissant. Ci-dessus, nous avons discuté de certaines méthodes pour désactiver les ensembles de données et empêcher les robots d'indexation de votre contenu, mais ces techniques dépendent en fin de compte de celui qui est à la barre qui respecte vos préférences.

Vous pouvez savoir si votre art est inclus dans les plus grands ensembles de données publics d'images en utilisant HaveIBeenTrained.com. Téléchargez l'une de vos œuvres d'art les plus connues ou recherchez votre nom, le titre de l'œuvre, le webcomic ou une autre création et jetez un coup d'œil. Si vous voyez votre œuvre apparaître sur le site Web, votre art est inclus dans un ensemble de données utilisé par Stable Diffusion et d'autres.

Cela ne veut rien dire des autres applications d'art génératif qui ne divulguent pas quels ensembles de données sont utilisés (comme DALL-E d'OpenAI). Vous pouvez toujours essayer une invite comme "illustration dans le style de votre nom" pour voir si quelque chose de familier apparaît.

Les outils à venir peuvent aider à vaincre les générateurs d'art IA

Il peut y avoir un certain espoir pour les artistes sous la forme d'outils qui peuvent rendre plus difficile pour une IA générative de reproduire des œuvres d'art basées sur des images dans un ensemble de données. Malheureusement, ces solutions ne sont pas encore là (au moment de la rédaction) et on ne sait pas dans quelle mesure elles seront efficaces à long terme. Les outils d'IA évoluent rapidement, il est donc possible qu'ils évoluent pour contourner ces garanties.

Le premier est Glaze, un projet de l'Université de Chicago qui "ajoute de très petits changements" aux illustrations avant d'être téléchargées. Les développeurs qualifient ces changements de "manteau de style" et notent que l'illustration apparaît - à l'œil humain - presque identique à l'original tout en amenant l'IA à mal interpréter le style comme celui d'un autre.

Projet Glaze pour masquer des images
Projet Glaze / Université de Chicago

Glaze sera publié sous forme d'application pour Mac et Windows, de sorte que l'œuvre puisse être « masquée » sans jamais quitter l'ordinateur de l'artiste. Les développeurs disent qu'ils ne commercialiseront pas l'outil, il sera donc gratuit pour tout le monde. Le projet Glaze considère l'outil comme "une première étape nécessaire vers des outils de protection centrés sur l'artiste pour résister au mimétisme de l'IA".

Une autre technique décrite dans le blog Pursuit de l'Université de Melbourne décrit l'utilisation subtile du bruit qui "change juste assez de pixels dans une image pour confondre l'IA et la transformer en une image" impossible à apprendre "". L'institution affirme avoir mis au point une technique qui exploite une faiblesse des modèles et va jusqu'à qualifier des outils comme Stable Diffusion d'"apprenants paresseux".

Cette technique a un large éventail d'utilisations potentielles, y compris des illustrations visuelles, mais aussi des sons et des photographies qui vous identifient personnellement. Il est important de reconnaître que ces techniques en sont encore à leurs débuts en termes de développement, nous devrons donc attendre et voir de quoi elles sont vraiment capables.

L'ascension des robots

Les applications d'art génératif peuvent créer des œuvres d'art en un rien de temps, mais elles ne sont pas vraiment créatives de la même manière que les humains. ChatGPT peut être en mesure de rédiger votre CV, mais vous devrez le relire attentivement car le chatbot se trompe souvent avec confiance.

L'essentiel est que les solutions d'IA actuelles peuvent être utiles, mais elles sont également faibles.