Como proteger suas imagens de geradores de arte AI

Publicados: 2023-03-24
Mesa da Amazon criada para a CES 2023 com obras de arte na parede.
Hannah Stryker / How-To Geek
Você pode tentar algumas coisas para proteger sua arte dos geradores de IA:
  • Desative os conjuntos de dados de treinamento com uma ferramenta como HaveIBeenTrained.com.
  • Use um arquivo "robots.txt" para afastar os rastreadores da Web, muitos dos quais são usados ​​para criar conjuntos de dados em primeiro lugar.
  • Direitos autorais de sua arte e conteste os desenvolvedores dessas ferramentas no tribunal (ou junte-se a ações coletivas existentes).
  • Carregue apenas imagens com marca d'água agressiva.
  • Evite colocar sua arte na internet em primeiro lugar.

Os geradores de arte de IA podem não ser capazes de imitar a criatividade humana, mas com certeza podem enganá-lo. Isso é uma preocupação tanto para os artistas quanto para aqueles que temem a aquisição da IA, mas nem tudo pode estar perdido.

Como proteger a arte protegida por direitos autorais da IA

Os geradores de arte de IA não são nada sem os conjuntos de dados nos quais foram treinados. Isso envolve pegar uma grande amostra de obras de arte existentes e contextualizá-las de uma forma que permita aos humanos usar prompts de linguagem natural para criar obras de arte semelhantes. Você pode experimentá-lo usando um aplicativo de arte generativa como DALL-E 2 ou Midjourney da OpenAI.

Pedimos ao DALL-E 2 para produzir “uma imagem de Elmo da Vila Sésamo no estilo de Pablo Picasso” e aqui está o que conseguimos (sim, este foi o melhor do grupo):

Elmo no estilo de Pablo Picasso cortesia de OpenAI DALL-E 2

Ser capaz de criar obras de arte no estilo de artistas mortos pode não levantar muitos alarmes, especialmente em um estilo que é tão reconhecível. Mas para artistas modernos que compartilham suas criações por meio de ArtStation, DeviantArt, Behance, sites pessoais e páginas de mídia social como Instagram ou Facebook, é muito mais preocupante.

Então, o que você pode fazer para proteger suas próprias criações de serem usadas para treinar uma IA que pode cuspir criações muito mais rápido do que você?

Desativar conjuntos de dados de treinamento

Você pode optar por excluir dois dos maiores conjuntos de dados de treinamento de imagem aberta na Internet, LAION-400M e LAION-5B, usando HaveIBeenTrained.com. Esses conjuntos de dados são usados ​​por alguns dos maiores geradores de imagens da web, incluindo Stable Diffusion e Google Imagen. Por serem verdadeiramente abertas, muitas outras ferramentas de IA generativas também as utilizam.

Infelizmente, o processo de fazer isso é lento e tedioso. Você precisará primeiro se inscrever em uma conta e, em seguida, pesquisar ou fazer upload de uma imagem para encontrar correspondências no conjunto de dados. Você pode clicar com o botão direito do mouse na imagem em seu navegador da Web para desktop e escolher a opção “Adicionar a minhas desativações”. Como alternativa, você pode conceder permissão explícita ao conjunto de dados para usar uma imagem clicando em "Adicionar a minhas inscrições".

Desative conjuntos de dados com HaveIBeenTrained.com

Você precisará fazer isso para cada imagem que encontrar, então pode ser um processo meticuloso se você for um artista com um grande corpo de trabalho. O tempo que levará realisticamente dependerá de quão fácil é filtrar seu trabalho, o que pode ser mais fácil se você tiver um trabalho associado a um nome ou projeto exclusivo, um grande número de seguidores online e assim por diante.

Embora esses dois enormes conjuntos de dados sejam um ótimo ponto de partida, eles estão longe de ser os únicos usados. Os indivíduos podem criar seus próprios conjuntos de dados, e alguns o fazem para replicar um determinado artista ou estilo de arte. Algumas empresas como a OpenAI não divulgam quais conjuntos de dados suas ferramentas usam, então não há como combatê-los.

Use o Robots.txt para afastar os rastreadores

Um arquivo robots.txt é um pequeno documento de texto colocado no diretório raiz de um site para informar aos rastreadores da Web onde eles podem ou não ir. Embora o Google afirme explicitamente que “não é um mecanismo para manter uma página da web fora do Google”, você ainda pode tentar usá-lo para manter os rastreadores da web longe de seu trabalho artístico se estiver hospedando-o em seu próprio site.

Como o nome pode sugerir, os rastreadores da Web rastreiam a Web em busca de conteúdo para indexação. Os mecanismos de pesquisa estão longe de ser os únicos rastreadores, e os rastreadores também são usados ​​para criar conjuntos de dados muito parecidos com os conjuntos de dados LAION-400M e LAION-5B mencionados acima. O principal problema com o robots.txt é que ele depende do rastreador da Web para respeitar sua solicitação.

Um dos maiores conjuntos de dados existentes é o Common Crawl, cujos dados foram usados ​​para construir os conjuntos de dados do LAION. O processo de rastreamento da web é contínuo, com LAION declarando que seu conjunto de dados LAION-400M atual (no momento da redação) foi criado “a partir de páginas da web aleatórias rastreadas entre 2014 e 2021”.

O Common Crawl afirma que respeita o robots.txt e o Robots Exclusion Protocol tanto em termos de bloqueio de conteúdo quanto de atraso no rastreamento (para economizar largura de banda). Você pode fazer isso criando uma regra para o agente de usuário “CCBot” em seu arquivo Robots.txt. Claro, nada disso ajudará se você não estiver hospedando sua arte.

A Central de Pesquisa do Google tem um guia prático para criar um arquivo robots.txt, ou você pode usar um site como o Robots.txt Generator da Ryte para criar um para você. Você pode permitir ou desabilitar agentes de usuário específicos de diretórios específicos ou simplesmente bloquear tudo com um curinga (*). Por exemplo, um arquivo robots.txt que bloqueia todos os arquivos em seu diretório /images/ do Common Crawl enquanto ainda permite que outros rastreadores indexem seu site seria:

 Agente de usuário: CCbot
Não permitir: /imagens/

Agente de usuário: *
Permitir: /

Mapa do site: https://www.example.com/sitemap.xml

Isso não impedirá os rastreadores que já visitaram seu site, mas deve evitar que o Common Crawl indexe sua pasta /images/ (e quaisquer novos uploads desde o último rastreamento) no futuro.

Direitos autorais de sua arte

Embora os direitos autorais estejam implícitos no trabalho que você criou, fazer o possível para proteger seus direitos autorais também pode valer o esforço. Nos EUA, você pode fazer isso registrando seus trabalhos em Copyright.gov. Você pode enviar até 10 trabalhos inéditos em uma única inscrição, mas saiba que pode demorar um pouco (atualmente cerca de um ano) para que seus trabalhos sejam processados.

Ter os direitos autorais registrados para o seu trabalho lhe dá mais apoio em questões que envolvem os tribunais. Essa é a ideia por trás de uma ação coletiva movida contra a Stability AI (desenvolvedora do Stable Diffusion e DreamStudio, financiadora do LAION), DeviantArt (uma plataforma para artistas e desenvolvedora do DreamUp) e Midjourney, um aplicativo de arte generativa em nome dos artistas afetados. .

Diferentes tipos de trabalho que você pode proteger em Copyright.gov

Você pode ler tudo sobre o processo em StableDiffusionLitigation.com e, se acredita que seu trabalho foi usado para treinar esses geradores, pode ter motivos para ingressar na ação coletiva entrando em contato com a equipe jurídica. Solicitar o registro de sua arte no US Copyright Office é um primeiro passo importante se você quiser seguir esse caminho.

Como outras práticas que atraíram advogados no passado – pirataria, jailbreaking, compartilhamento de arquivos – é improvável que uma ação judicial pare a prática completamente. A defesa provavelmente argumentará que essas ferramentas foram treinadas em material de “uso justo” coletado de sites públicos. Teremos que esperar para descobrir que efeito processos como esses terão, se houver.

Marca d'água agressiva

Se você apenas enviar sua arte com alguma marca d'água autodestrutiva agressiva ou limítrofe, a arte incluída nos conjuntos de dados refletirá isso. Em última análise, isso depende muito do motivo pelo qual sua arte está sendo carregada em primeiro lugar. Se você está criando obras de arte não comercialmente para se divertir na Internet, isso parece, em última análise, autodestrutivo.

Uma ridícula marca d'água How-To Geek
Tim Brookes / How-To Geek

No entanto, se você estiver vendendo pinturas do mundo real e quiser exibi-las on-line antes da venda, isso pode ajudar um pouco. Isso certamente prejudicará a obra de arte finalizada, então é algo que você terá que considerar por si mesmo.

Não carregue sua arte na Internet

Isso pode parecer ridículo (e é), mas se sua arte nunca for carregada na Internet, não há chance de ela ser capturada na rede e usada para treinar IA. Claro, ganhar a vida como artista sem usar a internet para compartilhar sua arte pode ser quase impossível (especialmente se você trabalha em um meio digital).

Para artistas que trabalham com música, isso é uma impossibilidade. Mesmo se você trabalhar com materiais tradicionais como óleo ou aquarela, não há como saber se alguém vai tirar uma foto de uma peça acabada e carregá-la.

A arte da IA ​​pode ter direitos autorais?

A questão de saber se a saída da IA ​​generativa pode ser protegida por direitos autorais é complexa. Uma coisa geralmente aceita é que a ferramenta de IA usada para gerar a arte raramente tem direitos sobre a saída.

Isso é claramente declarado nos termos de serviço da maioria das ferramentas, incluindo Stable Diffusion:

Exceto conforme estabelecido neste documento, o Licenciador não reivindica nenhum direito sobre a Saída que Você gerar usando o Modelo. Você é responsável pela Saída que gera e seus usos subsequentes. Nenhum uso da saída pode infringir qualquer disposição conforme estabelecido na Licença.

A licença prossegue proibindo qualquer uso que “viole qualquer lei ou regulamentação nacional, federal, estadual, local ou internacional aplicável” que inclua a lei de direitos autorais.

Meio da jornada:

Você possui todos os ativos que criou com os Serviços, na medida do possível pela lei atual. Isso exclui o aumento de escala das imagens de outras pessoas, cujas imagens permanecem de propriedade dos criadores originais do recurso.

E OpenAI (DALL-E 2):

Como entre as partes e na medida permitida pela lei aplicável, você possui todas as Entradas e, sujeito à sua conformidade com estes Termos, a OpenAI cede a você todos os seus direitos, títulos e interesses em e para a Saída.

Em termos de direitos autorais de qualquer coisa que você tenha criado com essa ferramenta, o US Copyright Office declarou que os direitos autorais se aplicam apenas à arte criada por humanos (juntamente com outros requisitos, como originalidade):

Nos casos em que a autoria não humana é reivindicada, os tribunais de apelação concluíram que os direitos autorais não protegem as supostas criações.

A lei está em constante evolução, então isso pode ser desafiado com sucesso no futuro. Também é importante notar que os elementos de um produto final que não são o produto de um gerador de IA (como enredo ou diálogo) ainda podem ser protegidos por direitos autorais, mesmo que outros elementos (como arte ou música) não sejam.

Os geradores de arte AI podem usar minha arte protegida por direitos autorais?

A questão não é necessariamente "podem" os geradores de IA usar sua arte protegida por direitos autorais, mas "eles" usam sua arte protegida por direitos autorais. A resposta a essa pergunta, como muitos artistas descobriram, é um retumbante sim. Acima, discutimos alguns métodos de desativar conjuntos de dados e impedir que rastreadores indexem seu conteúdo, mas essas técnicas dependem de quem está no comando respeitando suas preferências.

Você pode descobrir se sua arte está incluída nos maiores conjuntos de dados públicos de imagens usando HaveIBeenTrained.com. Carregue uma de suas obras de arte mais conhecidas ou pesquise seu nome, título da arte, webcomic ou outra criação e dê uma olhada. Se você vir sua arte aparecer no site, sua arte está incluída em um conjunto de dados usado pela Stable Diffusion e outros.

Isso sem falar nos outros aplicativos de arte generativa que não revelam quais conjuntos de dados estão em uso (como o DALL-E da OpenAI). Você sempre pode tentar um prompt como “arte no estilo do seu nome” para ver se algo familiar aparece.

Próximas ferramentas podem ajudar a derrotar os geradores de arte AI

Pode haver alguma esperança para os artistas na forma de ferramentas que podem tornar mais difícil para uma IA generativa reproduzir obras de arte com base em imagens em um conjunto de dados. Infelizmente, essas soluções ainda não estão disponíveis (no momento em que escrevo) e não há como dizer o quão eficazes elas serão a longo prazo. As ferramentas de IA evoluem rapidamente, então é possível que evoluam para contornar essas salvaguardas.

O primeiro é o Glaze, um projeto da Universidade de Chicago que “adiciona alterações muito pequenas” à arte antes de ser carregada. Os desenvolvedores se referem a essas mudanças como um “manto de estilo” e observam que a obra de arte parece – ao olho humano – quase idêntica ao original, fazendo com que a IA interprete mal o estilo como o de outro.

Glaze Project para camuflagem de imagens
Projeto Glaze / Universidade de Chicago

O Glaze será lançado como um aplicativo para Mac e Windows, para que a arte possa ser “encoberta” sem sair do computador do artista. Os desenvolvedores dizem que não comercializarão a ferramenta, portanto, ela será gratuita para qualquer pessoa. O projeto Glaze vê a ferramenta como “um primeiro passo necessário para ferramentas de proteção centradas no artista para resistir à imitação de IA”.

Outra técnica descrita no blog Pursuit da Universidade de Melbourne descreve o uso sutil de ruído que “altera apenas os pixels suficientes em uma imagem para confundir a IA e transformá-la em uma imagem 'incapaz de aprender'”. A instituição afirma ter criado uma técnica que explora uma fraqueza nos modelos e chega a descrever ferramentas como Stable Diffusion como “aprendizes preguiçosos”.

Esta técnica tem uma ampla gama de usos potenciais, incluindo arte visual, mas também áudio e fotografias que o identificam pessoalmente. É importante reconhecer que essas técnicas ainda estão no início do desenvolvimento, então teremos que esperar para ver do que elas são realmente capazes.

Ascensão dos Robôs

Os aplicativos de arte generativa podem criar obras de arte rapidamente, mas não são verdadeiramente criativos da mesma forma que os humanos. O ChatGPT pode ser capaz de escrever seu currículo, mas você precisará revisá-lo com cuidado porque o chatbot geralmente está errado.

O ponto principal é que as atuais soluções de IA podem ser úteis, mas também são fracas.