Cómo proteger sus imágenes de los generadores de arte AI

Publicado: 2023-03-24
Escritorio de Amazon configurado desde CES 2023 con obras de arte en la pared.
Hannah Stryker / Geek de instrucciones
Puedes probar algunas cosas para proteger tu arte de los generadores de IA:
  • Opte por no recibir conjuntos de datos de entrenamiento con una herramienta como HaveIBeenTrained.com.
  • Utilice un archivo "robots.txt" para protegerse de los rastreadores web, muchos de los cuales se utilizan para crear conjuntos de datos en primer lugar.
  • Copyright su obra de arte y desafíe a los desarrolladores de estas herramientas en los tribunales (o únase a las demandas colectivas existentes).
  • Solo cargue imágenes con marcas de agua agresivas.
  • Evite poner su arte en Internet en primer lugar.

Es posible que los generadores de arte de IA no puedan imitar la creatividad humana, pero seguro que pueden estafarte. Esta es una preocupación tanto para los artistas como para aquellos que temen la toma de control de la IA, pero es posible que no todo esté perdido.

Cómo proteger el arte con derechos de autor de la IA

Los generadores de arte de IA no son nada sin los conjuntos de datos en los que han sido entrenados. Esto implica tomar una gran muestra de obras de arte existentes y contextualizarlas de una manera que permita a los humanos usar indicaciones de lenguaje natural para crear obras de arte similares. Puede probarlo usted mismo utilizando una aplicación de arte generativo como DALL-E 2 o Midjourney de OpenAI.

Le pedimos a DALL-E 2 que produjera "una imagen de Elmo de Barrio Sésamo al estilo de Pablo Picasso" y esto es lo que obtuvimos (sí, este fue el mejor del grupo):

Elmo al estilo de Pablo Picasso cortesía de OpenAI DALL-E 2

Ser capaz de crear obras de arte al estilo de artistas muertos podría no despertar demasiadas alarmas, particularmente en un estilo que es tan reconocible. Pero para los artistas modernos que comparten sus creaciones a través de ArtStation, DeviantArt, Behance, sitios web personales y páginas de redes sociales como Instagram o Facebook, es mucho más preocupante.

Entonces, ¿qué puedes hacer para proteger tus propias creaciones de ser utilizadas para entrenar una IA que puede escupir creaciones mucho más rápido que tú?

Optar por no recibir conjuntos de datos de entrenamiento

Puede optar por no participar en dos de los conjuntos de datos de entrenamiento de imagen abierta más grandes de Internet, LAION-400M y LAION-5B mediante HaveIBeenTrained.com. Estos conjuntos de datos son utilizados por algunos de los mayores generadores de imágenes en la web, incluidos Stable Diffusion y Google Imagen. Debido a que son verdaderamente abiertas, muchas otras herramientas de IA generativa también las utilizan.

Desafortunadamente, el proceso de hacer esto es lento y tedioso. Primero deberá registrarse para obtener una cuenta y luego buscar o cargar una imagen para encontrar coincidencias dentro del conjunto de datos. Luego puede hacer clic derecho en la imagen en su navegador web de escritorio y elegir la opción "Agregar a mis opciones de exclusión". Alternativamente, puede otorgar al conjunto de datos permiso explícito para usar una imagen haciendo clic en "Agregar a mis suscripciones".

Optar por no recibir conjuntos de datos con HaveIBeenTrained.com

Deberá hacer esto para cada imagen que encuentre, por lo que puede ser un proceso laborioso si es un artista con una gran cantidad de trabajo. El tiempo que tomará de manera realista depende en última instancia de qué tan fácil sea filtrar su trabajo, lo que podría ser más fácil si tiene trabajo asociado con un nombre o proyecto único, muchos seguidores en línea, etc.

Aunque estos dos conjuntos de datos masivos son un excelente lugar para comenzar, están lejos de ser los únicos que se utilizan. Las personas pueden crear sus propios conjuntos de datos, y algunos lo hacen para replicar un artista o estilo artístico en particular. Algunas empresas como OpenAI no revelan qué conjuntos de datos utilizan sus herramientas, por lo que no hay forma de combatirlos.

Use Robots.txt para protegerse de los rastreadores

Un archivo robots.txt es un pequeño documento de texto que se coloca en el directorio raíz de un sitio web para indicar a los rastreadores web dónde pueden o no pueden ir. Aunque Google declara explícitamente que "no es un mecanismo para mantener una página web fuera de Google", es posible que desee intentar usarlo para mantener a los rastreadores web alejados de su obra de arte si la aloja en su propio sitio web.

Como su nombre lo sugiere, los rastreadores web rastrean la web en busca de contenido para indexar. Los motores de búsqueda están lejos de ser los únicos rastreadores, y los rastreadores también se utilizan para crear conjuntos de datos muy parecidos a los conjuntos de datos LAION-400M y LAION-5B mencionados anteriormente. El principal problema con robots.txt es que depende de que el rastreador web respete su solicitud.

Uno de los conjuntos de datos más grandes que existen es Common Crawl, cuyos datos se han utilizado para construir los conjuntos de datos de LAION. El proceso de rastreo de la web es continuo, y LAION afirma que su conjunto de datos LAION-400M actual (en el momento de escribir este artículo) se ha creado "a partir de páginas web aleatorias rastreadas entre 2014 y 2021".

Common Crawl afirma que respeta robots.txt y el Protocolo de exclusión de robots tanto en términos de bloqueo de contenido como de retraso en el rastreo (para ahorrar ancho de banda). Puede hacerlo creando una regla para el agente de usuario "CCBot" en su archivo Robots.txt. Por supuesto, nada de esto ayudará si no está alojando su obra de arte.

Google Search Central tiene una guía práctica para crear un archivo robots.txt, o puede usar un sitio web como Ryte's Robots.txt Generator para crear uno para usted. Puede permitir o deshabilitar agentes de usuario específicos de directorios específicos, o simplemente bloquear todo con un comodín (*). Por ejemplo, un archivo robots.txt que bloquea todos los archivos en su directorio /images/ de Common Crawl mientras permite que otros rastreadores indexen su sitio web sería:

 Agente de usuario: CCbot
No permitir: /imágenes/

Agente de usuario: *
Permitir: /

Mapa del sitio: https://www.example.com/sitemap.xml

Esto no derrotará a los rastreadores que ya han visitado su sitio web, pero debería evitar que Common Crawl indexe su carpeta /images/ (y cualquier carga nueva desde el último rastreo) en el futuro.

Derechos de autor de su obra de arte

Aunque los derechos de autor están implícitos en el trabajo que ha creado, es posible que también valga la pena esforzarse por obtener los derechos de autor de su trabajo. En los EE. UU., puede hacerlo registrando sus obras en Copyright.gov. Puede enviar hasta 10 trabajos inéditos en una sola solicitud, solo tenga en cuenta que puede llevar un tiempo (actualmente alrededor de un año) para que se procesen sus trabajos.

Haber registrado los derechos de autor de su trabajo le da más apoyo en asuntos que involucran a los tribunales. Esa es la idea detrás de una demanda colectiva presentada contra Stability AI (desarrollador de Stable Diffusion y DreamStudio, financiador de LAION), DeviantArt (una plataforma para artistas y desarrollador de DreamUp) y Midjourney, una aplicación de arte generativo en nombre de los artistas afectados. .

Diferentes tipos de trabajo que puede proteger en Copyright.gov

Puede leer todo sobre la demanda en StableDiffusionLitigation.com, y si cree que su trabajo se ha utilizado para capacitar a estos generadores, entonces puede tener motivos para unirse a la demanda colectiva comunicándose con el equipo legal. Haber solicitado el registro de su arte en la Oficina de derechos de autor de EE. UU. es un primer paso importante si desea seguir este camino.

Al igual que otras prácticas que han atraído a abogados en el pasado (piratería, jailbreak, intercambio de archivos), es poco probable que una demanda detenga la práctica por completo. La defensa probablemente argumentará que estas herramientas fueron entrenadas en material de "uso justo" recopilado de sitios web públicos. Tendremos que esperar y ver qué efecto tendrán demandas como estas, si es que las tienen.

Marca de agua agresiva

Si solo carga su obra de arte con alguna marca de agua autodestructiva agresiva o en el límite presente, la obra de arte incluida en los conjuntos de datos reflejará esto. En última instancia, esto depende en gran medida de por qué su obra de arte se carga en primer lugar. Si está creando obras de arte sin fines comerciales para el disfrute de Internet, esto parece en última instancia contraproducente.

Una ridícula marca de agua de How-To Geek
Tim Brookes / Geek de instrucciones

Sin embargo, si está vendiendo pinturas del mundo real y quiere un medio para exhibirlas en línea antes de la venta, puede ayudar un poco. Ciertamente va a restar valor a la obra de arte terminada, por lo que es algo que tendrá que considerar por sí mismo.

No subas tu arte a Internet

Esto puede sonar ridículo (y lo es), pero si su obra de arte nunca se sube a Internet en primer lugar, no hay posibilidad de que quede atrapada en la red y se use para entrenar a la IA. Por supuesto, ganarse la vida como artista sin usar Internet para compartir su obra de arte puede ser casi imposible (especialmente si trabaja en un medio digital).

Para los artistas que trabajan en la música, esto es imposible. Incluso si trabaja con materiales tradicionales como el óleo o la acuarela, no se sabe si alguien tomará una foto de una pieza terminada y la cargará él mismo.

¿Puede el arte AI tener derechos de autor?

La cuestión de si el resultado de la IA generativa puede tener derechos de autor es compleja. Una cosa que generalmente se acepta es que la herramienta de IA utilizada para generar el arte rara vez tiene derechos sobre el resultado.

Esto se indica claramente en los términos de servicio de la mayoría de las herramientas, incluida Stable Diffusion:

Excepto por lo establecido en este documento, el Licenciante no reclama ningún derecho sobre el Resultado que Usted genera utilizando el Modelo. Usted es responsable del Producto que genera y de sus usos posteriores. Ningún uso de la salida puede contravenir ninguna de las disposiciones establecidas en la Licencia.

La licencia continúa prohibiendo cualquier uso que “viole cualquier ley o regulación nacional, federal, estatal, local o internacional aplicable” que incluiría la ley de derechos de autor.

Medio viaje:

Usted posee todos los Activos que crea con los Servicios, en la medida de lo posible según la ley actual. Esto excluye la mejora de las imágenes de otros, cuyas imágenes siguen siendo propiedad de los creadores de Activos originales.

Y OpenAI (DALL-E 2):

Entre las partes y en la medida en que lo permita la ley aplicable, usted posee todos los Entradas y, sujeto a su cumplimiento de estos Términos, OpenAI le asigna todos sus derechos, títulos e intereses en y para la Salida.

En términos de derechos de autor de cualquier cosa que haya creado con dicha herramienta, la Oficina de derechos de autor de EE. UU. ha declarado que los derechos de autor solo se aplican al arte creado por humanos (junto con otros requisitos, como la originalidad):

En los casos en que se reclama la autoría no humana, los tribunales de apelación han determinado que los derechos de autor no protegen las supuestas creaciones.

La ley está en constante evolución, por lo que esto puede ser desafiado con éxito en el futuro. También vale la pena señalar que los elementos de un producto final que no son el producto de un generador de IA (como la trama o el diálogo) aún pueden tener derechos de autor, incluso si otros elementos (como las ilustraciones o la música) no lo están.

¿Pueden los generadores de arte con IA usar mi arte con derechos de autor?

La pregunta no es necesariamente "pueden" los generadores de IA usar su arte protegido por derechos de autor, sino "sí" ya usan su arte protegido por derechos de autor. La respuesta a esa pregunta, como muchos artistas han descubierto, es un rotundo sí. Anteriormente, analizamos algunos métodos para excluirse de los conjuntos de datos y evitar que los rastreadores indexen su contenido, pero estas técnicas dependen en última instancia de quien esté al mando y respete sus preferencias.

Puede averiguar si su arte está incluido en los conjuntos de datos públicos más grandes de imágenes utilizando HaveIBeenTrained.com. Cargue una de sus obras de arte más conocidas o busque su nombre, título de la obra de arte, cómic web u otra creación y eche un vistazo. Si ve que su obra de arte aparece en el sitio web, su arte se incluye en un conjunto de datos utilizado por Stable Diffusion y otros.

Eso sin mencionar las otras aplicaciones de arte generativo que no revelan qué conjuntos de datos están en uso (como DALL-E de OpenAI). Siempre puede probar con un mensaje como "obra de arte con el estilo de su nombre" para ver si aparece algo familiar.

Las próximas herramientas pueden ayudar a derrotar a los generadores de arte de IA

Puede haber alguna esperanza para los artistas que vienen en forma de herramientas que pueden dificultar que una IA generativa reproduzca obras de arte basadas en imágenes en un conjunto de datos. Desafortunadamente, estas soluciones aún no están aquí (al momento de escribir este artículo) y no se sabe qué tan efectivas serán a largo plazo. Las herramientas de IA evolucionan rápidamente, por lo que es posible que evolucionen para eludir tales salvaguardas.

El primero es Glaze, un proyecto de la Universidad de Chicago que “agrega cambios muy pequeños” a las ilustraciones antes de subirlas. Los desarrolladores se refieren a estos cambios como una "capa de estilo" y señalan que la obra de arte parece, para el ojo humano, casi idéntica a la original, lo que hace que la IA malinterprete el estilo como el de otro.

Glaze Project para encubrir imágenes
Proyecto Glaze / Universidad de Chicago

Glaze se lanzará como una aplicación para Mac y Windows, por lo que las obras de arte se pueden "ocultar" sin tener que abandonar la computadora del artista. Los desarrolladores dicen que no comercializarán la herramienta, por lo que será de uso gratuito para cualquier persona. El proyecto Glaze considera la herramienta como "un primer paso necesario hacia herramientas de protección centradas en el artista para resistir el mimetismo de la IA".

Otra técnica, como se describe en el blog Pursuit de la Universidad de Melbourne, describe el uso sutil del ruido que "cambia los píxeles suficientes en una imagen para confundir a la IA y convertirla en una imagen 'ilegible'". La institución afirma haber ideado una técnica que explota una debilidad en los modelos y llega a describir herramientas como Stable Diffusion como "aprendices perezosos".

Esta técnica tiene una amplia gama de usos potenciales que incluyen obras de arte visuales, pero también audio y fotografías que lo identifican personalmente. Es importante reconocer que estas técnicas aún se encuentran en una etapa temprana de desarrollo, por lo que tendremos que esperar y ver de qué son realmente capaces.

El surgimiento de los robots

Las aplicaciones de arte generativo pueden crear obras de arte en muy poco tiempo, pero no son realmente creativas de la misma manera que los humanos. ChatGPT puede escribir su currículum, pero deberá revisarlo cuidadosamente porque el chatbot a menudo está equivocado.

La conclusión es que las soluciones de IA actuales pueden ser útiles, pero también son débiles.