AI 아트 생성기로부터 이미지를 보호하는 방법
게시 됨: 2023-03-24- HaveIBeenTrained.com과 같은 도구를 사용하여 교육 데이터 세트를 옵트아웃합니다.
- "robots.txt" 파일을 사용하여 웹 크롤러를 차단합니다. 이 중 다수는 애초에 데이터세트를 만드는 데 사용됩니다.
- 작품에 저작권을 부여하고 법정에서 이러한 도구 개발자에게 이의를 제기하거나 기존 집단 소송에 참여하십시오.
- 적극적으로 워터마크가 표시된 이미지만 업로드하세요.
- 애초에 당신의 작품을 인터넷에 올리는 것을 피하세요.
AI 예술 생성기는 인간의 창의성을 흉내낼 수는 없지만 확실히 당신을 찢어발길 수 있습니다. 이것은 아티스트와 AI 인수를 두려워하는 사람들 모두에게 걱정거리이지만 모든 것을 잃지 않을 수도 있습니다.
AI로부터 저작권이 있는 예술품을 보호하는 방법
AI 예술 생성기는 훈련된 데이터 세트 없이는 아무것도 아닙니다. 여기에는 기존 아트워크의 방대한 샘플을 가져와 인간이 자연어 프롬프트를 사용하여 유사한 아트워크를 만들 수 있는 방식으로 맥락화하는 작업이 포함됩니다. OpenAI의 DALL-E 2 또는 Midjourney와 같은 생성 예술 앱을 사용하여 직접 시도해 볼 수 있습니다.
우리는 DALL-E 2에게 "파블로 피카소 스타일의 Sesame Street에 나오는 Elmo 사진"을 제작해 달라고 요청했으며 다음과 같은 결과를 얻었습니다(예, 이것이 최고의 사진이었습니다).
죽은 예술가의 스타일로 예술 작품을 만들 수 있다는 것은 특히 눈에 띄는 스타일에서 너무 많은 경종을 울리지 않을 수 있습니다. 그러나 ArtStation, DeviantArt, Behance, 개인 웹사이트, Instagram이나 Facebook과 같은 소셜 미디어 페이지를 통해 창작물을 공유하는 현대 아티스트에게는 훨씬 더 걱정스러운 일입니다.
그렇다면 당신보다 훨씬 더 빨리 창작물을 내뱉을 수 있는 AI를 훈련시키는 데 당신의 창작물이 사용되지 않도록 보호하려면 어떻게 해야 할까요?
교육 데이터 세트 옵트아웃
HaveIBeenTrained.com을 사용하는 LAION-400M 및 LAION-5B, 인터넷에서 가장 큰 공개 이미지 교육 데이터 세트 중 두 가지를 옵트아웃하도록 선택할 수 있습니다. 이러한 데이터 세트는 Stable Diffusion 및 Google Imagen을 포함하여 웹에서 가장 큰 이미지 생성기 중 일부에서 사용됩니다. 진정으로 개방적이기 때문에 다른 많은 생성 AI 도구도 이를 사용합니다.
불행히도 이 작업을 수행하는 과정은 느리고 지루합니다. 데이터 세트 내에서 일치하는 항목을 찾으려면 먼저 계정에 가입한 다음 이미지를 검색하거나 업로드해야 합니다. 그런 다음 데스크톱 웹 브라우저에서 이미지를 마우스 오른쪽 버튼으로 클릭하고 "내 수신 거부에 추가" 옵션을 선택할 수 있습니다. 또는 대신 "내 옵트인에 추가"를 클릭하여 데이터 세트에 이미지를 사용할 명시적 권한을 부여할 수 있습니다.
찾은 각 이미지에 대해 이 작업을 수행해야 하므로 작업량이 많은 아티스트인 경우 힘든 과정이 될 수 있습니다. 현실적으로 걸리는 시간은 궁극적으로 작업을 필터링하는 것이 얼마나 쉬운지에 따라 달라집니다. 작업이 고유한 이름이나 프로젝트와 연결되어 있거나 대규모 온라인 팔로잉 등이 있는 경우 작업이 더 쉬울 수 있습니다.
이 두 개의 대규모 데이터 세트는 시작하기에 좋은 장소이지만 사용되는 유일한 데이터 세트는 아닙니다. 개인은 자신의 데이터 세트를 만들 수 있으며 일부는 특정 아티스트 또는 예술 스타일을 복제합니다. OpenAI와 같은 일부 회사는 도구가 사용하는 데이터 세트를 전혀 공개하지 않으므로 이에 대처할 방법이 없습니다.
Robots.txt를 사용하여 크롤러 차단
robots.txt 파일은 웹 크롤러에게 이동이 허용되거나 허용되지 않는 위치를 알려주기 위해 웹 사이트의 루트 디렉토리에 배치되는 작은 텍스트 문서입니다. Google은 "Google에서 웹 페이지를 차단하는 메커니즘이 아닙니다"라고 명시적으로 명시하지만, 자신의 웹사이트에서 아트워크를 호스팅하는 경우 웹 크롤러가 아트워크에서 멀어지도록 하기 위해 여전히 이를 사용하고 싶을 수 있습니다.
이름에서 알 수 있듯이 웹 크롤러는 인덱싱할 콘텐츠를 찾기 위해 웹을 크롤링합니다. 검색 엔진은 유일한 크롤러와는 거리가 멀고 크롤러는 위에서 언급한 LAION-400M 및 LAION-5B 데이터 세트와 매우 유사한 데이터 세트를 생성하는 데에도 사용됩니다. robots.txt의 주요 문제점은 귀하의 요청을 존중하는 웹 크롤러에 의존한다는 것입니다.
가장 큰 데이터 세트 중 하나는 LAION의 데이터 세트를 구성하는 데 사용된 데이터인 Common Crawl입니다. 웹 크롤링 프로세스는 진행 중이며 LAION은 현재(작성 당시) LAION-400M 데이터 세트가 "2014년에서 2021년 사이에 크롤링된 임의의 웹 페이지에서" 생성되었다고 밝혔습니다.
Common Crawl은 콘텐츠 차단 및 크롤링 지연(대역폭 절약) 측면에서 robots.txt 및 로봇 배제 프로토콜을 존중한다고 명시합니다. Robots.txt 파일에서 "CCBot" 사용자 에이전트에 대한 규칙을 생성하여 이를 수행할 수 있습니다. 물론 아트워크를 자체 호스팅하지 않는 경우 이 중 어느 것도 도움이 되지 않습니다.
Google 검색 센터에는 robots.txt 파일을 만들기 위한 편리한 가이드가 있습니다. 또는 Ryte의 Robots.txt Generator와 같은 웹사이트를 사용하여 파일을 만들 수 있습니다. 특정 디렉토리의 특정 사용자 에이전트를 허용 또는 비활성화하거나 와일드카드(*)를 사용하여 모든 항목을 간단히 차단할 수 있습니다. 예를 들어 일반 크롤링에서 /images/ 디렉토리의 모든 파일을 차단하는 robots.txt 파일은 다른 크롤러가 귀하의 웹사이트를 색인에 추가할 수 있도록 허용합니다.
사용자 에이전트: CCbot 금지: /이미지/ 사용자 에이전트: * 허용하다: / 사이트맵: https://www.example.com/sitemap.xml
이것은 귀하의 웹사이트를 이미 방문한 크롤러를 물리치지는 못하지만 일반 크롤링이 향후 /images/ 폴더(및 마지막 크롤링 이후의 모든 새 업로드)를 인덱싱하지 못하도록 해야 합니다.
작품 저작권
귀하가 만든 작업에 저작권이 내포되어 있지만 귀하의 작업에 저작권을 부여하는 방법을 찾는 것도 노력할 가치가 있습니다. 미국에서는 Copyright.gov에 작품을 등록하면 됩니다. 하나의 신청서에 최대 10개의 미공개 작품을 제출할 수 있습니다. 작품이 처리되는 데 시간이 걸릴 수 있습니다(현재 약 1년).
저작물에 대한 저작권을 등록하면 법원과 관련된 문제에서 더 많은 다리를 설 수 있습니다. 이것이 Stability AI(Stable Diffusion 개발사, DreamStudio, LAION 자금 제공자), DeviantArt(아티스트를 위한 플랫폼이자 DreamUp 개발사), 영향을 받는 아티스트를 대신하여 생성 예술 앱인 Midjourney를 상대로 제기된 집단 소송의 이면에 있는 아이디어입니다. .
StableDiffusionLitigation.com에서 소송에 대한 모든 내용을 읽을 수 있으며, 귀하의 작업이 이러한 발전기를 교육하는 데 사용되었다고 생각하는 경우 법무팀에 연락하여 집단 소송에 참여할 근거가 있을 수 있습니다. 미국 저작권청에 작품을 등록하도록 신청하는 것은 이 길을 가고자 하는 경우 중요한 첫 번째 단계입니다.
불법복제, 탈옥, 파일 공유와 같이 과거에 변호사들의 관심을 끌었던 다른 관행과 마찬가지로 소송으로 인해 이러한 관행이 완전히 중단될 가능성은 낮습니다. 변호인은 이러한 도구가 공개 웹사이트에서 수집한 "공정한 사용" 자료에 대해 교육을 받았다고 주장할 것입니다. 우리는 이와 같은 소송이 있을 경우 어떤 영향을 미칠지 알아보기 위해 기다려야 할 것입니다.
적극적인 워터마킹
일부 공격적이거나 경계선에 있는 자기 파괴적인 워터마크가 있는 아트워크만 업로드하는 경우 데이터 세트에 포함된 아트워크에 이를 반영합니다. 궁극적으로 이것은 작품이 처음에 업로드되는 이유에 따라 크게 달라집니다. 인터넷의 즐거움을 위해 비상업적으로 예술 작품을 만들고 있다면 이것은 궁극적으로 자멸적인 것처럼 보입니다.
그러나 실제 그림을 판매하고 있고 판매 전에 온라인으로 전시할 수 있는 방법이 필요한 경우 어느 정도 도움이 될 수 있습니다. 그것은 확실히 완성된 작품에서 손상될 것이므로 스스로 고려해야 할 것입니다.
인터넷에 예술을 업로드하지 마십시오
이것은 우스꽝스럽게 들릴 수 있지만 (사실입니다) 귀하의 작품이 처음부터 인터넷에 업로드되지 않았다면 인터넷에 걸려 AI 훈련에 사용될 가능성이 없습니다. 물론 인터넷을 사용하여 작품을 공유하지 않고 예술가로서 생계를 유지하는 것은 거의 불가능할 수 있습니다(특히 디지털 매체에서 작업하는 경우).
음악 작업을 하는 아티스트에게 이것은 불가능한 일입니다. 유화나 수채화와 같은 전통적인 재료로 작업하더라도 누군가가 완성된 작품을 찍어서 직접 업로드할지 여부는 알 수 없습니다.
AI 예술은 저작권이 될 수 있습니까?
제너레이티브 AI의 결과물이 저작권으로 보호될 수 있는지에 대한 질문은 복잡한 문제입니다. 일반적으로 인정되는 한 가지는 예술을 생성하는 데 사용되는 AI 도구가 출력물에 대한 권리를 거의 갖지 않는다는 것입니다.
이것은 Stable Diffusion을 포함한 대부분의 도구의 서비스 약관에 명확하게 명시되어 있습니다.
여기에 명시된 경우를 제외하고 라이선스 허가자는 귀하가 모델을 사용하여 생성한 결과물에 대해 어떠한 권리도 주장하지 않습니다. 귀하는 귀하가 생성한 산출물과 후속 사용에 대해 책임을 집니다. 출력물을 사용하면 라이센스에 명시된 조항을 위반할 수 없습니다.
라이센스는 계속해서 저작권법을 포함하는 "해당 국가, 연방, 주, 지역 또는 국제법 또는 규정을 위반하는" 사용을 금지합니다.
중간 여정:
귀하는 현행법에 따라 가능한 범위 내에서 귀하가 서비스로 생성한 모든 자산을 소유합니다. 이것은 다른 사람의 이미지를 업스케일링하는 것을 제외하며, 이 이미지는 원본 에셋 제작자가 소유하고 있습니다.
그리고 OpenAI(DALL-E 2):
당사자들 사이에서 관련 법률이 허용하는 범위 내에서 귀하는 모든 입력을 소유하고 본 약관을 준수하는 경우 OpenAI는 출력에 대한 모든 권리, 소유권 및 이익을 귀하에게 할당합니다.
그러한 도구로 만든 모든 것에 저작권을 부여하는 측면에서 미국 저작권청은 저작권이 사람이 만든 예술에만 적용된다고 밝혔습니다(독창성과 같은 다른 요구 사항 포함).
인간이 아닌 저자가 있다고 주장하는 경우 항소 법원은 저작권이 주장된 창작물을 보호하지 않는다는 사실을 발견했습니다.
법은 끊임없이 진화하고 있으므로 미래에 성공적으로 이의를 제기할 수 있습니다. 또한 AI 생성기의 제품이 아닌 최종 제품의 요소(예: 줄거리 또는 대화)는 다른 요소(아트워크 또는 음악과 같은)가 저작권이 없는 경우에도 여전히 저작권이 있을 수 있다는 점에 유의할 가치가 있습니다.
AI 아트 제너레이터가 내 저작권이 있는 아트를 사용할 수 있나요?
문제는 AI 생성기가 귀하의 저작권이 있는 아트를 사용할 수 있는지 "할 수 있는지"가 아니라 이미 저작권이 있는 아트를 사용하고 있는지 "하는 것"입니다. 이 질문에 대한 대답은 많은 예술가들이 알아낸 것처럼 '그렇다'입니다. 위에서 우리는 데이터 세트를 옵트아웃하고 크롤러가 콘텐츠를 인덱싱하지 못하도록 하는 몇 가지 방법에 대해 논의했지만 이러한 기술은 궁극적으로 사용자의 기본 설정을 존중하는 책임자에 따라 다릅니다.
HaveIBeenTrained.com을 사용하여 가장 큰 공개 이미지 데이터 세트에 예술이 포함되어 있는지 확인할 수 있습니다. 잘 알려진 작품 중 하나를 업로드하거나 이름, 작품 제목, 웹툰 또는 기타 창작물을 검색하여 살펴보세요. 귀하의 작품이 웹 사이트에 표시되는 경우 귀하의 작품은 Stable Diffusion 및 기타에서 사용하는 데이터 세트에 포함되어 있습니다.
OpenAI의 DALL-E와 같이 사용 중인 데이터 세트를 공개하지 않는 다른 생성 예술 응용 프로그램은 말할 것도 없습니다. "당신의 이름 스타일의 삽화"와 같은 프롬프트를 사용하여 친숙한 항목이 나타나는지 확인할 수 있습니다.
다가오는 도구는 AI 예술 생성기를 패배시키는 데 도움이 될 수 있습니다
제너레이티브 AI가 데이터 세트의 이미지를 기반으로 예술 작품을 재생산하는 것을 어렵게 만들 수 있는 도구의 형태로 아티스트에게 약간의 희망이 있을 수 있습니다. 불행히도 이러한 솔루션은 아직 여기에 없으며(작성 당시) 장기적으로 얼마나 효과적일지 알 수 없습니다. AI 도구는 빠르게 진화하므로 이러한 보호 장치를 우회하도록 진화할 가능성이 있습니다.
첫 번째는 글레이즈(Glaze)로, 작품을 업로드하기 전에 "매우 작은 변화를 추가"하는 시카고 대학의 프로젝트입니다. 개발자는 이러한 변경 사항을 "스타일 망토"라고 부르며 아트웍이 인간의 눈에는 원본과 거의 동일하게 보이지만 AI가 스타일을 다른 스타일로 잘못 해석하게 한다고 지적합니다.
Glaze는 Mac 및 Windows용 애플리케이션으로 출시될 예정이므로 아티스트의 컴퓨터를 떠나지 않고도 아트워크를 "숨길" 수 있습니다. 개발자들은 이 도구를 상용화하지 않을 것이기 때문에 누구나 무료로 사용할 수 있을 것이라고 합니다. Glaze 프로젝트는 이 도구를 "AI 모방에 저항하기 위한 아티스트 중심의 보호 도구를 향한 필요한 첫 단계"로 보고 있습니다.
University of Melbourne의 Pursuit 블로그에 설명된 또 다른 기술은 "AI를 혼란스럽게 하고 '학습할 수 없는' 이미지로 바꾸는 이미지의 충분한 픽셀만 변경하는" 노이즈의 미묘한 사용을 설명합니다. 이 기관은 모델의 약점을 악용하는 기술을 고안했다고 주장하며 Stable Diffusion과 같은 도구를 "게으른 학습자"라고 설명합니다.
이 기술은 시각적 아트워크뿐만 아니라 개인적으로 당신을 식별하는 오디오 및 사진을 포함하여 광범위한 잠재적 용도를 가지고 있습니다. 이러한 기술은 개발 측면에서 아직 초기 단계이므로 이러한 기술이 진정으로 무엇을 할 수 있는지 기다려야 한다는 점을 인식하는 것이 중요합니다.
로봇의 부상
제너레이티브 아트 앱은 순식간에 작품을 만들 수 있지만 인간과 같은 방식으로 진정으로 창의적이지는 않습니다. ChatGPT는 이력서를 작성할 수 있지만 챗봇은 종종 자신있게 틀린 경우가 많기 때문에 신중하게 교정해야 합니다.
결론은 현재 AI 솔루션이 유용할 수 있지만 약하다는 것입니다.