굉장하고 안정적인 확산 프롬프트를 작성하는 방법

게시 됨: 2022-09-23
석양에 Adirondacks의 사진입니다. 가을 시즌. 또한 스테이블 디퓨전으로 약 18초 만에 사진이 만들어졌다.
가을 동안 일몰에 Adirondacks입니다. 이 이미지는 18.5초 만에 제작된 가짜입니다.

인기 있는 AI 아트 생성기인 Stable Diffusion은 이미지를 만들기 위해 텍스트 프롬프트가 필요합니다. 때로는 놀라운 작업을 수행하고 모호한 프롬프트로 원하는 것을 정확하게 생성합니다. 다른 경우에는 차선의 출력을 얻습니다. 다음은 이상적인 결과를 얻기 위한 몇 가지 팁과 요령입니다.

안정적인 확산 프롬프트를 작성하는 방법

Stable Diffusion, DALL-E 또는 MidJourney와 같은 AI 이미지 생성기로 시간을 보낸 적이 있다면 잘 구성된 프롬프트가 중요하다는 것을 알아차렸을 것입니다. 적절한 단어로 된 프롬프트는 아이디어를 멋진 이미지로 바꾸는 것과 너무 많은 손가락이 당신을 응시하는 기이한 계곡 괴물을 얻는 것의 차이입니다.

AI 이미지를 생성하기 위해 PC에서 안정적인 확산을 실행하는 방법
관련 AI 이미지를 생성하기 위해 PC에서 안정적인 확산을 실행하는 방법

사람들은 2022년 8월에 Stable Diffusion이 출시된 이후로 이상적인 결과를 얻을 수 있는 최선의 방법을 찾기 위해 노력해 왔으며 앞으로 몇 년 동안 "즉시 제작" 또는 "신속한 엔지니어링"이 될 것입니다. Stable Diffusion이 이미지를 생성하는 방법을 알려주는 체크포인트가 주기적으로 업데이트되기 때문에 특히 그렇습니다. 이상적인 프롬프트는 가까운 미래에 움직이는 표적이 될 것입니다.

관련: 지금 사용할 수 있는 최고의 AI 이미지 생성기

최대한 구체적으로 작성

안정적인 확산은 특히 MidJourney와 비교할 때 특정 프롬프트에서 번창하는 경향이 있습니다. 원하는 것을 정확히 말해야 합니다. 다음은 인터넷에서 가장 좋아하는 동물인 귀여운 고양이를 사용한 예입니다.

"Cute cat" 프롬프트를 사용하는 Stable Diffusion의 6개 출력 이미지 패널.
프롬프트: "귀여운 고양이", 샘플러 = PLMS, CFG = 7, 샘플링 단계 = 50

좋아, 그들은 심연을 응시하는 데 너무 많은 시간을 보낸 것처럼 보이는 중간 상단의 불쌍한 사람을 제외하고는 꽤 귀엽습니다. 그러나 당신이 고양이의 믹스가 아닌 회색 고양이를 원한다면 어떻게 될까요? 글쎄, 당신은 그것을 지정해야합니다. 대신 "귀여운 회색 고양이"를 프롬프트로 사용하십시오.

"귀여운 회색 고양이"라는 프롬프트를 사용하는 Stable Diffusion의 6개 출력 이미지 패널.
프롬프트: "귀여운 회색 고양이", 샘플러 = PLMS, CFG = 7, 샘플링 단계 = 50

이제 안정적인 확산은 모든 회색 고양이를 반환합니다. 사진 속 고양이 장식을 포함하여 원하는 것에 대한 설명을 계속 추가할 수 있습니다.

"푸른 눈을 가진 귀여운 회색 고양이, 나비 넥타이를 착용한 귀여운 회색 고양이"라는 프롬프트를 사용하는 Stable Diffusion의 6개 출력 이미지의 또 다른 패널
프롬프트: "푸른 눈을 가진 귀여운 회색 고양이, 나비 넥타이 착용", 샘플러 = PLMS, CFG = 7, 샘플링 단계 = 50

이것은 풍경을 포함하여 Stable Diffusion으로 생성하려는 모든 것에 적용됩니다. 설명을 하고 다양한 키워드 조합을 시도할 때 이미지가 어떻게 변하는지 염두에 두십시오. 일부 단어와 구는 다른 단어보다 이미지를 더 강하게 편향시키는 경향이 있으므로 그에 따라 프롬프트를 조정해야 할 수도 있습니다.

특정 예술 스타일 또는 매체 이름 지정

원하는 이미지의 내용을 충분히 설명한다고 해서 구체성의 필요성이 끝나는 것은 아닙니다. 원하는 스타일을 지정할 수도 있습니다. 이를 위해 "Cute gray cat" 프롬프트를 계속 사용할 것입니다. 귀여운 회색 고양이를 원하지만 아크릴 그림처럼 보이기를 원한다고 가정해 보겠습니다. 가장 먼저 시도해야 할 것은 프롬프트의 다음 키워드로 "아크릴 페인팅"을 추가하여 "귀여운 회색 고양이, 아크릴 페인팅"이 되도록 하는 것입니다.

일반적으로 가장 적은 수의 키워드로 시작하여 원하는 것에 근접한 다음 찾고 있는 미학에 더 많이 추가하는 것이 가장 좋습니다.

아크릴 그림처럼 보이는 Stable Diffusion의 회색 고양이 6마리.
프롬프트: "귀여운 회색 고양이, 아크릴 페인팅", 샘플러 = PLMS, CFG = 7, 샘플링 단계 = 50

안정적인 확산은 연필 드로잉에서 클레이 모델, Unreal Engine의 3D 렌더링에 이르기까지 다양한 스타일을 인식합니다.

"Unreal Engine" 스타일의 회색 고양이의 또 다른 예.
프롬프트: "귀여운 회색 고양이, 언리얼 엔진 렌더링", 샘플러 = PLMS, CFG = 7, 샘플링 단계 = 50

이러한 예제 프롬프트는 매우 간단하지만 수십 개의 키워드를 사용하여 결과를 미세 조정할 수 있습니다. Walmart에서 이상하고 환각적인 색상의 점토 치킨 모델을 원하는 경우 해당 용어를 모두 지정해야 합니다.

월마트에 있는 닭의 이상한 녹은 점토 조각.
프롬프트: "월마트의 닭 흉상, 점토 모델, (사이키델릭 색상), 녹는, 이상한" 샘플러 = PLMS, CFG = 7, 샘플링 단계 = 150

안정적인 보급을 위한 특정 아티스트 이름 지정

안정적인 확산은 특정 스타일이나 매체를 모방하는 것 이상을 수행할 수 있습니다. 원하는 경우 특정 아티스트를 모방할 수도 있습니다. 이 예제에서는 Pablo Picasso를 사용했습니다.

프롬프트에 "by (아티스트 이름)"을 아직 입력하지 않은 경우 반드시 입력해야 합니다. 극적인 결과를 낳는 경향이 있습니다. 평소에는 어울리지 않는 아티스트들도 함께 하는 것을 두려워하지 마세요. 종종 Stable Diffusion은 흥미롭고 예측할 수 없는 방식으로 각자의 스타일을 결합합니다.

팁: 권장하는 Windows용 Stable Diffusion의 GUI 버전을 사용하는 경우 프롬프트 창 오른쪽에 "롤" 버튼이 있어 무작위로 아티스트를 프롬프트에 표시합니다. 새로운 스타일을 접할 수 있는 좋은 방법입니다.

6마리의 고양이, Stable Diffusion 이미지로 Picasso가 그렸을 것입니다.

키워드에 가중치 부여

물론 프롬프트에 키워드를 삽입하는 것만으로도 충분합니다. 프롬프트에 올바른 항목이 모두 표시되지만 비율이 적절하지 않은 경우 어떻게 됩니까?

안정적인 확산은 프롬프트 키워드의 가중치를 지원합니다. 즉, 정말 특정 키워드(또는 키워드)에 주의를 기울여야 하고 다른 키워드에는 덜 주의해야 한다고 말할 수 있습니다. 당신이 찾고 있는 것과 같은 결과를 얻을 때 편리하지만 거기에는 미치지 못합니다.

관련: AI 이미지를 생성하기 위해 PC에서 안정적인 확산을 실행하는 방법

Stable Diffusion의 명령줄 버전에서는 강조하려는 단어에 전체 콜론 다음에 10진수를 추가하기만 하면 됩니다. 십진수는 백분율이므로 더하여 1이 되어야 합니다.

"귀여운 회색 고양이" 프롬프트로 돌아가서 귀여운 고양이를 올바르게 생성하고 있지만 출력 이미지 중 회색 고양이가 나오는 이미지는 많지 않다고 가정해 보겠습니다. 대신 "cute, gray cat:0.7"을 읽도록 프롬프트를 수정할 수 있습니다. 그러면 회색 고양이에 가장 많은 주의를 기울인 다음 자동으로 그 차이를 "cute"에 적용합니다. 예를 들어 "Cute:0.10, Gray Cat:0.60, Unreal Engine rendering:0.30"과 같이 더 세밀하게 제어하려면 프롬프트의 각 단어에 수동으로 가중치를 할당할 수도 있습니다.

관련: Windows에서 GUI를 사용하여 로컬에서 안정적인 확산을 실행하는 방법

Stable Diffusion에 사용할 수 있는 대부분의 GUI는 명시적인 백분율을 입력하지 않고도 가중치를 처리합니다. 일반적으로 프롬프트에서 용어를 강조하기 위해 괄호를 추가하고 용어의 중요성을 줄이기 위해 괄호를 추가할 수 있습니다. 따라서 이전 "cute, gray cat"은 "[cute],((grey cat))"처럼 보일 수 있습니다.

참고: 여러 개의 괄호를 사용하여 원하는 만큼 강조를 누적할 수 있습니다.

다른 곳에서 영감 찾기

Stable Diffusion 및 기타 AI 아트 생성기는 폭발적인 인기를 얻었습니다. 이런 종류의 AI 예술은 어디에서나 찾을 수 있습니다. 이는 현재 인터넷에 떠도는 사용자 생성 이미지가 최소한 수백만 개 있다는 것을 의미하며 대부분의 경우 사람들은 결과를 얻기 위해 사용한 프롬프트를 포함합니다.

관련: 이 AI 아트 갤러리는 발전기를 사용하는 것보다 훨씬 낫습니다.

만들고자 하는 것이 확실하지 않은 경우 영감을 주는 데 도움이 되는 몇 가지 리소스는 다음과 같습니다.

경고: 이들 모두는 잠재적으로 NSFW입니다.
  • Lexica — Stable Diffusion 및 해당 프롬프트를 사용하여 생성된 이미지 저장소입니다. 키워드로 검색 가능합니다.
  • Stable Diffusion 아티스트 스타일 연구 — Stable Diffusion이 인식할 수 있는 아티스트의 전체 목록과 그들의 예술적 스타일에 대한 일반적인 설명입니다. Stable Diffusion이 프롬프트의 일부로 아티스트의 이름에 얼마나 잘 반응하는지를 설명하는 순위 시스템이 있습니다.
  • Stable Diffusion Modifier Studies — 아티스트 페이지와 마찬가지로 Stable Diffusion과 함께 사용할 수 있는 수정자 목록입니다.
  • AI Art Modifiers List — 프롬프트에서 사용할 수 있는 가장 강력한 수정자와 그 기능을 보여주는 사진 갤러리입니다. 수정자 유형별로 정렬됩니다.
  • Stable Diffusion에 대표되는 상위 500명의 아티스트 — Stable Diffusion 교육 세트에 어떤 이미지가 포함되었는지 정확히 알고 있으므로 AI 교육에 가장 많이 기여한 아티스트를 알 수 있습니다. 일반적으로 교육 데이터에서 아티스트가 더 강력하게 대표될수록 더 나은 Stable Diffusion이 아티스트 이름에 키워드로 응답합니다.
  • Stable Diffusion Subreddit — Stable Diffusion 하위 레딧에는 끊임없이 새로운 프롬프트와 재미있는 발견이 있습니다. 영감이나 통찰력을 찾고 있다면 잘못될 수 없습니다.

기타 중요한 설정 조정

좋은 프롬프트는 안정적인 확산을 사용하는 데 있어 가장 어려운 부분이지만 결과를 극적으로 변경하는 몇 가지 다른 설정이 있습니다.

  • CFG: Stable Diffusion이 프롬프트를 얼마나 강하게 따르는지 결정합니다. 숫자가 높을수록 프롬프트를 더 많이 따르고 숫자가 낮을수록 AI에 더 많은 자유를 줍니다. 이것을 먼저 조정해 보십시오.
  • 샘플링 방법: 이미지가 노이즈에서 인식 가능한 모양으로 정제되는 방법. 이 중 몇 가지를 시도해 보십시오. Euler_a, k_LMS 및 PLMS가 인기 있는 선택인 것 같습니다.
  • 샘플링 단계: 최종 결과가 제공되기 전에 이미지가 샘플링되는 횟수입니다. 30단계에서 좋은 결과를 얻을 때도 있고 50이나 80단계로 가야 할 때도 있습니다. 일반적으로 150단계 이상에서는 더 나은 결과를 얻지 못합니다. 더 적은 단계로 시작하여 위로 올라갑니다.

우리가 가장 좋아하는 양식화된 프롬프트 중 일부

이들은 매우 안정적으로 작동하는 경향이 있기 때문에 우리가 가장 좋아하는 프롬프트 중 일부입니다. 선택한 주제와 몇 가지 수정자를 추가하기만 하면 됩니다. 다른 모든 안정적인 확산 설정은 위의 프롬프트와 동일하게 유지되었습니다.

참고: 일반적으로 안정적인 확산은 일몰과 단풍을 매우 잘 만듭니다.

(피사체), 35mm, 샤프

피사체를 선택하면 이 프롬프트는 사람, 동물 및 풍경의 사실적인 결과를 안정적으로 반환합니다.

참고: 이 예제 프롬프트에는 일몰 색상을 얻기 위한 "골든 아워"도 포함되어 있습니다.
호수 건너편에서 본 Mount Katahdin에 대한 Stable Diffusion의 테이크.
프롬프트: 아름다운 호수가 있는 카타딘 산의 사진, 35mm, 샤프, 골든 아워

(제목), 로우 폴리 3d 렌더, 생생한 파스텔 색상, 틸트 시프트, 필름 그레인

주제를 입력하면 "Art of Rally" 미학에서 얻을 수 있습니다.

매우 다채로운 자동차.

(주제), (환경 설명), 시네마틱, 드라마틱, 구도, 맑은 하늘, 브루탈리스트, 하이퍼 리얼리즘, 서사적 스케일, 경외감, 하이퍼 맥시멀리스트, 미친 수준의 디테일, artstation HQ

주제와 환경 설명을 입력하면 이 프롬프트는 선택한 환경 효과가 있는 멋진 도시 컨셉 아트 이미지를 제공합니다. 다음은 뉴욕시를 주제로 사용하고 먼지 폭풍을 환경 설명으로 사용한 예입니다.

뉴욕시의 적당히 나쁜 날씨의 날.
프롬프트: 뉴욕시, 먼지 폭풍, 영화의, 극적인, 구성, 맑은 하늘, 야만적 인, 초현실적 인, 서사시 규모, 경외감, 극대 주의자, 미친 수준의 세부 사항, artstation HQ

무엇이든 커밋

안정적인 확산은 Kermit으로 훌륭한 결과를 만들어냅니다. 어디에서나 사용해 보세요.

뒤에 사악한 머펫이 있는 커밋.

Stable Diffusion이 "Kermit in Mordor"를 해석하는 이유는 무엇이며, 우리의 충실한 영웅 뒤에 서 있는 붉은 악마-Kermit-thing은 누구입니까? 몰라요.

프롬프트에서 핵심 용어라고 생각되는 것을 제거하는 것을 두려워하지 마십시오. "화려한"과 같은 특정 단어는 정확한 의미가 없더라도 이미지가 어떻게 보이는지에 큰 영향을 미칩니다. Stable Diffusion을 사용하는 데 더 많은 시간을 할애하면 특정 단어에 어떻게 반응하는지에 대한 감각이 개발되고 좋은 프롬프트를 작성하는 것 자체가 예술이라는 것을 빨리 알게 될 것입니다.