Как написать потрясающую стабильную диффузионную подсказку

Опубликовано: 2022-09-23
Фотография Адирондака на закате. Осень. Также картинка была создана Stable Diffusion примерно за 18 секунд.
Адирондак на закате осенью. За исключением того, что это изображение является подделкой, созданной за 18,5 секунды.

Stable Diffusion, популярный генератор искусств на основе искусственного интеллекта, требует текстовых подсказок для создания изображения. Иногда он делает потрясающую работу и генерирует именно то, что вы хотите, с расплывчатой ​​подсказкой. В других случаях вы получаете субоптимальные результаты. Вот несколько советов и приемов для достижения идеальных результатов.

Как написать стабильную диффузионную подсказку

Если вы когда-нибудь работали с генераторами изображений AI, такими как Stable Diffusion, DALL-E или MidJourney, вы заметили, что хорошо сформулированная подсказка имеет решающее значение. Грамотно сформулированная подсказка — это разница между превращением вашей идеи в отличный образ и получением какого-то монстра из сверхъестественной долины с слишком большим количеством пальцев, уставившихся на вас.

Как запустить стабильную диффузию на вашем ПК для создания изображений AI
СВЯЗАННЫЕ С : Как запустить стабильную диффузию на вашем ПК для создания изображений AI

С момента запуска Stable Diffusion в августе 2022 года люди пытались найти наилучшие способы получения идеальных результатов, и в ближайшие годы они будут заниматься «быстрым кузнечным делом» или «быстрым проектированием». Это особенно вероятно, поскольку контрольные точки, информирующие о том, как Stable Diffusion генерирует изображения, будут получать периодические обновления. Идеальная подсказка станет движущейся мишенью в обозримом будущем.

СВЯЗАННЫЕ С: Лучшие генераторы изображений AI, которые вы можете использовать прямо сейчас

Будьте как можно более конкретными

Stable Diffusion имеет тенденцию процветать на определенных подсказках, особенно по сравнению с чем-то вроде MidJourney. Вы должны сказать ему именно то, что вы хотите. Вот пример использования любимых животных в Интернете: Симпатичные кошки.

Панель из 6 выходных изображений из Stable Diffusion с использованием подсказки «Милый котик».
Подсказка: «Милый кот», Sampler = PLMS, CFG = 7, Шаги выборки = 50

Хорошо, они довольно милые, за исключением, может быть, бедняги в верхней середине, который выглядит так, будто провел слишком много времени, глядя в бездну. Но что, если вам нужны серые кошки, а не помесь кошек? Ну, это нужно указать. Вместо этого используйте «Милые серые кошки» в качестве подсказки.

Панель из 6 выходных изображений из Stable Diffusion с использованием подсказки «Милый серый кот».
Подсказка: «Милый серый кот», Sampler = PLMS, CFG = 7, Шаги выборки = 50

Теперь Stable Diffusion возвращает всех серых кошек. Вы можете продолжать добавлять описания того, что вы хотите, включая аксессуары для кошек на картинках.

Еще одна панель из 6 выходных изображений из Stable Diffusion с использованием подсказки «Милый серый кот с голубыми глазами, в галстуке-бабочке».
Подсказка: «Милый серый кот с голубыми глазами, в галстуке-бабочке», сэмплер = PLMS, CFG = 7, шаги сэмплирования = 50

Это относится ко всему, что вы хотите создать с помощью Stable Diffusion, включая пейзажи. Будьте описательными, и когда вы пробуете разные комбинации ключевых слов, мысленно отмечайте, как меняется изображение. Некоторые слова и фразы, как правило, сильнее искажают изображение, чем другие слова, поэтому вам может потребоваться соответствующим образом скорректировать подсказку.

Назовите конкретные художественные стили или средства

Потребность в конкретике не заканчивается, когда вы полностью описываете содержание изображения, которое хотите. Вы можете (и должны) также указать желаемый стиль. Мы будем придерживаться нашей подсказки «Милый серый кот». Допустим, нам нужны милые серые коты, но мы также хотим, чтобы они выглядели так, как будто они написаны акриловыми красками. Первое, что вы должны попробовать, это добавить «акриловая живопись» в качестве следующего ключевого слова в приглашение, чтобы оно звучало так: «Милый серый кот, акриловая живопись».

Как правило, лучше всего начать с наименьшего количества ключевых слов, чтобы приблизиться к тому, что вы хотите, а затем добавить больше, чтобы получить эстетику, которую вы ищете.

6 серых котов от Stable Diffusion, похожих на акриловые картины.
Подсказка: «Милый серый кот, акриловая живопись», сэмплер = PLMS, CFG = 7, шаги сэмплирования = 50

Стабильная диффузия распознает десятки различных стилей, от карандашных рисунков до глиняных моделей и 3D-рендеринга в Unreal Engine.

Еще один пример серых котов в стиле «Unreal Engine».
Подсказка: «Милый серый кот, рендеринг Unreal Engine», сэмплер = PLMS, CFG = 7, шаги сэмплирования = 50

Эти примеры подсказок чрезвычайно просты, но вы можете использовать десятки ключевых слов для точной настройки результатов. Если вам нужны странные глиняные модели кур психоделического цвета в Walmart, вам нужно указать все эти термины.

Странная скульптура курицы из расплавленной глины в магазине Walmart.
Подсказка: «бюст цыпленка в магазине, глиняная модель, (психоделические цвета), плавление, странное» Сэмплер = PLMS, CFG = 7, Шаги сэмплирования = 150

Назовите конкретных исполнителей для стабильного распространения

Stable Diffusion способен не только эмулировать определенные стили или среды; он может даже имитировать конкретных исполнителей, если вы хотите это сделать. Этот пример использовал Пабло Пикассо.

Вы обязательно должны попробовать добавить «от (имя исполнителя)» в свои подсказки, если вы еще этого не сделали. Он имеет тенденцию приводить к драматическим результатам. Не бойтесь объединять артистов, которые обычно не сочетаются друг с другом. Часто Stable Diffusion сочетает соответствующие стили захватывающим и непредсказуемым образом.

Совет: Если вы используете рекомендованную нами версию Stable Diffusion с графическим интерфейсом для Windows, справа от окна подсказки есть кнопка «Переместить», которая случайным образом перебрасывает исполнителя в вашу подсказку. Это отличный способ познакомиться с новыми стилями.

6 кошек, какими их нарисовал бы Пикассо.

Вес ваших ключевых слов

Конечно, просто втиснув ключевые слова в приглашение, вы далеко не продвинетесь. Что произойдет, если вы получите все правильные вещи в подсказке, но они не будут должным образом пропорциональны?

Stable Diffusion поддерживает взвешивание ключевых слов приглашения. Другими словами, вы можете сказать ему, что ему действительно нужно уделять внимание определенному ключевому слову (или ключевым словам) и уделять меньше внимания другим. Это удобно, если вы получаете результаты, которые похожи на то, что вы ищете, но не совсем там.

СВЯЗАННЫЕ С: Как запустить стабильную диффузию на вашем ПК для создания изображений AI

В версии Stable Diffusion для командной строки вы просто добавляете полное двоеточие, а затем десятичное число к слову, которое хотите выделить. Десятичные числа представляют собой проценты, поэтому в сумме они должны давать 1.

Возвращаясь к нашей подсказке «Симпатичный серый кот», давайте представим, что он правильно воспроизводил милых кошек, но не на многих выходных изображениях были серые кошки. Вместо этого вы можете изменить подсказку на «милый, серый кот: 0,7», и он будет уделять больше внимания серому коту, а затем автоматически применит разницу к «милый». Вы также можете назначить вес каждому слову в подсказке вручную, если хотите более точного управления, например, «Милый: 0,10, Серый кот: 0,60, Рендеринг Unreal Engine: 0,30».

СВЯЗАННЫЕ С: Как запустить стабильную диффузию локально с графическим интерфейсом в Windows

Большинство графических интерфейсов, доступных для стабильной диффузии, обрабатывают взвешивание, не требуя ввода явных процентных значений. Обычно вы можете добавить круглые скобки вокруг термина в приглашении, чтобы подчеркнуть его, и скобки, чтобы уменьшить важность термина. Таким образом, предыдущее «милый серый кот» может выглядеть как «[милый],((серый кот)».

Примечание. Вы можете использовать несколько круглых скобок, чтобы расставить акценты так, как вам нужно.

Найдите вдохновение в другом месте

Стабильная диффузия и другие генераторы искусства с искусственным интеллектом пережили взрывной всплеск популярности. Вы можете найти такое искусство ИИ повсюду. Это означает, что в настоящее время в Интернете циркулирует по крайней мере несколько миллионов изображений, созданных пользователями, и в большинстве случаев люди включают подсказку, которую они использовали для получения своих результатов.

СВЯЗАННЫЕ С: Эта художественная галерея AI даже лучше, чем использование генератора

Вот несколько ресурсов, которые помогут вам вдохновиться, если вы не уверены, что хотите создать:

Предупреждение: все это потенциально NSFW.
  • Lexica — репозиторий изображений, сгенерированных с помощью Stable Diffusion и соответствующей подсказки. Доступен поиск по ключевому слову.
  • Stable Diffusion Artist Style Studies — неисчерпывающий список художников, которых Stable Diffusion может распознать, а также общие описания их художественного стиля. Существует система ранжирования, описывающая, насколько хорошо Stable Diffusion реагирует на имя исполнителя в подсказке.
  • Stable Diffusion Modifier Studies — список модификаторов, которые можно использовать со Stable Diffusion, как и на странице исполнителя.
  • Список модификаторов AI Art — фотогалерея, демонстрирующая некоторые из самых сильных модификаторов, которые вы можете использовать в своих подсказках, и то, что они делают. Они отсортированы по типу модификатора.
  • 500 лучших художников, представленных в Stable Diffusion. Мы точно знаем, какие изображения были включены в обучающий набор Stable Diffusion, поэтому можно сказать, какие художники внесли наибольший вклад в обучение ИИ. Вообще говоря, чем больше артист был представлен в обучающих данных, тем лучше Stable Diffusion будет реагировать на его имя как на ключевое слово.
  • Сабреддит Stable Diffusion — сабреддит Stable Diffusion имеет постоянный поток новых подсказок и забавных открытий. Если вы ищете вдохновения или понимания, вы не ошибетесь.

Настройте другие важные параметры

Хорошая подсказка — самая сложная часть использования Stable Diffusion, но есть несколько других настроек, которые кардинально изменят результаты.

  • CFG: Определяет, насколько сильно Stable Diffusion следует вашей подсказке. Более высокие числа приводят к большему следованию подсказке, тогда как более низкие числа дают ИИ больше свободы. Попробуйте настроить это в первую очередь.
  • Метод выборки: как изображение очищается от шума до узнаваемых форм. Попробуйте несколько из них. Euler_a, k_LMS и PLMS кажутся популярными.
  • Шаги выборки: количество раз, когда изображение будет выбрано, прежде чем вы получите окончательный результат. Иногда вы получаете хорошие результаты на 30 шагах, иногда вам нужно перейти на 50 или 80. Обычно вы не получаете лучших результатов после 150 шагов. Начните с меньшего количества шагов и поднимайтесь выше.

Некоторые из наших любимых стилизованных подсказок

Это одни из наших любимых подсказок, поскольку они, как правило, работают очень надежно. Просто добавьте предмет по вашему выбору плюс несколько модификаторов. Все остальные настройки стабильной диффузии остались такими же, как и в приведенных выше подсказках.

Примечание: как правило, Stable Diffusion исключительно хорошо создает закаты и осенние листья.

(Тема), 35 мм, резкий

Выберите тему, и эта подсказка надежно вернет фотореалистичные изображения людей, животных и пейзажей.

Примечание. Этот пример подсказки также включал «Золотой час», чтобы получить цвета заката.
Взгляд Stable Diffusion на гору Катадин, вид со стороны озера.
Подсказка: фотография горы Катадин с красивым озером, 35мм, резкая, золотой час

(Тема), низкополигональная 3D-рендеринг, яркие пастельные тона, сдвиг наклона, зернистость пленки

Введите тему, и вы получите ее в эстетике «Искусство ралли».

Очень красочная машина.

(Тема), (Описание окружения), кинематографичность, драматизм, композиция, солнечное небо, брутализм, гиперреалистичность, эпический масштаб, чувство благоговения, гипермаксимализм, безумный уровень детализации, artstation HQ

Просто введите тему и описание окружающей среды, и эта подсказка предоставит великолепные изображения концепт-арта города с эффектом окружающей среды по вашему выбору. Вот пример использования Нью-Йорка в качестве темы и пыльной бури в качестве описания окружающей среды:

Умеренно плохой погодный день в Нью-Йорке.
подсказка: нью-йорк, пыльная буря, кинематографичность, драматизм, композиция, солнечное небо, бруталист, гиперреалистичность, эпический масштаб, благоговение, гипермаксимализм, безумный уровень детализации, artstation HQ

Кермит

Stable Diffusion дает отличные результаты с Kermit. Попробуйте где угодно.

Кермит со злой куклой позади него.

Почему именно так Stable Diffusion интерпретирует «Кермит в Мордоре» и кто этот красный злой Кермит, стоящий за нашим стойким героем? Без понятия.

Помните, не бойтесь удалять то, что, по вашему мнению, может быть ключевым термином из вашей подсказки. Некоторые слова, такие как «великолепный», сильно влияют на то, как выглядит изображение, даже если оно не имеет точного значения. По мере того, как вы будете проводить больше времени со Stable Diffusion, вы почувствуете, как он реагирует на определенные слова, и быстро обнаружите, что написание хорошей подсказки — это само по себе искусство.