Cum să scrieți un prompt de difuzare stabil uimitor

Publicat: 2022-09-23
O fotografie cu Adirondacks la apus. Sezonul de toamnă. De asemenea, poza a fost creată de Stable Diffusion în aproximativ 18 secunde.
Adirondacks la apus în toamnă. Cu excepția faptului că această imagine este un fals produs în 18,5 secunde.

Stable Diffusion, un popular generator de artă AI, necesită solicitări de text pentru a crea o imagine. Uneori, face o treabă uimitoare și generează exact ceea ce doriți cu un prompt vag. Alteori, obțineți rezultate suboptime. Iată câteva sfaturi și trucuri pentru a obține rezultate ideale.

Cum să scrieți un prompt de difuzare stabilă

Dacă ați petrecut vreun timp cu generatoare de imagini AI, cum ar fi Stable Diffusion, DALL-E sau MidJourney, veți fi observat că un prompt bine formulat este critic. O solicitare bine formulată este diferența dintre a-ți transforma ideea într-o imagine grozavă și a obține o monstruozitate neobișnuită, cu prea multe degete care se uită înapoi la tine.

Cum să rulați Stable Diffusion pe computer pentru a genera imagini AI
LEGATE Cum să rulați Stable Diffusion pe computer pentru a genera imagini AI

Oamenii au încercat să găsească cele mai bune modalități de a obține rezultate ideale de la lansarea Stable Diffusion în august 2022 și vor fi „prompt smithing” sau „prompt engineering” în anii următori. Acest lucru este mai ales probabil că punctele de control care informează modul în care Stable Diffusion generează imagini vor primi actualizări periodice. Promptul ideal va fi o țintă în mișcare pentru viitorul previzibil.

LEGATE: Cele mai bune generatoare de imagini AI pe care le puteți folosi chiar acum

Fii cât de specific poți

Difuziunea stabilă tinde să prospere pe anumite solicitări, mai ales când este comparată cu ceva de genul MidJourney. Trebuie să-i spui exact ce vrei. Iată un exemplu folosind animalele preferate de pe internet: pisici drăguțe.

Un panou de 6 imagini de ieșire din Stable Diffusion folosind promptul „Pisică drăguță”.
Solicitare: „Pisică drăguță”, Sampler = PLMS, CFG = 7, Pași de eșantionare = 50

Bine, sunt destul de drăguți, cu excepția, poate, a bietului tip din mijlocul de sus, care pare că și-a petrecut prea mult timp privind în abis. Dar dacă ai vrea pisici gri, nu un amestec de pisici? Ei bine, trebuie să specificați asta. Folosiți în schimb „Pisici gri drăguțe” ca mesaj.

Un panou de 6 imagini de ieșire de la Stable Diffusion folosind promptul „Pisică gri drăguță”.
Prompt: „Cute Grey Cat”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

Acum Stable Diffusion returnează toate pisicile gri. Puteți continua să adăugați descrieri pentru ceea ce doriți, inclusiv accesorizarea pisicilor din imagini.

Un alt panou de 6 imagini ieșite de la Stable Diffusion folosind promptul „Pisică gri drăguță cu ochi albaștri, purtând un papion”
Solicitare: „Pisică gri drăguță cu ochi albaștri, purtând un papion”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

Acest lucru se aplică pentru orice doriți să producă Stable Diffusion, inclusiv peisajele. Fiți descriptivi și, pe măsură ce încercați diferite combinații de cuvinte cheie, păstrați o notă mentală a modului în care se schimbă imaginea. Unele cuvinte și expresii tind să influențeze o imagine mai puternic decât alte cuvinte, așa că ar putea fi necesar să ajustați promptul în consecință.

Numiți stiluri de artă specifice sau medii

Nevoia de specificitate nu se oprește atunci când descrii pe deplin conținutul imaginii pe care o dorești. Puteți (și ar trebui) să specificați și stilul dorit. Vom rămâne cu promptul nostru „Pisică gri drăguță” pentru asta. Să presupunem că vrem niște pisici gri drăguțe, dar vrem să arate ca și cum ar fi o pictură acrilică. Primul lucru pe care ar trebui să-l încercați este să adăugați „pictură acrilică” ca următorul cuvânt cheie în solicitarea dvs., astfel încât să scrie: „Pisică gri drăguță, pictură acrilică”.

În general, cel mai bine este să începeți cu cele mai puține cuvinte cheie pentru a vă apropia de ceea ce doriți și apoi să adăugați mai multe pentru o estetică pe care o căutați.

6 pisici gri de la Stable Diffusion care arată ca picturi acrilice.
Solicitare: „Cute Grey Cat, pictură acrilică”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

Difuziunea stabilă recunoaște zeci de stiluri diferite, totul, de la desene în creion la modele de lut până la randarea 3D de la Unreal Engine.

Un alt exemplu de pisici gri în stilul „Unreal Engine”.
Solicitare: „Cute Grey Cat, Unreal Engine rendering”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

Aceste exemple de solicitări sunt extrem de simple, dar puteți folosi zeci de cuvinte cheie pentru a vă ajusta rezultatele. Dacă doriți modele ciudate de pui de lut, de culoare psihedelică, într-un Walmart, trebuie să specificați toți acești termeni.

O sculptură ciudată din lut topit a unui pui într-un Walmart.
Prompt: „bust de pui într-un walmart, model de lut, (culori psihedelice), topire, ciudat” Sampler = PLMS, CFG = 7, Sampling Steps = 150

Numiți artiști specifici pentru a ghida difuzarea stabilă

Stable Diffusion este capabilă să facă mai mult decât să emuleze stiluri sau medii specifice; poate chiar imita anumiți artiști dacă doriți să faceți asta. Acest exemplu a folosit Pablo Picasso.

Ar trebui să încercați cu siguranță să introduceți „după (numele artistului)” în solicitări dacă nu ați făcut-o deja. Tinde să producă rezultate dramatice. Nu vă fie teamă să combinați artiști care, în mod normal, nu ar merge împreună. Adesea, Stable Diffusion își va combina stilurile respective în moduri interesante și imprevizibile.

Sfat: Dacă utilizați versiunea GUI a Stable Diffusion pentru Windows, pe care v-am recomandat-o, există un buton „Roll” în partea dreaptă a ferestrei de prompt, care va arunca aleatoriu un artist pe promptul dvs. Este o modalitate excelentă de a te împiedica în stiluri noi.

6 pisici, ca imagini de Stable Diffusion pe care le-ar fi pictat Picasso.

Gândește-ți cuvintele cheie

Desigur, doar introducerea cuvintelor cheie în promptul dvs. vă va duce doar până acum. Ce se întâmplă dacă primiți toate lucrurile potrivite în promptul dvs., dar nu sunt proporționale corespunzător?

Stable Diffusion acceptă ponderarea cuvintelor cheie prompte. Cu alte cuvinte, îi puteți spune că într-adevăr trebuie să acorde atenție unui anumit cuvânt cheie (sau cuvinte cheie) și să acorde mai puțină atenție altora. Este util dacă obții rezultate care sunt cam ceea ce cauți, dar nu chiar acolo.

LEGATE: Cum să rulați Stable Diffusion pe computer pentru a genera imagini AI

În versiunea de linie de comandă a Stable Diffusion, trebuie doar să adăugați două puncte complete urmate de un număr zecimal la cuvântul pe care doriți să-l subliniați. Numerele zecimale sunt procente, deci trebuie să se adună până la 1.

Revenind la promptul nostru „Pisică gri drăguță”, să ne imaginăm că producea corect pisici drăguțe, dar nu foarte multe dintre imaginile de ieșire prezentau pisici gri. În schimb, puteți modifica promptul pentru a citi: „drăguț, pisică gri: 0,7” și ar acorda cea mai mare atenție pisicii gri, apoi ar aplica automat diferența la „drăguț”. De asemenea, puteți atribui manual ponderi fiecărui cuvânt din prompt dacă doriți un control mai fin, cum ar fi „Cute:0.10, Grey Cat:0.60, Unreal Engine rendering:0.30” de exemplu.

LEGATE: Cum să rulați difuzia stabilă local cu o interfață grafică pe Windows

Majoritatea interfețelor grafice disponibile pentru Stable Diffusion gestionează ponderarea fără a fi necesar să introduceți procente explicite. De obicei, puteți adăuga paranteze în jurul unui termen în promptul dvs. pentru a-l sublinia și paranteze pentru a reduce importanța unui termen. Așadar, „pisica drăguță, gri” anterioară ar putea arăta ca „[drăguț],((pisica gri)).”

Notă: puteți folosi mai multe paranteze pentru a pune accentul cât de mult doriți.

Găsiți inspirație în altă parte

Stable Diffusion și alți generatori de artă AI au cunoscut o creștere explozivă a popularității. Puteți găsi acest tip de artă AI peste tot. Asta înseamnă că acum există cel puțin câteva milioane de imagini generate de utilizatori care plutesc pe internet și, de cele mai multe ori, oamenii includ promptul pe care l-au folosit pentru a obține rezultatele.

RELATE: Această galerie de artă AI este chiar mai bună decât utilizarea unui generator

Iată câteva resurse care vă vor ajuta să vă inspirați dacă nu sunteți sigur ce doriți să creați:

Avertisment: Toate acestea sunt potențial NSFW.
  • Lexica — un depozit de imagini generate folosind Stable Diffusion și promptul corespunzător. Căutare după cuvânt cheie.
  • Stable Diffusion Artist Style Studies — O listă neexhaustivă de artiști pe care Stable Diffusion i-ar putea recunoaște, precum și descrieri generale ale stilului lor artistic. Există un sistem de clasare pentru a descrie cât de bine răspunde Stable Diffusion la numele artistului ca parte a unui prompt.
  • Stable Diffusion Modifier Studies — o listă de modificatori care pot fi utilizați cu Stable Diffusion, la fel ca pagina artistului.
  • Lista modificatorilor de artă AI — O galerie foto care prezintă unii dintre cei mai puternici modificatori pe care îi puteți folosi în solicitări și ceea ce fac aceștia. Sunt sortate după tipul de modificator.
  • Top 500 de artiști reprezentați în Stable Diffusion — Știm exact ce imagini au fost incluse în setul de antrenament Stable Diffusion, așa că este posibil să spunem care artiști au contribuit cel mai mult la formarea AI. În general, cu cât un artist a fost mai puternic reprezentat în datele de antrenament, cu atât Stable Diffusion va răspunde mai bine la numele său ca cuvânt cheie.
  • Subreddit-ul Stable Diffusion — Subreddit-ul Stable Diffusion are un flux constant de noi sugestii și descoperiri distractive. Dacă cauți inspirație sau perspectivă, nu poți greși.

Modificați alte setări importante

Un prompt bun este cea mai grea parte a utilizării Stable Diffusion, dar există câteva alte setări care vor schimba dramatic rezultatele.

  • CFG: Determină cât de puternic urmează Difuziunea stabilă solicitarea dvs. Cifrele mai mari au ca rezultat o mai mare aderență la prompt, în timp ce numerele mai mici oferă AI mai multă libertate. Încercați mai întâi să modificați acest lucru.
  • Metoda de eșantionare: modul în care imaginea este rafinată din zgomot în forme recunoscute. Încercați câteva dintre acestea. Euler_a, k_LMS și PLMS par a fi alegeri populare.
  • Pași de eșantionare: de câte ori o imagine va fi eșantionată înainte de a primi un rezultat final. Uneori obții rezultate bune la 30 de pași, uneori trebuie să treci la 50 sau 80. De obicei nu obții rezultate mai bune peste 150 de pași. Începe cu mai puțini pași și urcă.

Unele dintre sugestiile noastre stilizate preferate

Acestea sunt unele dintre indicațiile noastre preferate, deoarece tind să funcționeze atât de fiabil. Introduceți un subiect pe care îl alegeți plus câțiva modificatori. Toate celelalte setări Stable Diffusion au fost păstrate la fel ca cele de mai sus.

Notă: De regulă, Stable Diffusion creează excepțional de bine apusurile și frunzele de cădere.

(Subiect), 35 mm, ascuțit

Alegeți un subiect și acest prompt returnează în mod fiabil rezultate fotorealiste ale oamenilor, animalelor și peisajelor.

Notă: Acest exemplu de prompt a inclus și „Ora de aur” pentru a obține culorile apusului.
Imaginea lui Stable Diffusion asupra Muntelui Katahdin văzut de peste un lac.
Solicitare: fotografie a muntelui Katahdin cu un lac frumos, 35 mm, ascuțit, ora de aur

(Subiect), redare 3d low poly, culori pastel vibrante, deplasare înclinată, granulație a filmului

Introduceți un subiect și îl veți obține în estetica „Art of Rally”.

O mașină foarte colorată.

(Subiect), (Descrierea mediului), cinematografic, dramatic, compoziție, cer însorit, brutalist, hiper realist, scară epică, sentiment de uimire, hipermaximalist, nivel nebun de detalii, artstation HQ

Introduceți doar un subiect și o descriere a mediului, iar acest prompt oferă imagini excelente de artă conceptuală a orașului, cu un efect de mediu pe care îl alegeți. Iată un exemplu folosind New York City ca subiect și furtuna de praf ca descriere a mediului:

O zi cu vreme moderat rea în New York City.
prompt: orașul New York, furtună de praf, cinematografic, dramatic, compoziție, cer însorit, brutalist, hiper realist, scară epică, sentiment de uimire, hipermaximalist, nivel nebun de detalii, artstation HQ

Kermit Orice

Stable Diffusion produce rezultate excelente cu Kermit. Încearcă-l oriunde.

Kermit cu un muppet rău în spate.

De ce așa interpretează Stable Diffusion „Kermit în Mordor” și cine este Kermit-ul roșu care stă în spatele eroului nostru puternic? Nici o idee.

Amintiți-vă, nu vă fie teamă să eliminați ceea ce credeți că ar putea fi un termen cheie din promptul dvs. Anumite cuvinte, cum ar fi „superb”, vor influența puternic cum arată o imagine, chiar dacă nu are un sens precis. Pe măsură ce petreceți mai mult timp cu Stable Diffusion, vă veți simți cum răspunde la anumite cuvinte și veți descoperi rapid că a scrie un prompt bun este o artă în sine.