Jak napisać niesamowity monit o stabilnej dyfuzji
Opublikowany: 2022-09-23Stable Diffusion, popularny generator grafiki AI, wymaga monitów tekstowych, aby utworzyć obraz. Czasami wykonuje niesamowitą pracę i generuje dokładnie to, czego chcesz, z niejasnym monitem. Innym razem otrzymujesz nieoptymalne wyniki. Oto kilka wskazówek i wskazówek, jak uzyskać idealne wyniki.
Jak napisać monit o stabilnej dyfuzji
Jeśli w ogóle spędzałeś czas z generatorami obrazów AI, takimi jak Stable Diffusion, DALL-E lub MidJourney, zauważyłeś, że dobrze sformułowany monit jest krytyczny. Dobrze sformułowana podpowiedź to różnica między przekształceniem swojego pomysłu w świetny obraz, a uzyskaniem jakiejś potworności z niesamowitej doliny z całkowicie zbyt wieloma palcami wpatrzonymi w ciebie.
Ludzie próbują wymyślić najlepsze sposoby na uzyskanie idealnych wyników od czasu premiery Stable Diffusion w sierpniu 2022 roku i będą „szybkim kowalstwem” lub „szybką inżynierią” przez wiele lat. Jest to szczególnie prawdopodobne, ponieważ punkty kontrolne informujące o tym, jak stabilna dyfuzja generuje obrazy, będą okresowo aktualizowane. Idealny monit będzie ruchomym celem w najbliższej przyszłości.
POWIĄZANE: Najlepsze generatory obrazów AI, których możesz teraz użyć
Bądź tak konkretny, jak potrafisz
Stabilna dyfuzja ma tendencję do rozwijania się po określonych podpowiedziach, zwłaszcza w porównaniu z czymś takim jak MidJourney. Musisz mu powiedzieć dokładnie, czego chcesz. Oto przykład wykorzystania ulubionych zwierząt w Internecie: Słodkie koty.
W porządku, są całkiem urocze, może z wyjątkiem biednego faceta na górze, który wygląda, jakby spędził zbyt dużo czasu wpatrując się w otchłań. Ale co, jeśli chcesz szarych kotów, a nie mieszanki kotów? Cóż, musisz to sprecyzować. Zamiast tego użyj opcji „Słodkie szare koty”.
Teraz Stabilna Dyfuzja przywraca wszystkie szare koty. Możesz dodawać opisy tego, co chcesz, w tym ozdabiać koty na zdjęciach.
Odnosi się to do wszystkiego, co chcesz uzyskać dzięki stabilnej dyfuzji, w tym krajobrazów. Bądź opisowy i próbując różnych kombinacji słów kluczowych, pamiętaj o tym, jak zmienia się obraz. Niektóre słowa i wyrażenia mają tendencję do silniejszego zniekształcania obrazu niż inne, więc może być konieczne odpowiednie dostosowanie monitu.
Nazwij określone style lub środki artystyczne
Potrzeba konkretności nie kończy się, gdy w pełni opiszesz treść pożądanego obrazu. Możesz (i powinieneś) również określić styl, który chcesz. W tym celu będziemy trzymać się naszego monitu „Słodki szary kot”. Powiedzmy, że chcemy trochę uroczych szarych kotów, ale chcemy też, żeby wyglądały jak akrylowe obrazy. Pierwszą rzeczą, którą powinieneś spróbować, jest dodanie „malowania akrylowego” jako następnego słowa kluczowego w monicie, aby brzmiało: „Słodki szary kot, malowanie akrylowe”.
Zazwyczaj najlepiej jest zacząć od jak najmniejszej liczby słów kluczowych, aby zbliżyć się do tego, czego chcesz, a następnie dodać więcej do estetyki, której szukasz.
Stabilna dyfuzja rozpoznaje dziesiątki różnych stylów, od rysunków ołówkiem przez modele gliniane po renderowanie 3d z Unreal Engine.
Te przykładowe podpowiedzi są niezwykle proste, ale możesz użyć dziesiątek słów kluczowych, aby dostosować swoje wyniki. Jeśli chcesz dziwnych, glinianych modeli kurczaków w psychodelicznych kolorach w Walmarcie, musisz określić wszystkie te terminy.
Wymień konkretnych artystów, aby poprowadzili stabilną dyfuzję
Stabilna dyfuzja jest w stanie zrobić więcej niż naśladowanie określonych stylów lub mediów; może nawet naśladować konkretnych artystów, jeśli chcesz to zrobić. W tym przykładzie wykorzystał Pablo Picasso.
Zdecydowanie powinieneś spróbować wrzucić „by (nazwa wykonawcy)” do swoich monitów, jeśli jeszcze tego nie zrobiłeś. Ma tendencję do osiągania dramatycznych rezultatów. Nie bój się też łączyć artystów, którzy normalnie by do siebie nie pasowali. Często Stable Diffusion łączy swoje style w ekscytujący i nieprzewidywalny sposób.
Wskazówka: jeśli korzystasz z zalecanej przez nas wersji GUI Stable Diffusion dla systemu Windows, po prawej stronie okna zachęty znajduje się przycisk „Roll”, który losowo wrzuci wykonawcę do monitu. To świetny sposób na poznanie nowych stylów.
Zważ swoje słowa kluczowe
Oczywiście samo zakleszczenie słów kluczowych w wierszu zachęty zaprowadzi Cię tylko do tej pory. Co się stanie, jeśli w wierszu zachęty otrzymasz wszystkie właściwe rzeczy, ale nie są one odpowiednio proporcjonalne?
Stabilna dyfuzja obsługuje ważenie szybkich słów kluczowych. Innymi słowy, możesz powiedzieć, że naprawdę musi zwracać uwagę na określone słowo kluczowe (lub słowa kluczowe) i zwracać mniejszą uwagę na inne. Jest to przydatne, jeśli uzyskujesz wyniki, których szukasz, ale nie do końca.
POWIĄZANE: Jak uruchomić stabilną dyfuzję na komputerze, aby wygenerować obrazy AI?
W wersji stabilnej dyfuzji w wierszu poleceń wystarczy dodać pełny dwukropek, po którym następuje liczba dziesiętna do słowa, które chcesz podkreślić. Liczby dziesiętne są procentami, więc muszą się sumować do 1.
Wracając do naszego monitu „Słodki szary kot”, wyobraźmy sobie, że poprawnie produkował słodkie koty, ale niewiele obrazów wyjściowych zawierało szare koty. Możesz zmienić monit, aby brzmiał: „słodki, szary kot: 0,7”, a największą uwagę zwróciłby szary kot, a następnie automatycznie zastosuje różnicę do „słodki”. Możesz także ręcznie przypisać wagi do każdego słowa w monicie, jeśli chcesz mieć lepszą kontrolę, na przykład „Śliczny:0,10, Szary kot:0,60, Renderowanie Unreal Engine:0,30”.
POWIĄZANE: Jak uruchomić stabilną dyfuzję lokalnie za pomocą GUI w systemie Windows
Większość interfejsów graficznych dostępnych dla ważenia uchwytów stabilnej dyfuzji bez konieczności wprowadzania wyraźnych wartości procentowych. Zwykle możesz dodać nawias wokół hasła w podpowiedzi, aby go podkreślić, oraz nawiasy, aby zmniejszyć jego ważność. Tak więc poprzedni „słodki, szary kot” może wyglądać jak „[słodki],((szary kot)).”
Uwaga: Możesz użyć wielu nawiasów, aby ułożyć nacisk tak bardzo, jak chcesz.
Znajdź inspirację gdzie indziej
Stabilna dyfuzja i inne generatory grafiki AI doświadczyły gwałtownego wzrostu popularności. Tego rodzaju sztukę AI można znaleźć w każdym miejscu. Oznacza to, że obecnie w Internecie krąży co najmniej kilka milionów obrazów generowanych przez użytkowników, a przez większość czasu ludzie dołączają monit, którego użyli, aby uzyskać wyniki.
POWIĄZANE: Ta galeria sztuki AI jest jeszcze lepsza niż użycie generatora
Oto kilka zasobów, które pomogą Ci zainspirować Cię, jeśli nie masz pewności, co chcesz stworzyć:
Ostrzeżenie: wszystkie z nich są potencjalnie NSFW.
- Lexica — repozytorium obrazów wygenerowanych przy użyciu funkcji Stable Diffusion i odpowiedniego monitu. Możliwość wyszukiwania według słowa kluczowego.
- Studia nad stylem artystycznym Stable Diffusion — niewyczerpująca lista artystów, którzy mogą rozpoznać Stable Diffusion, a także ogólny opis ich stylu artystycznego. Istnieje system rankingowy opisujący, jak dobrze Stable Diffusion reaguje na nazwisko artysty w ramach monitu.
- Badania modyfikatorów stabilnego rozpraszania — lista modyfikatorów, których można używać ze stabilnym rozpraszaniem, podobnie jak strona artysty.
- Lista modyfikatorów AI Art — galeria zdjęć prezentująca niektóre z najsilniejszych modyfikatorów, których możesz użyć w swoich monitach, oraz ich działanie. Są posortowane według typu modyfikatora.
- 500 najlepszych artystów reprezentowanych w Stable Diffusion — wiemy dokładnie, jakie obrazy znalazły się w zestawie szkoleniowym Stable Diffusion, dzięki czemu można stwierdzić, którzy artyści wnieśli największy wkład w szkolenie sztucznej inteligencji. Ogólnie rzecz biorąc, im silniej reprezentowany artysta był w danych treningowych, tym lepiej Stable Diffusion będzie odpowiadać na jego nazwisko jako słowo kluczowe.
- Subreddit Stable Diffusion — Subreddit Stable Diffusion ma stały napływ nowych podpowiedzi i zabawnych odkryć. Jeśli szukasz inspiracji lub wglądu, nie możesz się pomylić.
Dostosuj inne ważne ustawienia
Dobry monit jest najtrudniejszą częścią korzystania ze stabilnej dyfuzji, ale istnieje kilka innych ustawień, które radykalnie zmienią wyniki.
- CFG: Określa, jak mocno Stabilna Dyfuzja podąża za podpowiedzią. Wyższe liczby powodują większe przestrzeganie monitu, podczas gdy niższe liczby dają AI większą swobodę. Spróbuj to najpierw poprawić.
- Metoda próbkowania: Jak obraz jest wygładzany z szumu do rozpoznawalnych kształtów. Wypróbuj kilka z nich. Euler_a, k_LMS i PLMS wydają się być popularnymi wyborami.
- Etapy próbkowania: Liczba próbkowań obrazu przed uzyskaniem ostatecznego wyniku. Czasami dobre wyniki osiąga się na 30 krokach, czasami trzeba przejść do 50 lub 80. Zwykle nie osiąga się lepszych wyników powyżej 150 kroków. Zacznij od mniejszej liczby kroków i idź w górę.
Niektóre z naszych ulubionych stylizowanych podpowiedzi
Oto niektóre z naszych ulubionych podpowiedzi, ponieważ działają one tak niezawodnie. Po prostu dodaj wybrany przez siebie temat plus kilka modyfikatorów. Wszystkie inne ustawienia stabilnego rozpraszania pozostały takie same, jak powyższe monity.
Uwaga: Z reguły stabilna dyfuzja wyjątkowo dobrze tworzy zachody słońca i jesienne liście.
(Temat), 35mm, ostry
Wybierz temat, a ten monit niezawodnie zwróci fotorealistyczne wyniki przedstawiające ludzi, zwierzęta i krajobrazy.
Uwaga: ten przykładowy monit zawierał również „Złotą godzinę”, aby uzyskać kolory zachodu słońca.
(Temat), renderowanie 3D low poly, żywe pastelowe kolory, przesunięcie pochylenia, ziarno filmu
Wpisz temat, a otrzymasz go w estetyce „Art of Rally”.
(Temat), (Opis otoczenia), kinowy, dramatyczny, kompozycja, słoneczne niebo, brutalistyczny, hiperrealistyczny, epicka skala, poczucie podziwu, hipermaksymalizacja, szalony poziom szczegółów, siedziba artstation
Wystarczy wpisać temat i opis środowiska, a ten monit zapewni wspaniałe obrazy koncepcyjne miasta z wybranym przez Ciebie efektem środowiskowym. Oto przykład wykorzystania Nowego Jorku jako tematu i burzy piaskowej jako opisu środowiska:
Kermit cokolwiek
Stabilna dyfuzja zapewnia doskonałe rezultaty dzięki Kermitowi. Wypróbuj w dowolnym miejscu.
Dlaczego tak właśnie Stable Diffusion interpretuje „Kermit w Mordorze” i kim jest czerwony, zły Kermit, stojący za naszym dzielnym bohaterem? Brak pomysłu.
Pamiętaj, nie bój się usunąć z monitu tego, co Twoim zdaniem może być kluczowym terminem. Niektóre słowa, takie jak „wspaniały”, będą miały duży wpływ na wygląd obrazu, nawet jeśli nie ma precyzyjnego znaczenia. Spędzając więcej czasu ze stabilną dyfuzją, nauczysz się wyczuwać, jak reaguje na określone słowa, i szybko przekonasz się, że pisanie dobrej zachęty jest sztuką samą w sobie.