如何寫出令人敬畏的穩定擴散提示

已發表: 2022-09-23
日落時的阿迪朗達克山脈照片。金秋時節。此外,這張照片是由 Stable Diffusion 在大約 18 秒內創建的。
秋季日落時的阿迪朗達克山脈。 除了這張圖片是在 18.5 秒內生成的假貨。

流行的 AI 藝術生成器 Stable Diffusion 需要文字提示來製作圖像。 有時它會做得非常出色,並通過模糊的提示準確地生成您想要的內容。 其他時候,你會得到次優的輸出。 以下是獲得理想結果的一些提示和技巧。

如何編寫穩定的擴散提示

如果您曾經使用過 AI 圖像生成器,例如 Stable Diffusion、DALL-E 或 MidJourney,您會注意到措辭恰當的提示至關重要。 一個措辭得當的提示是把你的想法變成一個偉大的形象和得到一些不可思議的山谷怪物之間的區別,用太多的手指盯著你。

如何在您的 PC 上運行穩定的擴散以生成 AI 圖像
相關如何在您的 PC 上運行穩定的擴散以生成 AI 圖像

自 2022 年 8 月 Stable Diffusion 推出以來,人們一直在努力尋找獲得理想結果的最佳方法,並且在未來幾年內,它們將是“快速鍛造”或“快速工程”。 這尤其有可能是因為通知穩定擴散如何生成圖像的檢查點將收到定期更新。 在可預見的未來,理想的提示將成為一個移動的目標。

相關:您現在可以使用的最佳 AI 圖像生成器

盡可能具體

穩定擴散往往會在特定提示下茁壯成長,尤其是與 MidJourney 之類的東西相比時。 你需要準確地告訴它你想要什麼。 這是一個使用互聯網上最喜歡的動物的例子:可愛的貓。

使用提示“Cute cat”從 Stable Diffusion 輸出的 6 張圖像面板。
提示:“Cute Cat”,Sampler = PLMS,CFG = 7,Sampling Steps = 50

好吧,他們很可愛,除了中上層的那個可憐的傢伙,看起來他花了太多時間盯著深淵。 但是如果你想要灰貓,而不是混合貓呢? 好吧,您需要指定它。 改為使用“可愛的灰貓”作為提示。

使用提示“可愛的灰貓”,來自穩定擴散的 6 個輸出圖像的面板。
提示:“可愛的灰貓”,Sampler = PLMS,CFG = 7,Sampling Steps = 50

現在穩定擴散返回所有灰貓。 你可以繼續添加你想要的東西的描述,包括裝飾圖片中的貓。

另一組 6 個來自穩定擴散的輸出圖像,使用提示“藍眼睛的可愛灰貓,戴著領結”
提示:“可愛的藍眼睛灰貓,戴著領結”,Sampler = PLMS,CFG = 7,Sampling Steps = 50

這適用於您希望穩定擴散產生的任何東西,包括風景。 具有描述性,當您嘗試不同的關鍵字組合時,請記住圖像的變化方式。 某些單詞和短語往往比其他單詞更強烈地偏向圖像,因此您可能需要相應地調整提示。

命名特定的藝術風格或媒介

當您完全描述所需圖像的內容時,對特異性的需求並沒有結束。 您可以(也應該)指定您想要的樣式。 為此,我們將堅持使用“可愛的灰貓”提示。 假設我們想要一些可愛的灰貓,但我們也希望它們看起來像是一幅丙烯畫。 您應該嘗試的第一件事是在提示中添加“丙烯畫”作為下一個關鍵字,因此它會顯示為:“可愛的灰貓,丙烯畫”。

通常最好從最少的關鍵字開始以接近您想要的內容,然後根據您正在尋找的美學添加更多內容。

6 只來自 Stable Diffusion 的灰貓,看起來像丙烯畫。
提示:“可愛的灰貓,丙烯畫”,Sampler = PLMS,CFG = 7,Sampling Steps = 50

穩定的擴散可識別數十種不同的風格,從鉛筆劃到粘土模型再到虛幻引擎的 3d 渲染。

“虛幻引擎”風格的灰貓的另一個例子。
提示:“可愛的灰貓,虛幻引擎渲染”,Sampler = PLMS,CFG = 7,Sampling Steps = 50

這些示例提示非常簡單,但您可以使用數十個關鍵字來微調您的結果。 如果你想在沃爾瑪找到奇怪的、迷幻色的粘土雞模型,你需要指定所有這些術語。

沃爾瑪超市裡一隻奇怪的融化的雞泥塑。
提示:“沃爾瑪的雞胸圍,粘土模型,(迷幻色彩),融化,怪異” 採樣器 = PLMS,CFG = 7,採樣步驟 = 150

指定特定藝術家來指導穩定擴散

Stable Diffusion 不僅僅能夠模仿特定的風格或媒介; 如果您想這樣做,它甚至可以模仿特定的藝術家。 這個例子使用了畢加索。

如果您還沒有的話,您絕對應該嘗試在提示中輸入“by (Artist Name)”。 它往往會產生戲劇性的結果。 也不要害怕將通常不會在一起的藝術家組合在一起。 通常,Stable Diffusion 會以令人興奮和不可預測的方式結合各自的風格。

提示:如果您使用我們推薦的用於 Windows 的穩定擴散的 GUI 版本,提示窗口右側有一個“滾動”按鈕,它將隨機將藝術家扔到您的提示中。 這是偶然發現新風格的好方法。

6 隻貓,作為畢加索畫的穩定擴散圖像。

加權您的關鍵字

當然,僅僅在提示中加入關鍵詞只會讓你走得更遠。 如果你在提示中得到了所有正確的東西,但它們的比例不正確,會發生什麼?

穩定擴散支持提示關鍵字的加權。 換句話說,你可以告訴它,它確實需要關註一個特定的關鍵字(或多個關鍵字),而對其他人的關注較少。 如果你得到的結果有點像你想要的,但並不完全在那裡,這很方便。

相關:如何在您的 PC 上運行穩定的擴散以生成 AI 圖像

在 Stable Diffusion 的命令行版本中,您只需在要強調的單詞後面添加一個完整的冒號和一個十進制數字。 十進制數是百分比,因此它們必須加起來為 1。

回到我們的“Cute gray cat”提示,讓我們想像它正確地生成了可愛的貓,但輸出圖像中沒有很多以灰貓為特徵。 您可以將提示改為:“可愛,灰貓:0.7”,它會最關注灰貓,然後自動將差異應用於“可愛”。 如果您想要更精細的控制,您還可以手動為提示中的每個單詞分配權重,例如“可愛:0.10,灰貓:0.60,虛幻引擎渲染:0.30”。

相關:如何在 Windows 上使用 GUI 在本地運行穩定的擴散

大多數可用於穩定擴散的 GUI 無需您輸入明確的百分比即可處理權重。 您通常可以在提示中的術語周圍添加括號以強調它,並在括號中添加括號以降低術語的重要性。 所以之前的“可愛的灰貓”可能看起來像“[可愛],((灰貓))”。

注意:您可以根據需要使用多個括號來疊加重點。

在別處尋找靈感

Stable Diffusion 和其他 AI 藝術生成器的人氣激增。 你可以在任何地方找到這種人工智能藝術。 這意味著現在至少有幾百萬用戶生成的圖像在互聯網上流傳,而且大多數時候,人們包括他們用來獲得結果的提示。

相關:這個人工智能藝術畫廊甚至比使用發電機更好

如果您不確定要創建什麼,這裡有一些資源可以幫助激發您的靈感:

警告:所有這些都可能是 NSFW。
  • Lexica — 使用 Stable Diffusion 和相應提示生成的圖像存儲庫。 可按關鍵字搜索。
  • 穩定擴散藝術家風格研究——穩定擴散可能認可的藝術家的非詳盡列表,以及對他們藝術風格的一般描述。 有一個排名系統來描述作為提示的一部分,Stable Diffusion 對藝術家姓名的響應程度。
  • Stable Diffusion Modifier Studies — 可與穩定擴散一起使用的修飾符列表,就像藝術家頁面一樣。
  • AI 藝術修飾符列表——一個照片庫,展示了您可以在提示中使用的一些最強大的修飾符,以及它們的作用。 它們按修飾符類型排序。
  • 穩定擴散中代表的前 500 位藝術家——我們確切地知道穩定擴散訓練集中包含哪些圖像,因此可以判斷哪些藝術家對人工智能的訓練貢獻最大。 一般來說,藝術家在訓練數據中的表現越強,Stable Diffusion 對他們的名字作為關鍵詞的響應就越好。
  • The Stable Diffusion Subreddit — The Stable Diffusion subreddit 有源源不斷的新提示和有趣的發現。 如果您正在尋找靈感或洞察力,那麼您就不會出錯。

調整其他重要設置

一個好的提示是使用穩定擴散最難的部分,但還有一些其他設置會極大地改變結果。

  • CFG:確定 Stable Diffusion 遵循提示的強度。 數字越大,對提示的依從性越高,而數字越小,人工智能就越自由。 先試著調整一下。
  • 採樣方法:如何將圖像從噪聲中提煉成可識別的形狀。 嘗試其中一些。 Euler_a、k_LMS 和 PLMS 似乎是流行的選擇。
  • 採樣步驟:在您獲得最終結果之前對圖像進行採樣的次數。 有時你在 30 步就能得到好的結果,有時你需要達到 50 或 80 步。你通常不會在 150 步以上得到更好的結果。 從更少的步驟開始,然後向上。

我們最喜歡的一些風格化提示

這些是我們最喜歡的一些提示,因為它們往往工作得如此可靠。 只需放入您選擇的主題和一些修飾符即可。 所有其他穩定擴散設置與上面的提示保持相同。

注意:作為一項規則,Stable Diffusion 可以非常好地創建日落和落葉。

(主題), 35mm, 鋒利

選擇一個主題,此提示會可靠地返回人物、動物和風景的逼真結果。

注意:此示例提示還包括獲取日落顏色的“黃金時段”。
從湖對面看,Stable Diffusion 拍攝的卡塔丁山。
提示:卡塔丁山與美麗湖泊的照片,35 毫米,銳利,黃金時段

(主題)、低多邊形 3D 渲染、鮮豔柔和的色彩、傾斜移位、膠片顆粒

輸入一個主題,您將獲得“拉力賽藝術”美學。

一輛色彩斑斕的汽車。

(主題),(環境描述),電影,戲劇,構圖,晴朗的天空,野獸派,超現實主義,史詩規模,敬畏感,超極端主義,瘋狂的細節水平,藝術站總部

只需輸入主題和環境描述,此提示就會提供具有您選擇的環境效果的出色城市概念藝術圖像。 這是一個以紐約市為主題,沙塵暴為環境描述的示例:

紐約市天氣中度惡劣的一天。
提示:紐約市,沙塵暴,電影,戲劇,構圖,晴朗的天空,野獸派,超現實主義,史詩般的規模,敬畏感,超極端主義,瘋狂的細節水平,artstation HQ

克米特任何東西

使用 Kermit,Stable Diffusion 會產生很好的效果。 在任何地方嘗試一下。

柯米特身後有一個邪惡的布偶。

為什麼 Stable Diffusion 會這樣解釋“Kermit in Mordor”,而站在我們堅定英雄背後的紅色邪惡 Kermit 又是誰? 不知道。

請記住,不要害怕從提示中刪除您認為可能是關鍵術語的內容。 某些詞,例如“華麗”,將嚴重影響圖像的外觀,即使它沒有精確的含義。 隨著您在 Stable Diffusion 上花費更多時間,您將了解它如何響應某些單詞,並且您很快會發現編寫一個好的提示本身就是一門藝術。