如何在您的 PC 上運行穩定的擴散以生成 AI 圖像

已發表: 2022-09-10

AI 生成的魔法地鼠、藝術埃及禿鷹和沙漠上空的戲劇性月升。標題圖片。

人工智能 (AI) 藝術目前風靡一時,但大多數 AI 圖像生成器都在雲端運行。 Stable Diffusion 則不同——您可以在自己的 PC 上運行它並生成任意數量的圖像。 以下是在 Windows 上安裝和使用 Stable Diffusion 的方法。

目錄

什麼是穩定擴散?
在 PC 上運行穩定的擴散需要什麼?
如何在 Windows 上安裝和運行穩定的 Diffusion
安裝 Git
安裝 Miniconda3
下載 Stable Diffusion GitHub 存儲庫和最新的檢查點
如何使用穩定擴散
如何製作具有穩定擴散的圖像
命令中的參數是什麼意思?

什麼是穩定擴散?

Stable Diffusion 是一種開源機器學習模型,可以從文本生成圖像,根據文本修改圖像,或者在低分辨率或低細節的圖像上填充細節。 它已經對數十億張圖像進行了訓練,並且可以產生與 DALL-E 2 和 MidJourney 所獲得的結果相當的結果。 它由 Stability AI 開發,於 2022 年 8 月 22 日首次公開發布。

如何使用 Midjourney 創建合成 AI 藝術
相關如何使用 Midjourney 創建合成 AI 藝術

Stable Diffusion 還沒有像某些 AI 圖像生成器那樣整潔的用戶界面,但它有一個非常寬鬆的許可證,而且——最重要的是——它完全可以在你自己的 PC(或 Mac)上免費使用。

不要被 Stable Diffusion 當前在命令行界面 (CLI) 中運行的事實嚇倒。 啟動並運行它非常簡單。 如果您可以雙擊一個可執行文件並在一個框中鍵入,您可以在幾分鐘內運行它。

在 PC 上運行穩定的擴散需要什麼?

Stable Diffusion 不會在您的手機或大多數筆記本電腦上運行,但它將在 2022 年在普通遊戲 PC 上運行。以下是要求:

  • 具有至少6 GB 顯存的 GPU
    • 這包括大多數現代 NVIDIA GPU
  • 硬盤驅動器或固態驅動器上 10GB (ish) 的存儲空間
  • Miniconda3 安裝程序
  • 來自 GitHub 的穩定擴散文件
  • 最新的檢查點(1.4 版,截至撰寫本文時,但 1.5 版應該很快發布)
  • Git 安裝程序
  • Windows 8、10 或 11
    • Stable Diffusion 也可以在 Linux 和 macOS 上運行

如何在 Windows 上安裝和運行穩定的 Diffusion

您需要兩個軟件:Git 和 Miniconda3。

注意: Git 和 Miniconda3 都是由知名組織製作的安全程序。 只要您從本文中鏈接的官方來源下載它們,您就不必擔心它們的惡意軟件。

安裝 Git

Git 是一種工具,允許開發人員管理他們正在開發的軟件的不同版本。 他們可以同時在中央存儲庫中維護他們正在開發的軟件的多個版本,並允許其他開發人員為項目做出貢獻。

相關:什麼是 GitHub,它的用途是什麼?

如果您不是開發人員,Git 提供了一種方便的方式來訪問和下載這些項目,這就是我們在這種情況下將使用它的方式。 從 Git 網站下載 Windows x64 安裝程序,然後運行它。

在安裝程序運行時,系統會提示您選擇幾個選項 - 將它們保留為默認設置。 一個選項頁面“調整您的 PATH 環境”特別重要。 它必須設置為“Git From The Command Line And Also From 3rd-Party Software”。

確保選中“Git From The Command Line And Also From 3rd-Party Software”。

安裝 Miniconda3

穩定擴散利用了幾個不同的 Python 庫。 如果您對 Python 不太了解,請不要太擔心——可以這麼說,這些庫只是您的計算機可以用來執行特定功能的軟件包,例如轉換圖像或進行複雜的數學運算。

相關:什麼是 Python?

Miniconda3 基本上是一個方便的工具。 它允許您下載、安裝和管理穩定擴散運行所需的所有庫,而無需太多人工干預。 這也是我們實際使用穩定擴散的方式。

前往 Miniconda3 下載頁面並單擊“Miniconda3 Windows 64-bit”以獲取最新的安裝程序。

下載後雙擊可執行文件以開始安裝。 Miniconda3 的安裝涉及的頁麵點擊次數比 Git 少,但您需要注意這個選項:

勾選“所有用戶”框。

確保在單擊下一步並完成安裝之前選擇“所有用戶”。

安裝 Git 和 Miniconda3 後,系統會提示您重新啟動計算機。 我們認為沒有必要,但如果你這樣做也不會受到傷害。

下載 Stable Diffusion GitHub 存儲庫和最新的檢查點

現在我們已經安裝了必備軟件,我們可以下載並安裝 Stable Diffusion。

首先下載最新的檢查點——1.4 版接近 5GB,所以可能需要一段時間。 您需要創建一個帳戶來下載檢查點,但它們只需要名稱和電子郵件地址。 其他一切都是可選的。

注意:在撰寫本文時(2022 年 9 月 2 日),最新的檢查點是 1.4 版。 如果有更新的版本,請下載。

點擊“sd-v1-4.ckpt”開始下載。

注意:另一個文件“sd-v1-4-full-ema.ckpt”可能會提供更好的結果,但它的大小大約是原來的兩倍。 你可以使用任何一個。

然後你需要從 GitHub 下載 Stable Diffusion。 單擊綠色的“代碼”按鈕,然後單擊“下載 ZIP”。 或者,您可以使用此直接下載鏈接。

現在我們需要準備幾個文件夾,我們將在其中解壓所有 Stable Diffusion 的文件。 單擊開始按鈕並在開始菜單搜索欄中鍵入“miniconda3”,然後單擊“打開”或按 Enter。

我們將使用命令行創建一個名為“stable-diffusion”的文件夾。 將下面的代碼塊複製並粘貼到 Miniconda3 窗口中,然後按 Enter。

 CDC:/
mkdir 穩定擴散
cd 穩定擴散
注意:幾乎每次將代碼塊粘貼到終端(如 Miniconda3)時,都需要在最後按 Enter 鍵以運行最後一個命令。

如果一切順利,您將看到如下內容:

Minoconda3 終端顯示命令執行成功。

保持 Miniconda3 窗口打開,稍後我們將再次需要它。

在您最喜歡的文件歸檔程序中打開您從 GitHub 下載的 ZIP 文件“stable-diffusion-main.zip”。 或者,如果您沒有 ZIP 文件,Windows 也可以自行打開。 讓 ZIP 文件在一個窗口中打開,然後打開另一個文件資源管理器窗口並導航到我們剛剛創建的“C:\stable-diffusion”文件夾。

相關:在 Windows 10 上獲取文件資源管理器的幫助

將 ZIP 文件中的文件夾“stable-diffusion-main”拖放到“stable-diffusion”文件夾中。

將 ZIP 文件的內容拖放到 stable-diffusion 文件夾中。

返回 Miniconda3,然後將以下命令複製並粘貼到窗口中:

 cd C:\stable-diffusion\stable-diffusion-main
conda env 創建 -f environment.yaml
conda 激活 ldm
mkdir 模型\ldm\stable-diffusion-v1 

等待下載完成。

不要打斷這個過程。 有些文件大於 1 GB,因此下載可能需要一些時間。 如果您確實不小心中斷了該過程,則需要刪除環境文件夾並再次運行conda env create -f environment.yaml 。 如果發生這種情況,請導航到“C:\Users\(Your User Account)\.conda\envs”並刪除“ldm”文件夾,然後運行上一個命令。

筆記:那麼,我們剛剛做了什麼? Python 允許您將編碼項目分類到“環境”中。 每個環境都與其他環境分開,因此您可以將不同的 Python 庫加載到不同的環境中,而不必擔心版本衝突。 如果您在一台 PC 上處理多個項目,這是非常寶貴的。

我們運行的行創建了一個名為“ldm”的新環境,下載並安裝了所有必要的 Python 庫以使穩定擴散工作,激活 ldm 環境,然後將目錄更改為新文件夾。

我們正在進行安裝的最後一步。 在文件資源管理器中導航到“C:\stable-diffusion\stable-diffusion-main\models\ldm\stable-diffusion-v1”,然後將檢查點文件(sd-v1-4.ckpt)複製並粘貼到文件夾中。

將模型文件複製到 stable-diffuse-v1 文件夾中。

等待文件傳輸完成,右鍵單擊“sd-v1-4.ckpt”,然後單擊“重命名”。 在突出顯示的框中鍵入“model.ckpt”,然後按 Enter 更改文件名。

注意:如果您運行的是 Windows 11,則不會在右鍵單擊上下文菜單中看到“重命名”。 有一個圖標,看起來像一個微型文本字段。

相關: Windows 11 的微小上下文菜單按鈕會讓人們感到困惑

重命名模型文件“model.ckpt”

就是這樣——我們完成了。 我們現在已經準備好實際使用穩定擴散。

如何使用穩定擴散

我們創建的 ldm 環境是必不可少的,您需要在想要使用 Stable Diffusion 的任何時候激活它。 在 Miniconda3 窗口中輸入 conda conda activate ldm並點擊“Enter”。 左側的 (ldm) 表示 ldm 環境處於活動狀態。

注意:您只需要在打開 Miniconda3 時輸入該命令。 只要您不關閉窗口,ldm 環境就會保持活動狀態。

激活 ldm 環境。

然後我們需要將目錄(因此命令cd )更改為“C:\stable-diffusion\stable-diffusion-main”,然後才能生成任何圖像。 cd C:\stable-diffusion\stable-diffusion-main粘貼到命令行中。

如何製作具有穩定擴散的圖像

我們將調用一個腳本 txt2img.py,它允許我們將文本提示轉換為 512×512 的圖像。 這是一個例子。 試試這個以確保一切正常:

 python scripts/txt2img.py --prompt "pablo picasso 的一隻貓的特寫肖像,生動,抽象,色彩豐富,充滿活力" --plms --n_iter 5 --n_samples 1

您的控制台會在生成圖片時為您提供進度指示器。

穩定的擴散生成圖像。

該命令將生成五個貓圖像,全部位於“C:\stable-diffusion\stable-diffusion-main\outputs\txt2img-samples\samples”。

巴勃羅畢加索風格的貓。

它並不完美,但它明顯類似於巴勃羅畢加索的風格,就像我們在提示中指定的那樣。 您的圖像應該看起來相似但不一定相同。

任何時候您想更改生成的圖像,您只需要更改--prompt後面的雙引號中包含的文本。

提示:不要每次都重寫整行。 使用箭頭鍵移動文本光標並替換提示。
 python scripts/txt2img.py --prompt "你的,描述,去,這裡" --plms --n_iter 5 --n_samples 1

假設我們想在一個戴著巫師帽的魔法森林中生成一個看起來逼真的地鼠。 我們可以試試這個命令:

 python scripts/txt2img.py --prompt "一張地鼠戴著巫師帽在森林裡的照片,生動、逼真、神奇、奇幻、8K UHD、攝影" --plms --n_iter 5 --n_samples 1 

戴著紫色巫師帽的地鼠。

真的就是這麼簡單——只要盡可能具體地描述你想要什麼。 如果您想要逼真的東西,請確保包含與逼真圖像相關的術語。 如果您想要靈感來自特定藝術家的風格,請指定藝術家。

穩定擴散不僅限於肖像和動物,它還可以產生引人注目的風景。

一個平靜的湖,周圍有群山,還有一個戲劇性的天空。

命令中的參數是什麼意思?

穩定擴散具有大量設置和參數,您可以提供這些設置和參數來自定義結果。 這裡包含的幾個基本上是確保穩定擴散將在普通遊戲計算機上運行所必需的。

  • –plms — 指定如何對圖像進行採樣。 如果你想查看數學,有一篇關於它的論文。
  • –n_iter — 指定要為每個提示生成的迭代次數。 5 是一個不錯的數字,可以查看您得到什麼樣的結果。
  • –n_samples — 指定將生成的樣本數。 默認值為 3,但大多數計算機沒有足夠的 VRAM 來支持它。 堅持使用 1,除非您有特定的理由要更改它。

當然,Stable Diffusion 有很多不同的參數,您可以實施這些參數來調整結果。 運行python scripts/txt2img.py --help以獲取您可以使用的參數的詳盡列表。

獲得好結果涉及大量的試驗和錯誤,但這至少是樂趣的一半。 確保您寫下或保存返回您喜歡的結果的參數和描述。 如果你不想自己做所有的實驗,Reddit(和其他地方)上有越來越多的社區致力於交換圖片和生成它們的提示。