人工智能藝術的中途有多好? 我們比較了所有模型
已發表: 2023-05-20MidJourney 可以說是最簡單的 AI 藝術生成工具,無論是使用它還是獲得驚人的結果,但很容易忘記它在發佈時並不是那麼令人印象深刻。 讓我們看看它有多遠!
我們的方法論
MidJourney 的工作原理是接受描述您希望它通過 Discord 應用程序生成哪種圖像的文本“提示”。 如果您想了解如何使用該軟件,網上有許多很棒的 MidJourney 指南,可以讓您立即上手並運行。 對於本文,我們重點比較 MidJourney 的技術在 V1 和 V5.1 之間的 15 多個月內有多少改進,這是撰寫本文時最新的版本。
相關:你能用 AI 生成的藝術做什麼?
MidJourney 允許您使用/settings
在其任何模型版本之間手動切換,這將為您提供這些選項。
在這裡,我們可以在不同的 MidJourney 版本之間進行選擇。 順便說一句,“Niji”選項是經過專門訓練以生成日本動漫和漫畫風格的圖像的模型,所以如果你喜歡,請嘗試一下。
為本文生成的所有圖像都將使用高質量設置和默認樣式級別,這決定了模型在遵循提示時的行為是嚴格還是寬鬆。
我們將對每個模型使用相同的五個提示,以便您可以進行直接比較。 我們不會使用任何特殊的 MidJourney 參數,並且會堅持使用純英語的純文本提示。
我們使用 ChatGPT-4 提出了五個提示來測試 MidJourney,代表了各種挑戰。 這些是我們正在使用的提示:
- 超現實主義風景油畫
- 20 年代繁忙的市中心街道照片
- 夜間未來派城市景觀的概念藝術
- 白虎雪地畫
- 一個驚訝的女人的畫像
MidJourney 會針對每個提示提供四張圖片。 我們將選擇(在我們看來)是四個中最好的一個來進行比較。 因此,讓我們看看它在短時間內改進了多少。
中途 V1(2022 年 2 月)
MidJourney 的 V1 使我們堅定地處於夢幻般的噩夢燃料領域。 快速瀏覽這些圖像會給您留下它們的印象,但是一旦您真正看到它們,一切都會崩潰。 人臉尤其令人不安。
相關:我們讓 ChatGPT 創造 AI 藝術,這就是它所做的
MidJourney V2(2022 年 4 月 12 日)
V2 似乎與 V1 相比沒有太大的飛躍,但在構圖上有明顯的改進,在 20 年代的街景中尤其明顯。 白虎的輪廓絕對比之前更好了,女人的臉也少了幾分詭異。
請注意,在某些圖像中,作品上有一種偽簽名。 這是因為 AI 了解到某些風格的圖像具有簽名,因此它試圖複製看起來像的東西。
MidJourney V3(2022 年 7 月 25 日)
使用 V3,我們肯定會看到連貫性和合成方面的顯著改進。 無需過多檢查,細節就很明顯了,但隨機噪聲的數量確實減少了,圖像對人眼來說更有意義。
MidJourney V4(2022 年 11 月 5 日)
現在我們在說話! V4 在構圖、細節以及圖像的動態和想像力方面有了顯著改善。 V1 發布僅半年多,這些圖像絕對處於可用性範圍內,通常與未經進一步編輯的圖像一樣。 要找出明顯的 AI 缺陷,需要進行更多的審查。
MidJourney V5(2023 年 3 月 15 日)
V5 的改進比以前更微妙,但它們是實質性的。 除了在細節和構圖上的技術改進外,這些作品看起來更“富有想像力”,具有更多的動態,更廣泛的顏色選擇,以及整體更令人愉悅的呈現。 儘管 V4 確實將生成的圖像移到了人類最佳技術水平和 AI 生成能力之間的灰色地帶,但當 MidJourney 全力以赴時,V5 幾乎無法判斷這些圖像是 AI 製作的。
相關:對不起,人工智能藝術,你的算法無法取代人類的創造力
V5 還以解決 AI 圖像生成中最大的問題之一而著稱:手!
上面來自 V5 的圖像顯示問題已大體上得到解決,儘管在這裡您仍然可以看到其中一隻手的小指可能缺失,或者只是被遮住了。 像這樣的邊緣案例仍然存在,但似乎有 7 根手指的人的日子可能快結束了。
MidJourney V5.1(2023 年 5 月 3 日)
雖然我們在這裡看到的最後一個模型更新可能只是一個“.1”更新,但肯定沒有錯誤的改進。 在 V5 的基礎上,V5.1 完善了 V5 中的小缺陷,同時在我們看來,在表達和整體藝術風格上顯示出明顯的改進。
很難想像 MidJourney 從這裡可以走向何方,但到目前為止的進展量簡直令人興奮,我們迫不及待地想看看接下來會發生什麼。
相關:如何使用 Midjourney 創建合成 AI 藝術