AI Art の Midjourney はどれくらい優れていますか? 全モデルを比較してみました

公開: 2023-05-20
絵を描く女性の顔をした白いロボット
ミッドジャーニー / シドニー・バトラー / ハウツーオタク

MidJourney は、使用するという点でも、素晴らしい結果を得るという点でも、間違いなく最も簡単な AI アート生成ツールですが、発売当初はそれほど印象的ではなかったことが忘れられがちです。 どこまで進んだか見てみましょう!

私たちの方法論

MidJourney は、Discord アプリ経由で生成したい画像の種類を説明するテキスト「プロンプト」を受け入れることで機能します。 ソフトウェアの使用方法を学びたい場合は、すぐに使い始められる素晴らしい MidJourney ガイドが Web 上にたくさんあります。 この記事では、MidJourney のテクノロジーが 15 数か月の間に V1 と、この記事の執筆時点で最新である V5.1 の間でどれだけ改善されたかを比較することに焦点を当てています。

関連: AI が生成したアートで何ができるのか?

MidJourney では、これらのオプションを提供する/settingsを使用してモデル バージョンを手動で切り替えることができます。

Discordのミッドジャーニーオプションパネル

ここでは、さまざまな MidJourney バージョンから選択できます。 ちなみに、「虹」オプションは、日本のアニメやマンガのスタイルで画像を生成するために特別にトレーニングされたモデルなので、興味がある場合は試してみてください。

この記事用に生成されたすべての画像は、デフォルトのスタイル レベルで高品質設定を使用します。これにより、プロンプトに従ったときにモデルがどの程度厳密に動作するか、または緩く動作するかを決定します。

直接比較できるように、すべてのモデルで同じ 5 つのプロンプトを使用します。 特別な MidJourney パラメーターは使用せず、平易な英語のプレーン テキスト プロンプトに固執します。

ChatGPT-4 を使用して、MidJourney をテストするための 5 つのプロンプトを作成し、さまざまな課題を表現しました。 私たちが使用しているプロンプトは次のとおりです。

  • 超現実的な風景を描いた油絵
  • 1920 年代のにぎやかなダウンタウンの通りの写真
  • 夜の未来的な街並みのコンセプトアート
  • 雪の中のホワイトタイガーの絵
  • 驚いた女性の肖像画

MidJourney は、各プロンプトに応じて 4 つの画像を提供します。 比較のために、ここで紹介する 4 つのうちの (私たちの意見では) 最も優れているものを選択します。 それでは、短期間でどれだけ改善されたかを見てみましょう。

ミッドジャーニー V1 (2022 年 2 月)

MidJourney の V1 によって、私たちは夢のような悪夢の燃料の領域にしっかりと入っています。 これらの画像は、一見するとそれが何であるかの印象を与えますが、実際に見るとすぐにすべてが崩れます。 人間の顔は特に不快です。

関連: ChatGPT に AI アートを作成させた、その成果は次のとおりです

MidJourney V2 (2022 年 4 月 12 日)

V2 は V1 を大きく上回るようには見えませんが、構成には明らかな改善があり、特に 1920 年代のストリート シーンで顕著です。 ホワイトタイガーの輪郭は明らかに以前よりも良くなり、女性の顔の不気味さはこれまでより少し減りました。

一部の画像では、作品に一種の疑似署名があることに注目してください。 これは、AI が特定のスタイルの画像に署名があることを学習し、それに似たものを再現しようとしたためです。

MidJourney V3 (2022 年 7 月 25 日)

V3 では、一貫性と構成が大幅に向上していることは間違いありません。 あまり精査しなくても細部は明らかにずれていますが、ランダムノイズの量は確実に減少し、画像は人間の目にはより意味のあるものになります。

MidJourney V4 (2022 年 11 月 5 日)

今、話しています! V4 では、構図、ディテール、画像のダイナミックさと想像力が劇的に向上しています。 V1 からわずか半年以上が経過しましたが、これらの画像は間違いなく使いやすい領域にあり、多くの場合、さらに編集することなくそのままの状態になっています。 AI の明らかな欠陥を見つけ出すには、さらに精査する必要があります。

MidJourney V5 (2023 年 3 月 15 日)

V5 での改善は以前よりも少し微妙ですが、実質的なものです。 ディテールや構成における技術的な改善とは別に、これらの作品はより「想像力豊か」に見え、さらにダイナミックな動き、より幅広い色の選択肢、そして全体的により楽しいプレゼンテーションを備えています。 V4 は確かに、結果として得られる画像を人間の最高の技術的熟練度と AI 生成ができる範囲との間のグレーゾーンに移動させましたが、V5 では、MidJourney がすべてのシリンダーで点火しているときに、これらの画像が AI によって作成されたものであるかどうかを事実上不可能にしています。

関連:申し訳ありませんが、AI アート、あなたのアルゴリズムは人間の創造性に取って代わることはできません

V5 は、AI 画像生成における最大の問題の 1 つである「手」に対処したことでも注目に値します。

握手するMJ V5ウィザーズ
ミッドジャーニー / シドニー・バトラー / ハウツーオタク

V5 の上の画像は、問題が概ね解決されていることを示していますが、ここではまだ、片方の手の小指が欠けているか、単に隠れている可能性があることがわかります。 このようなエッジケースは依然としてすり抜けていますが、7本指の手を持つ人々の時代はほぼ終わりつつあるようです。

MidJourney V5.1 (2023 年 5 月 3 日)

ここで取り上げている最後のモデルアップデートは「.1」アップデートに過ぎないかもしれませんが、改善が見られることは間違いありません。 V5 の基本を基にして、V5.1 は V5 の小さな欠陥を磨き上げますが、私たちの目には、表現力と全体的な芸術的才能において紛れもない改善が見られます。

MidJourney がここからどこへ向かうのか想像するのは難しいですが、これまでの進歩の量は驚くべきものであり、次に何が可能になるのかを見るのが待ちきれません。

関連: Midjourney で合成 AI アートを作成する方法