Wie gut ist Midjourney bei AI Art? Wir haben alle Modelle verglichen

Veröffentlicht: 2023-05-20
Ein weißer Roboter mit dem Gesicht einer Frau, der ein Gemälde malt
MidJourney / Sydney Butler / How-To Geek

MidJourney ist wohl das einfachste Tool zur KI-Kunstgenerierung, sowohl hinsichtlich der Verwendung als auch hinsichtlich der Erzielung erstaunlicher Ergebnisse, aber man vergisst leicht, dass es beim Start nicht besonders beeindruckend war. Mal sehen, wie weit es gekommen ist!

Unsere Methodik

MidJourney akzeptiert Text-„Eingabeaufforderungen“, die beschreiben, welche Art von Bild über die Discord-App generiert werden soll. Wenn Sie lernen möchten, wie man die Software verwendet, gibt es im Internet viele tolle MidJourney-Anleitungen, mit denen Sie im Handumdrehen loslegen können. In diesem Artikel konzentrieren wir uns darauf, zu vergleichen, wie sehr sich die Technologie von MidJourney in den etwa 15 Monaten zwischen V1 und V5.1 verbessert hat, was zum Zeitpunkt des Verfassens dieses Artikels der letzte ist.

VERWANDT: Was können Sie mit KI-generierter Kunst machen?

Mit MidJourney können Sie mithilfe von /settings manuell zwischen allen Modellversionen wechseln, wodurch Sie diese Optionen erhalten.

Midjourney-Optionen-Panel in Discord

Hier können wir zwischen den verschiedenen MidJourney-Versionen wählen. Bei den „Niji“-Optionen handelt es sich übrigens um Modelle, die speziell darauf trainiert wurden, Bilder im japanischen Anime- und Manga-Stil zu erzeugen. Wenn Sie also Lust darauf haben, probieren Sie sie doch einmal aus.

Alle für diesen Artikel generierten Bilder verwenden die Einstellung „Hohe Qualität“ mit der Standardstilstufe, die bestimmt, wie streng oder locker sich das Modell verhält, wenn es der Eingabeaufforderung folgt.

Wir verwenden für jedes Modell die gleichen fünf Eingabeaufforderungen, damit Sie einen direkten Vergleich durchführen können. Wir werden keine speziellen MidJourney-Parameter verwenden und uns auf Klartext-Eingabeaufforderungen in einfachem Englisch beschränken.

Wir haben ChatGPT-4 verwendet, um fünf Eingabeaufforderungen zum Testen von MidJourney zu erstellen, die eine Vielzahl von Herausforderungen darstellen. Dies sind die Eingabeaufforderungen, die wir verwenden:

  • Ölgemälde einer surrealen Landschaft
  • Foto einer belebten Innenstadtstraße in den 1920er Jahren
  • Konzeptkunst einer futuristischen Stadtlandschaft bei Nacht
  • Gemälde eines weißen Tigers im Schnee
  • Porträt einer überraschten Frau

MidJourney stellt als Antwort auf jede Eingabeaufforderung vier Bilder bereit. Wir werden denjenigen auswählen, der (unserer Meinung nach) der beste der vier ist, die wir hier zum Vergleich vorstellen. Mal sehen, wie sehr es sich in der kurzen Zeit, in der es existiert, verbessert hat.

Midjourney V1 (Februar 2022)

Mit V1 von MidJourney befinden wir uns fest im Reich des traumhaften Albtraums. Auf den ersten Blick vermitteln diese Bilder einen Eindruck davon, was sie sind, aber sobald man sie tatsächlich betrachtet, bricht alles zusammen. Besonders verstörend wirken menschliche Gesichter.

VERBUNDEN: Wir haben ChatGPT KI-Kunst erstellen lassen, hier ist, was daraus gemacht wurde

MidJourney V2 (12. April 2022)

V2 scheint kein großer Fortschritt gegenüber V1 zu sein, aber es gibt eine deutliche Verbesserung in der Komposition, die sich besonders in der Straßenszene der 1920er Jahre bemerkbar macht. Der weiße Tiger hat definitiv einen besseren Umriss als zuvor und das Gesicht der Frau ist etwas weniger gruselig.

Beachten Sie, dass auf einigen Bildern eine Art Pseudosignatur auf dem Stück zu sehen ist. Dies liegt daran, dass die KI gelernt hat, dass Bilder bestimmter Stile Signaturen haben, und daher versucht hat, etwas zu reproduzieren, das so aussieht.

MidJourney V3 (25. Juli 2022)

Mit V3 sehen wir definitiv eine deutliche Verbesserung der Kohärenz und Komposition. Die Details sind ohne allzu genaues Hinsehen deutlich unzutreffend, aber die Menge an zufälligem Rauschen ist definitiv reduziert und die Bilder sind für das menschliche Auge sinnvoller.

MidJourney V4 (5. November 2022)

Jetzt reden wir! V4 zeigt eine dramatische Verbesserung der Komposition, der Details und der Dynamik und Fantasie der Bilder. Etwas mehr als ein halbes Jahr ist seit V1 vergangen, und diese Bilder sind definitiv im Bereich der Benutzerfreundlichkeit, oft genauso wie sie ohne weitere Bearbeitung sind. Um verräterische KI-Mängel zu erkennen, bedarf es wesentlich genauerer Untersuchungen.

MidJourney V5 (15. März 2023)

Die Verbesserungen mit V5 sind etwas subtiler als zuvor, aber sie sind erheblich. Abgesehen von der technischen Verbesserung im Detail und in der Komposition wirken diese Stücke „einfallsreicher“, mit noch mehr Dynamik, einer größeren Farbauswahl und einer insgesamt viel ansprechenderen Präsentation. Obwohl V4 die resultierenden Bilder sicherlich in die Grauzone zwischen den besten technischen Fähigkeiten des Menschen und dem, was die KI-Generation leisten kann, verschoben hat, ist es bei V5 praktisch unmöglich zu erkennen, dass diese Bilder von KI erstellt wurden, wenn MidJourney auf Hochtouren läuft.

VERBUNDEN: Tut mir leid, AI Art, Ihr Algorithmus kann die menschliche Kreativität nicht ersetzen

V5 zeichnet sich auch dadurch aus, dass es eines der größten Probleme bei der KI-Bildgenerierung angeht: Hände!

MJ V5-Zauberer geben sich die Hand
MidJourney / Sydney Butler / How-To Geek

Das obige Bild von Version 5 zeigt, dass das Problem im Großen und Ganzen gelöst wurde, obwohl Sie hier immer noch sehen können, dass einer der Hände entweder einen kleinen Finger haben könnte oder dieser einfach verdeckt ist. Edge-Cases wie diese rutschen immer noch durch, aber es scheint, dass die Zeiten der Menschen mit 7-Finger-Händen fast vorbei sind.

MidJourney V5.1 (3. Mai 2023)

Auch wenn es sich bei der letzten Modellaktualisierung, die wir uns hier ansehen, möglicherweise nur um ein „.1“-Update handelt, ist die Verbesserung sicherlich unverkennbar. Aufbauend auf den Grundlagen von V5 verbessert V5.1 die kleineren Mängel von V5 und zeigt in unseren Augen eine unverkennbare Verbesserung des Ausdrucks und des gesamten künstlerischen Flairs.

Es ist schwer vorstellbar, wohin MidJourney von hier aus gehen kann, aber die bisherigen Fortschritte sind einfach umwerfend und wir können es kaum erwarten, zu sehen, was als nächstes möglich ist.

VERWANDT: So erstellen Sie synthetische KI-Kunst mit Midjourney