Jak dobry jest Midjourney w AI Art? Porównaliśmy wszystkie modele

Opublikowany: 2023-05-20
Biały Robot Z Kobiecą Twarzą Maluje Obraz
MidJourney / Sydney Butler / How-To Geek

MidJourney jest prawdopodobnie najłatwiejszym narzędziem do generowania grafiki AI, zarówno pod względem korzystania z niego, jak i uzyskiwania niesamowitych wyników, ale łatwo zapomnieć, że nie było to aż tak imponujące w momencie premiery. Zobaczmy, jak daleko to zaszło!

Nasza metodologia

MidJourney działa, akceptując tekstowe „podpowiedzi” opisujące, jaki rodzaj obrazu ma generować za pośrednictwem aplikacji Discord. Jeśli chcesz dowiedzieć się, jak korzystać z oprogramowania, w Internecie dostępnych jest wiele niesamowitych przewodników MidJourney, które pozwolą Ci szybko rozpocząć pracę. W tym artykule skupimy się na porównaniu, jak bardzo technologia MidJourney poprawiła się w ciągu 15-kilkunastu miesięcy między wersją 1 a wersją 5.1, która jest najnowszą wersją tego tekstu.

POWIĄZANE: Co możesz zrobić z grafiką generowaną przez AI?

MidJourney pozwala ręcznie przełączać się między dowolnymi wersjami modeli za pomocą /settings , co daje te opcje.

Panel opcji w trakcie podróży na Discordzie

Tutaj możemy wybierać pomiędzy różnymi wersjami MidJourney. Nawiasem mówiąc, opcje „Niji” to modele przeszkolone specjalnie do generowania obrazów w stylu japońskiego anime i mangi, więc jeśli to twoja sprawa, wypróbuj je.

Wszystkie obrazy wygenerowane na potrzeby tego artykułu będą korzystać z ustawienia Wysoka jakość z domyślnym poziomem stylu, który określa, jak surowo lub luźno zachowuje się model, gdy postępuje zgodnie z monitem.

Będziemy używać tych samych pięciu monitów z każdym modelem, abyś mógł dokonać bezpośredniego porównania. Nie będziemy używać żadnych specjalnych parametrów MidJourney i będziemy trzymać się prostych komunikatów tekstowych w prostym języku angielskim.

Użyliśmy ChatGPT-4, aby wymyślić pięć podpowiedzi do przetestowania MidJourney, reprezentujących różnorodne wyzwania. Oto monity, których używamy:

  • Obraz olejny przedstawiający surrealistyczny pejzaż
  • Zdjęcie ruchliwej ulicy w centrum miasta z lat 20. XX wieku
  • Grafika koncepcyjna futurystycznego pejzażu miejskiego w nocy
  • Malowanie białego tygrysa na śniegu
  • Portret zaskoczona kobieta

MidJourney udostępnia cztery obrazy w odpowiedzi na każdy monit. Wybierzemy ten, który (naszym zdaniem) jest najlepszy z czterech do zaprezentowania tutaj dla porównania. Zobaczmy więc, jak bardzo poprawił się w krótkim czasie, jaki istnieje.

Midjourney V1 (luty 2022)

Jesteśmy mocno w królestwie sennego koszmarnego paliwa z V1 MidJourney. Na pierwszy rzut oka te obrazy dają wrażenie , czym one są, ale gdy tylko na nie spojrzysz, wszystko się psuje. Szczególnie niepokojące są ludzkie twarze.

POWIĄZANE: Pozwalamy ChatGPT tworzyć sztukę AI, oto, co to stworzyło

MidJourney V2 (12 kwietnia 2022)

V2 nie wydaje się wielkim skokiem w stosunku do V1, ale jest wyraźna poprawa kompozycji, szczególnie zauważalna na scenie ulicznej lat 20. XX wieku. Biały tygrys ma zdecydowanie lepszy zarys niż poprzednio, a twarz kobiety jest nieco mniej przerażająca.

Zwróć uwagę, że na niektórych obrazach znajduje się coś w rodzaju pseudosygnatury. Dzieje się tak, ponieważ sztuczna inteligencja nauczyła się, że obrazy niektórych stylów mają sygnatury, więc próbowała odtworzyć coś, co wygląda jak jeden.

MidJourney V3 (25 lipca 2022)

W wersji 3 zdecydowanie obserwujemy znaczną poprawę spójności i kompozycji. Szczegóły są wyraźnie wyłączone bez zbytniej analizy, ale ilość przypadkowych szumów jest zdecydowanie zmniejszona, a obrazy mają większy sens dla ludzkiego oka.

MidJourney V4 (5 listopada 2022)

Teraz rozmawiamy! V4 pokazuje radykalną poprawę kompozycji, szczegółów oraz dynamiki i pomysłowości obrazów. Nieco ponad pół roku od V1, a te obrazy są zdecydowanie w sferze użyteczności, często tak jak są, bez dalszej edycji. Wykrycie charakterystycznych wad sztucznej inteligencji wymaga znacznie większej analizy.

MidJourney V5 (15 marca 2023)

Ulepszenia w wersji V5 są nieco bardziej subtelne niż wcześniej, ale są znaczące. Poza techniczną poprawą szczegółów i kompozycji, utwory te wydają się bardziej „pomysłowe”, z jeszcze większą dynamiką, szerszym wyborem kolorów i ogólnie o wiele przyjemniejszą prezentacją. Chociaż V4 z pewnością przeniósł powstałe obrazy do szarej strefy między najlepszą ludzką biegłością techniczną a tym, co może zrobić generacja sztucznej inteligencji, V5 praktycznie uniemożliwia stwierdzenie, że te obrazy są tworzone przez sztuczną inteligencję, gdy MidJourney strzela na wszystkich cylindrach.

POWIĄZANE: Przepraszamy, AI Art, Twój algorytm nie może zastąpić ludzkiej kreatywności

V5 wyróżnia się również rozwiązaniem jednego z największych problemów związanych z generowaniem obrazów AI: rąk!

Czarodzieje MJ V5 podają sobie ręce
MidJourney / Sydney Butler / How-To Geek

Powyższy obraz z V5 pokazuje, że problem został w zasadzie rozwiązany, chociaż tutaj nadal widać, że jedna z rąk może mieć brakujący mały palec lub jest po prostu zasłonięta. Takie przypadki Edge wciąż się wymykają, ale wydaje się, że dni ludzi z 7-palczastymi dłońmi mogą już prawie się skończyć.

MidJourney V5.1 (3 maja 2023 r.)

Chociaż ostatnia aktualizacja modelu, której się tutaj przyglądamy, może być tylko aktualizacją „.1”, z pewnością nie ma wątpliwości co do ulepszenia. Opierając się na podstawach wersji V5, wersja 5.1 poprawia drobne wady wersji V5, jednocześnie wykazując, naszym zdaniem, niewątpliwą poprawę ekspresji i ogólnego talentu artystycznego.

Trudno sobie wyobrazić, dokąd może zajść MidJourney, ale dotychczasowy postęp jest po prostu oszałamiający i nie możemy się doczekać, aby zobaczyć, co będzie możliwe dalej.

POWIĄZANE: Jak stworzyć syntetyczną sztukę AI za pomocą Midjourney