Jak dobry jest Midjourney w AI Art? Porównaliśmy wszystkie modele
Opublikowany: 2023-05-20
MidJourney jest prawdopodobnie najłatwiejszym narzędziem do generowania grafiki AI, zarówno pod względem korzystania z niego, jak i uzyskiwania niesamowitych wyników, ale łatwo zapomnieć, że nie było to aż tak imponujące w momencie premiery. Zobaczmy, jak daleko to zaszło!
Nasza metodologia
MidJourney działa, akceptując tekstowe „podpowiedzi” opisujące, jaki rodzaj obrazu ma generować za pośrednictwem aplikacji Discord. Jeśli chcesz dowiedzieć się, jak korzystać z oprogramowania, w Internecie dostępnych jest wiele niesamowitych przewodników MidJourney, które pozwolą Ci szybko rozpocząć pracę. W tym artykule skupimy się na porównaniu, jak bardzo technologia MidJourney poprawiła się w ciągu 15-kilkunastu miesięcy między wersją 1 a wersją 5.1, która jest najnowszą wersją tego tekstu.
POWIĄZANE: Co możesz zrobić z grafiką generowaną przez AI?
MidJourney pozwala ręcznie przełączać się między dowolnymi wersjami modeli za pomocą /settings
, co daje te opcje.
Tutaj możemy wybierać pomiędzy różnymi wersjami MidJourney. Nawiasem mówiąc, opcje „Niji” to modele przeszkolone specjalnie do generowania obrazów w stylu japońskiego anime i mangi, więc jeśli to twoja sprawa, wypróbuj je.
Wszystkie obrazy wygenerowane na potrzeby tego artykułu będą korzystać z ustawienia Wysoka jakość z domyślnym poziomem stylu, który określa, jak surowo lub luźno zachowuje się model, gdy postępuje zgodnie z monitem.
Będziemy używać tych samych pięciu monitów z każdym modelem, abyś mógł dokonać bezpośredniego porównania. Nie będziemy używać żadnych specjalnych parametrów MidJourney i będziemy trzymać się prostych komunikatów tekstowych w prostym języku angielskim.
Użyliśmy ChatGPT-4, aby wymyślić pięć podpowiedzi do przetestowania MidJourney, reprezentujących różnorodne wyzwania. Oto monity, których używamy:
- Obraz olejny przedstawiający surrealistyczny pejzaż
- Zdjęcie ruchliwej ulicy w centrum miasta z lat 20. XX wieku
- Grafika koncepcyjna futurystycznego pejzażu miejskiego w nocy
- Malowanie białego tygrysa na śniegu
- Portret zaskoczona kobieta
MidJourney udostępnia cztery obrazy w odpowiedzi na każdy monit. Wybierzemy ten, który (naszym zdaniem) jest najlepszy z czterech do zaprezentowania tutaj dla porównania. Zobaczmy więc, jak bardzo poprawił się w krótkim czasie, jaki istnieje.
Midjourney V1 (luty 2022)
Jesteśmy mocno w królestwie sennego koszmarnego paliwa z V1 MidJourney. Na pierwszy rzut oka te obrazy dają wrażenie , czym one są, ale gdy tylko na nie spojrzysz, wszystko się psuje. Szczególnie niepokojące są ludzkie twarze.
POWIĄZANE: Pozwalamy ChatGPT tworzyć sztukę AI, oto, co to stworzyło
MidJourney V2 (12 kwietnia 2022)
V2 nie wydaje się wielkim skokiem w stosunku do V1, ale jest wyraźna poprawa kompozycji, szczególnie zauważalna na scenie ulicznej lat 20. XX wieku. Biały tygrys ma zdecydowanie lepszy zarys niż poprzednio, a twarz kobiety jest nieco mniej przerażająca.
Zwróć uwagę, że na niektórych obrazach znajduje się coś w rodzaju pseudosygnatury. Dzieje się tak, ponieważ sztuczna inteligencja nauczyła się, że obrazy niektórych stylów mają sygnatury, więc próbowała odtworzyć coś, co wygląda jak jeden.
MidJourney V3 (25 lipca 2022)
W wersji 3 zdecydowanie obserwujemy znaczną poprawę spójności i kompozycji. Szczegóły są wyraźnie wyłączone bez zbytniej analizy, ale ilość przypadkowych szumów jest zdecydowanie zmniejszona, a obrazy mają większy sens dla ludzkiego oka.

MidJourney V4 (5 listopada 2022)
Teraz rozmawiamy! V4 pokazuje radykalną poprawę kompozycji, szczegółów oraz dynamiki i pomysłowości obrazów. Nieco ponad pół roku od V1, a te obrazy są zdecydowanie w sferze użyteczności, często tak jak są, bez dalszej edycji. Wykrycie charakterystycznych wad sztucznej inteligencji wymaga znacznie większej analizy.
MidJourney V5 (15 marca 2023)
Ulepszenia w wersji V5 są nieco bardziej subtelne niż wcześniej, ale są znaczące. Poza techniczną poprawą szczegółów i kompozycji, utwory te wydają się bardziej „pomysłowe”, z jeszcze większą dynamiką, szerszym wyborem kolorów i ogólnie o wiele przyjemniejszą prezentacją. Chociaż V4 z pewnością przeniósł powstałe obrazy do szarej strefy między najlepszą ludzką biegłością techniczną a tym, co może zrobić generacja sztucznej inteligencji, V5 praktycznie uniemożliwia stwierdzenie, że te obrazy są tworzone przez sztuczną inteligencję, gdy MidJourney strzela na wszystkich cylindrach.
POWIĄZANE: Przepraszamy, AI Art, Twój algorytm nie może zastąpić ludzkiej kreatywności
V5 wyróżnia się również rozwiązaniem jednego z największych problemów związanych z generowaniem obrazów AI: rąk!

Powyższy obraz z V5 pokazuje, że problem został w zasadzie rozwiązany, chociaż tutaj nadal widać, że jedna z rąk może mieć brakujący mały palec lub jest po prostu zasłonięta. Takie przypadki Edge wciąż się wymykają, ale wydaje się, że dni ludzi z 7-palczastymi dłońmi mogą już prawie się skończyć.
MidJourney V5.1 (3 maja 2023 r.)
Chociaż ostatnia aktualizacja modelu, której się tutaj przyglądamy, może być tylko aktualizacją „.1”, z pewnością nie ma wątpliwości co do ulepszenia. Opierając się na podstawach wersji V5, wersja 5.1 poprawia drobne wady wersji V5, jednocześnie wykazując, naszym zdaniem, niewątpliwą poprawę ekspresji i ogólnego talentu artystycznego.
Trudno sobie wyobrazić, dokąd może zajść MidJourney, ale dotychczasowy postęp jest po prostu oszałamiający i nie możemy się doczekać, aby zobaczyć, co będzie możliwe dalej.
POWIĄZANE: Jak stworzyć syntetyczną sztukę AI za pomocą Midjourney