Cât de bun este Midjourney la AI Art? Am comparat toate modelele
Publicat: 2023-05-20MidJourney este, fără îndoială, cel mai simplu instrument de generare de artă AI, atât în ceea ce privește utilizarea lui, cât și în ceea ce privește obținerea de rezultate uimitoare, dar este ușor de uitat că nu a fost chiar atât de impresionant la lansare. Să vedem cât de departe a ajuns!
Metodologia noastră
MidJourney funcționează acceptând „indemnizații” text care descriu ce fel de imagine doriți să genereze prin aplicația Discord. Dacă doriți să învățați cum să utilizați software-ul, există multe ghiduri minunate MidJourney pe web, care vă vor pune în funcțiune în cel mai scurt timp. Pentru acest articol, ne concentrăm pe compararea cât de mult s-a îmbunătățit tehnologia lui MidJourney în cele 15 luni ciudate dintre V1 și V5.1, care este cea mai recentă la momentul scrierii acestui articol.
RELATE: Ce poți face cu arta generată de AI?
MidJourney vă permite să comutați manual între oricare dintre versiunile modelului său folosind /settings
, care vă va oferi aceste opțiuni.
Aici putem alege dintre diferitele versiuni MidJourney. De altfel, opțiunile „Niji” sunt modele antrenate special pentru a genera imagini în stilul anime și manga japonez, așa că dacă asta e treaba ta, încearcă-le.
Toate imaginile generate pentru acest articol vor folosi setarea Calitate înaltă, cu nivelul de stil implicit, care determină cât de strict sau liber se comportă modelul atunci când urmează solicitarea.
Vom folosi aceleași cinci solicitări cu fiecare model, astfel încât să puteți face o comparație directă. Nu vom folosi parametri speciali MidJourney și vom respecta solicitările de text simplu în limba engleză simplă.
Am folosit ChatGPT-4 pentru a veni cu cinci solicitări pentru a testa MidJourney, reprezentând o varietate de provocări. Acestea sunt instrucțiunile pe care le folosim:
- Pictură în ulei a unui peisaj suprarealist
- Fotografie cu o stradă aglomerată din centrul orașului în anii 1920
- Arta conceptuală a unui peisaj urban futurist pe timp de noapte
- Pictură a unui tigru alb în zăpadă
- Portretul unei femei surprinse
MidJourney oferă patru imagini ca răspuns la fiecare solicitare. Îl vom alege pe cel care (în opinia noastră) este cel mai bun dintre cele patru de prezentat aici pentru comparație. Așa că haideți să vedem cât de mult s-a îmbunătățit în scurtul timp în care a existat.
Midjourney V1 (februarie 2022)
Suntem ferm în domeniul combustibilului de coșmar de vis cu V1 din MidJourney. La o privire rapidă, aceste imagini vă dau impresia a ceea ce sunt, dar de îndată ce le priviți, totul se strică. Fețele umane sunt deosebit de tulburătoare.
LEGATE: Lăsăm ChatGPT să creeze artă AI, iată ce a făcut
MidJourney V2 (12 aprilie 2022)
V2 nu pare a fi un salt uriaș față de V1, dar există o îmbunătățire clară a compoziției, mai ales vizibilă în scena stradală din anii 1920. Tigrul alb are cu siguranță un contur mai bun decât înainte, iar fața femeii este puțin mai puțin înfiorătoare.
Observați cum, în unele imagini, există un fel de pseudo-semnătură pe piesă. Acest lucru se datorează faptului că AI a învățat că imaginile anumitor stiluri au semnături și, prin urmare, a încercat să reproducă ceva care arată ca unul.
MidJourney V3 (25 iulie 2022)
Cu V3, vedem cu siguranță o îmbunătățire semnificativă a coerenței și compoziției. Detaliile sunt în mod clar dezactivate fără prea multă examinare, dar cantitatea de zgomot aleatoriu este cu siguranță redusă, iar imaginile au mai mult sens pentru ochiul uman.
MidJourney V4 (5 noiembrie 2022)
Acum noi vorbim! V4 arată o îmbunătățire dramatică a compoziției, detaliilor și cât de dinamice și imaginative sunt imaginile. Puțin peste jumătate de an de la V1, iar aceste imagini sunt cu siguranță în domeniul utilizabilității, de multe ori așa cum sunt fără editare ulterioară. Este nevoie de mult mai multă atenție pentru a depista defectele AI revelatoare.
MidJourney V5 (15 martie 2023)
Îmbunătățirile cu V5 sunt puțin mai subtile decât înainte, dar sunt substanțiale. În afară de îmbunătățirea tehnică în detaliu și compoziție, aceste piese par mai „imaginative”, cu și mai multă dinamică, alegeri mai largi de culori și, în general, o prezentare mult mai plăcută. Deși V4 a mutat cu siguranță imaginile rezultate în zona gri dintre cea mai bună competență tehnică umană și ceea ce poate face generarea AI, V5 face practic imposibil să spunem că aceste imagini sunt realizate de AI atunci când MidJourney trage în toate cilindrii.
RELATE: Îmi pare rău, AI Art, algoritmul tău nu poate înlocui creativitatea umană
V5 este, de asemenea, remarcabil pentru abordarea uneia dintre cele mai mari probleme în generarea de imagini AI: mâinile!
Imaginea de mai sus de la V5 arată că problema a fost în mare parte rezolvată, deși aici puteți vedea în continuare că una dintre mâini ar putea fie să aibă un miz lipsă, fie pur și simplu este ascunsă. Cazurile Edge ca acestea încă mai scapă, dar se pare că zilele oamenilor cu mâini cu 7 degete ar putea fi aproape de sfârşit.
MidJourney V5.1 (3 mai 2023)
În timp ce ultima actualizare a modelului la care ne uităm aici poate fi doar o actualizare „.1”, cu siguranță nu se poate înșela îmbunătățirea. Bazându-se pe elementele fundamentale ale V5, V5.1 șlefuiește defectele minore ale V5, în timp ce, pentru ochiul nostru, arată o îmbunătățire inconfundabilă a expresiei și a flerului artistic general.
Este greu de imaginat unde poate ajunge MidJourney de aici, dar progresul de până acum este pur și simplu uluitor și abia așteptăm să vedem ce este posibil în continuare.
LEGATE: Cum se creează artă sintetică AI cu Midjourney