Quanto è bello Midjourney all'AI Art? Abbiamo confrontato tutti i modelli
Pubblicato: 2023-05-20MidJourney è senza dubbio lo strumento di generazione artistica AI più semplice sia in termini di utilizzo che in termini di risultati sorprendenti, ma è facile dimenticare che non era poi così impressionante al momento del lancio. Vediamo fino a che punto è arrivato!
La nostra metodologia
MidJourney funziona accettando "prompt" di testo che descrivono il tipo di immagine che desideri generare tramite l'app Discord. Se vuoi imparare a usare il software, ci sono molte fantastiche guide MidJourney sul web che ti renderanno operativo in pochissimo tempo. Per questo articolo, ci concentriamo sul confronto di quanto è migliorata la tecnologia di MidJourney nei 15 mesi dispari tra V1 e V5.1, che è l'ultima al momento della stesura di questo articolo.
CORRELATO: Cosa puoi fare con l'arte generata dall'IA?
MidJourney ti consente di passare manualmente da una qualsiasi delle sue versioni del modello utilizzando /settings
che ti darà queste opzioni.
Qui possiamo selezionare tra le diverse versioni di MidJourney. Per inciso, le opzioni "Niji" sono modelli addestrati specificamente per generare immagini in stile anime e manga giapponesi, quindi se è la tua passione, provali.
Tutte le immagini generate per questo articolo utilizzeranno l'impostazione Alta qualità, con il livello di stile predefinito, che determina quanto rigido o flessibile si comporta il modello quando segue il prompt.
Utilizzeremo gli stessi cinque prompt con ogni modello in modo da poter effettuare un confronto diretto. Non utilizzeremo alcun parametro speciale di MidJourney e ci atterremo a messaggi di testo in chiaro in un inglese semplice.
Abbiamo utilizzato ChatGPT-4 per elaborare cinque suggerimenti per testare MidJourney, che rappresentano una varietà di sfide. Questi sono i prompt che stiamo usando:
- Dipinto ad olio di un paesaggio surreale
- Foto di una trafficata strada del centro negli anni '20
- Concept art di un paesaggio urbano futuristico di notte
- Dipinto di una tigre bianca nella neve
- Ritratto di una donna sorpresa
MidJourney fornisce quattro immagini in risposta a ogni richiesta. Sceglieremo quello che (a nostro avviso) è il migliore dei quattro da presentare qui per il confronto. Quindi vediamo quanto è migliorato nel breve periodo in cui è stato disponibile.
Midjourney V1 (febbraio 2022)
Siamo fermamente nel regno del carburante da incubo onirico con V1 di MidJourney. A una rapida occhiata queste immagini ti danno l' impressione di quello che sono, ma non appena le guardi davvero tutto crolla. I volti umani sono particolarmente inquietanti.
CORRELATO: Lasciamo che ChatGPT crei AI Art, ecco cosa ha fatto
MidJourney V2 (12 aprile 2022)
V2 non sembra un grande salto rispetto a V1, ma c'è un netto miglioramento nella composizione, particolarmente evidente nella scena di strada degli anni '20. La tigre bianca ha decisamente un contorno migliore di prima, e il viso della donna è sempre leggermente meno inquietante.
Notate come, in alcune immagini, ci sia una sorta di pseudo-firma sul pezzo. Questo perché l'intelligenza artificiale ha appreso che le immagini di determinati stili hanno firme e quindi ha cercato di riprodurre qualcosa che le assomigli.
MidJourney V3 (25 luglio 2022)
Con V3 stiamo sicuramente assistendo a un significativo miglioramento della coerenza e della composizione. I dettagli sono chiaramente fuori posto senza troppi controlli, ma la quantità di rumore casuale è decisamente ridotta e le immagini hanno più senso per l'occhio umano.
MidJourney V4 (5 novembre 2022)
Ora stiamo parlando! V4 mostra un notevole miglioramento della composizione, dei dettagli e di quanto siano dinamiche e fantasiose le immagini. Poco più di sei mesi dalla V1 e queste immagini sono decisamente nel regno dell'usabilità, spesso così come sono senza ulteriori modifiche. Ci vuole molto più controllo per individuare i difetti rivelatori dell'IA.
MidJourney V5 (15 marzo 2023)
I miglioramenti con V5 sono un po' più sottili rispetto a prima, ma sono sostanziali. A parte il miglioramento tecnico nei dettagli e nella composizione, questi pezzi sembrano più "fantasiosi", con ancora più dinamicità, scelte cromatiche più ampie e una presentazione complessivamente molto più piacevole. Sebbene V4 abbia sicuramente spostato le immagini risultanti nella zona grigia tra la migliore competenza tecnica umana e ciò che la generazione AI può fare, V5 rende praticamente impossibile dire che queste immagini sono create dall'IA quando MidJourney sta sparando a tutti i cilindri.
CORRELATO: Scusa, AI Art, il tuo algoritmo non può sostituire la creatività umana
V5 si distingue anche per aver affrontato uno dei maggiori problemi nella generazione di immagini AI: le mani!
L'immagine sopra della V5 mostra che il problema è stato sostanzialmente risolto, anche se qui puoi ancora vedere che una delle lancette potrebbe avere un mignolo mancante o semplicemente oscurata. I casi limite come questi continuano a sfuggire, ma sembra che i giorni delle persone con mani a 7 dita potrebbero essere quasi finiti.
MidJourney V5.1 (3 maggio 2023)
Mentre l'ultimo aggiornamento del modello che stiamo esaminando qui potrebbe essere solo un aggiornamento ".1", non c'è certamente alcun dubbio sul miglioramento. Basandosi sui fondamenti di V5, V5.1 corregge i difetti minori in V5 mentre, ai nostri occhi, mostra un inconfondibile miglioramento nell'espressione e nel talento artistico generale.
È difficile immaginare dove possa andare MidJourney da qui, ma la quantità di progressi finora è semplicemente strabiliante e non vediamo l'ora di vedere cosa sarà possibile dopo.
CORRELATO: Come creare arte artificiale artificiale con Midjourney