Midjourney AI Sanatında Ne Kadar İyi? Tüm Modelleri Karşılaştırdık

Yayınlanan: 2023-05-20
Bir Kadının Yüzüne Sahip Beyaz Bir Robot Resim Yapıyor
MidJourney / Sydney Butler / Nasıl Yapılır Geek

MidJourney, hem onu ​​kullanma hem de harika sonuçlar elde etme açısından tartışmasız en kolay AI sanat oluşturma aracıdır, ancak piyasaya sürüldüğünde o kadar da etkileyici olmadığını unutmak kolaydır. Bakalım ne kadar ilerlemiş!

Metodolojimiz

MidJourney, Discord uygulaması aracılığıyla ne tür bir görüntü oluşturmasını istediğinizi açıklayan metin "istemlerini" kabul ederek çalışır. Yazılımı nasıl kullanacağınızı öğrenmek istiyorsanız, web'de kısa sürede çalışmaya başlamanızı sağlayacak pek çok harika MidJourney kılavuzu var. Bu makale için, V1 ile V5.1 arasındaki 15 küsur ayda MidJourney teknolojisinin ne kadar geliştiğini karşılaştırmaya odaklandık; bu, bu yazının yazıldığı tarihteki en son tarihtir.

İLGİLİ: Yapay Zeka Tarafından Oluşturulan Sanatla Neler Yapabilirsiniz?

MidJourney, size bu seçenekleri verecek olan /settings kullanarak herhangi bir model sürümü arasında manuel olarak geçiş yapmanızı sağlar.

Discord'da Midjourney Seçenekleri Paneli

Burada farklı MidJourney sürümleri arasında seçim yapabiliriz. Bu arada, "Niji" seçenekleri Japon Anime ve Manga tarzında görüntüler oluşturmak için özel olarak eğitilmiş modellerdir, bu yüzden eğer işiniz buysa, onları bir deneyin.

Bu makale için oluşturulan tüm resimler, istemi izlerken modelin ne kadar katı veya gevşek davranacağını belirleyen varsayılan stil seviyesiyle birlikte Yüksek Kalite ayarını kullanacaktır.

Doğrudan bir karşılaştırma yapabilmeniz için her modelde aynı beş istemi kullanacağız. Herhangi bir özel MidJourney parametresi kullanmayacağız ve sade İngilizce'deki düz metin istemlerine bağlı kalacağız.

MidJourney'i test etmek için çeşitli zorlukları temsil eden beş istem bulmak için ChatGPT-4'ü kullandık. Kullandığımız bilgi istemleri şunlardır:

  • Gerçeküstü bir manzaranın yağlı boya tablosu
  • 1920'lerde işlek bir şehir caddesinin fotoğrafı
  • Geceleri fütüristik bir şehir manzarasının konsept sanatı
  • Karda beyaz bir kaplan resmi
  • Şaşırmış bir kadının portresi

MidJourney, her istem için dört görüntü sağlar. Karşılaştırma için burada sunacağımız dördünden (bize göre) en iyisi olanı seçeceğiz. Öyleyse, etrafta olduğu kısa sürede ne kadar geliştiğini görelim.

Midjourney V1 (Şubat 2022)

MidJourney'in V1'i ile kesinlikle rüya gibi kabus yakıtı aleminde bulunuyoruz. Hızlı bir bakışta bu görüntüler size ne olduklarına dair bir izlenim veriyor, ancak onlara gerçekten baktığınız anda her şey bozuluyor. İnsan yüzleri özellikle rahatsız edici.

İLİŞKİLİ: ChatGPT'nin Yapay Zeka Sanatı Oluşturmasına İzin Verdik, İşte Yaptıkları

MidJourney V2 (12 Nisan 2022)

V2, V1'e göre çok büyük bir sıçrama gibi görünmüyor, ancak kompozisyonda, özellikle 1920'lerin sokak sahnesinde göze çarpan kesin bir gelişme var. Beyaz kaplan kesinlikle öncekinden daha iyi bir görünüme sahip ve kadının yüzü her zamankinden biraz daha az ürkütücü.

Bazı resimlerde parçanın üzerinde bir tür sözde imza olduğuna dikkat edin. Bunun nedeni, yapay zekanın belirli stillere ait görüntülerin imzaları olduğunu öğrenmesi ve bu nedenle buna benzeyen bir şeyi yeniden üretmeye çalışmasıdır.

MidJourney V3 (25 Temmuz 2022)

V3 ile tutarlılık ve kompozisyonda kesinlikle önemli bir gelişme görüyoruz. Ayrıntılar çok fazla incelemeye gerek kalmadan net bir şekilde ortaya çıkıyor, ancak rastgele gürültü miktarı kesinlikle azaltılıyor ve görüntüler insan gözü için daha anlamlı hale geliyor.

MidJourney V4 (5 Kasım 2022)

Şimdi konuşuyoruz! V4, kompozisyonda, ayrıntılarda ve görüntülerin ne kadar dinamik ve yaratıcı olduğu konusunda çarpıcı bir gelişme gösteriyor. V1'den bu yana yarım yıldan biraz daha uzun bir süre geçti ve bu görüntüler kesinlikle kullanılabilirlik alanında, çoğu zaman daha fazla düzenleme yapılmadan oldukları gibi. Açıklayıcı AI kusurlarını seçmek çok daha fazla inceleme gerektirir.

MidJourney V5 (15 Mart 2023)

V5 ile yapılan iyileştirmeler, öncekinden biraz daha ince, ancak önemli. Detay ve kompozisyondaki teknik iyileştirmenin yanı sıra, bu parçalar daha fazla dinamik, daha geniş renk seçenekleri ve genel olarak çok daha hoş sunum ile daha "yaratıcı" görünüyor. V4, ortaya çıkan görüntüleri kesinlikle en iyi insan teknik yeterliliği ile yapay zeka neslinin yapabilecekleri arasındaki gri bölgeye taşısa da, V5, MidJourney tüm silindirlere ateş ederken bu görüntülerin yapay zeka tarafından yapıldığını söylemeyi neredeyse imkansız hale getiriyor.

İLGİLİ: Üzgünüz, Yapay Zeka Sanatı, Algoritmanız İnsan Yaratıcılığının Yerini Alamaz

V5, yapay zeka görüntü oluşturmadaki en büyük sorunlardan birini ele almasıyla da dikkat çekiyor: eller!

MJ V5 Wizards el sıkışırken
MidJourney / Sydney Butler / Nasıl Yapılır Geek

V5'ten alınan yukarıdaki görüntü, sorunun büyük ölçüde çözüldüğünü gösteriyor, ancak burada hala ellerden birinin serçe parmağının eksik olduğunu veya basitçe gizlenmiş olabileceğini görebilirsiniz. Bunun gibi uç vakalar hala gözden kaçıyor, ancak 7 parmaklı ellere sahip insanların günleri neredeyse bitmiş gibi görünüyor.

MidJourney V5.1 (3 Mayıs 2023)

Burada incelediğimiz son model güncellemesi yalnızca bir ".1" güncellemesi olsa da, iyileştirme kesinlikle yanlış anlaşılamaz. V5'in temellerini temel alan V5.1, V5'teki küçük kusurları parlatırken, bize göre ifade ve genel sanatsal yetenekte kusursuz bir gelişme gösteriyor.

MidJourney'in buradan nereye gidebileceğini hayal etmek zor, ancak şu ana kadar kaydedilen ilerleme miktarı akıllara durgunluk veriyor ve bundan sonra neyin mümkün olduğunu görmek için sabırsızlanıyoruz.

İLGİLİ: Midjourney ile Sentetik Yapay Zeka Sanatı Nasıl Oluşturulur