Midjourney ที่ AI Art ดีแค่ไหน? เราเปรียบเทียบโมเดลทั้งหมด

เผยแพร่แล้ว: 2023-05-20
หุ่นยนต์สีขาวกับใบหน้าของผู้หญิงกำลังวาดภาพ
MidJourney / ซิดนีย์ บัตเลอร์ / How-To Geek

MidJourney เป็นเครื่องมือสร้างงานศิลปะด้วย AI ที่ง่ายที่สุดทั้งในแง่ของการใช้งานและในแง่ของการได้ผลลัพธ์ที่น่าทึ่ง แต่ก็เป็นเรื่องง่ายที่จะลืมว่ามันไม่ได้น่าประทับใจขนาดนั้นเมื่อเปิดตัว มาดูกันว่าจะมาไกลแค่ไหน!

วิธีการของเรา

MidJourney ทำงานโดยรับข้อความ "พรอมต์" ที่อธิบายว่าคุณต้องการให้สร้างรูปภาพประเภทใดผ่านแอป Discord หากคุณต้องการเรียนรู้วิธีใช้ซอฟต์แวร์ มีคู่มือ MidJourney ที่ยอดเยี่ยมมากมายบนเว็บที่จะช่วยให้คุณพร้อมและใช้งานได้ทันที สำหรับบทความนี้ เรามุ่งเน้นไปที่การเปรียบเทียบว่าเทคโนโลยีของ MidJourney ได้รับการปรับปรุงมากน้อยเพียงใดในช่วง 15 เดือนที่แปลกระหว่าง V1 และ V5.1 ซึ่งเป็นข้อมูลล่าสุดในบทความนี้

ที่เกี่ยวข้อง: คุณทำอะไรกับงานศิลปะที่สร้างโดย AI ได้บ้าง

MidJourney ให้คุณสลับไปมาระหว่างรุ่นรุ่นต่างๆ ได้ด้วยตนเองโดยใช้ /settings ซึ่งจะให้ตัวเลือกเหล่านี้แก่คุณ

แผงตัวเลือก Midjourney ใน Discord

ที่นี่เราสามารถเลือกระหว่าง MidJourney เวอร์ชันต่างๆ อนึ่ง ตัวเลือก “Niji” เป็นโมเดลที่ได้รับการฝึกฝนมาโดยเฉพาะเพื่อสร้างภาพในสไตล์อะนิเมะและมังงะของญี่ปุ่น ดังนั้น ถ้านั่นคือสิ่งที่คุณต้องการ ลองใช้ดู

รูปภาพทั้งหมดที่สร้างขึ้นสำหรับบทความนี้จะใช้การตั้งค่าคุณภาพสูง โดยมีระดับสไตล์เริ่มต้น ซึ่งจะกำหนดว่าโมเดลมีพฤติกรรมเข้มงวดมากน้อยเพียงใดเมื่อทำตามพร้อมท์

เราจะใช้ห้าข้อความแจ้งเหมือนกันกับทุกรุ่น เพื่อให้คุณทำการเปรียบเทียบได้โดยตรง เราจะไม่ใช้พารามิเตอร์พิเศษของ MidJourney และจะยึดข้อความแจ้งเป็นภาษาอังกฤษล้วน

เราใช้ ChatGPT-4 เพื่อสร้างการแจ้งเตือนห้ารายการเพื่อทดสอบ MidJourney ซึ่งแสดงถึงความท้าทายที่หลากหลาย นี่คือข้อความแจ้งที่เราใช้:

  • ภาพวาดสีน้ำมันของทิวทัศน์เหนือจริง
  • ภาพถ่ายถนนใจกลางเมืองที่พลุกพล่านในช่วงปี 1920
  • รวบรวมศิลปะของเมืองแห่งอนาคตในตอนกลางคืน
  • ภาพวาดเสือขาวในหิมะ
  • ภาพเหมือนของผู้หญิงที่ประหลาดใจ

MidJourney ให้สี่ภาพเพื่อตอบสนองแต่ละพรอมต์ เราจะเลือกอันที่ (ตามความเห็นของเรา) ดีที่สุดจากสี่อันมานำเสนอเพื่อเปรียบเทียบ มาดูกันดีกว่าว่าภายในเวลาอันสั้นนี้พัฒนาขึ้นมากน้อยเพียงใด

Midjourney V1 (กุมภาพันธ์ 2565)

เราอยู่ในอาณาจักรแห่งความฝันเหมือนฝันร้ายเชื้อเพลิงกับ V1 ของ MidJourney ภาพเหล่านี้ทำให้คุณ เข้าใจ ได้อย่างรวดเร็วว่าภาพเหล่านี้คืออะไร แต่ทันทีที่คุณดูภาพเหล่านี้จริงๆ ภาพทั้งหมดจะพังทลายลง ใบหน้าของมนุษย์นั้นน่ารำคาญเป็นพิเศษ

ที่เกี่ยวข้อง: เราให้ ChatGPT สร้าง AI Art นี่คือสิ่งที่สร้างขึ้น

MidJourney V2 (12 เมษายน 2565)

V2 ดูเหมือนจะไม่ก้าวกระโดดไปกว่า V1 แต่มีการปรับปรุงการจัดองค์ประกอบอย่างชัดเจน โดยเฉพาะอย่างยิ่งที่เห็นได้ชัดเจนในฉากท้องถนนในปี ค.ศ. 1920 เสือขาวมีโครงร่างที่ดีขึ้นกว่าเดิมอย่างแน่นอน และใบหน้าของผู้หญิงก็น่ากลัวน้อยลงมาก

สังเกตว่าในบางภาพมีลายเซ็นปลอมบนชิ้นส่วนนั้นอย่างไร นี่เป็นเพราะ AI ได้เรียนรู้ว่าภาพในบางสไตล์มีลายเซ็น ดังนั้นมันจึงพยายามสร้างสิ่งที่ดูเหมือนภาพนั้นขึ้นมาใหม่

MidJourney V3 (25 กรกฎาคม 2022)

ด้วย V3 เราเห็นการปรับปรุงที่สำคัญอย่างยิ่งในการเชื่อมโยงกันและการจัดองค์ประกอบ รายละเอียดต่างๆ ชัดเจนโดยไม่มีการตรวจสอบมากเกินไป แต่จำนวนสัญญาณรบกวนแบบสุ่มจะลดลงอย่างแน่นอน และภาพก็สมเหตุสมผลมากขึ้นในสายตามนุษย์

MidJourney V4 (5 พฤศจิกายน 2565)

ตอนนี้เรากำลังพูดถึง! V4 แสดงการปรับปรุงอย่างมากในองค์ประกอบ รายละเอียด และไดนามิกและจินตนาการของภาพ ผ่านไปกว่าครึ่งปีแล้วตั้งแต่ V1 และภาพเหล่านี้อยู่ในขอบเขตของการใช้งานอย่างแน่นอน มักจะเป็นแบบที่ไม่มีการแก้ไขเพิ่มเติม ต้องใช้การตรวจสอบอย่างถี่ถ้วนมากขึ้นเพื่อเลือกข้อบกพร่องของ AI ที่บอกเล่าได้

MidJourney V5 (15 มีนาคม 2566)

การปรับปรุงด้วย V5 นั้นละเอียดกว่าเมื่อก่อนเล็กน้อย แต่ก็มีนัยสำคัญ นอกเหนือจากการปรับปรุงด้านเทคนิคในรายละเอียดและการจัดองค์ประกอบแล้ว ชิ้นงานเหล่านี้ยังดูมี "จินตนาการ" มากขึ้น ด้วยไดนามิกที่มากขึ้น สีสันที่มีให้เลือกมากขึ้น และการนำเสนอโดยรวมที่น่าพึงพอใจมากขึ้น แม้ว่า V4 จะย้ายภาพที่ได้ไปยังโซนสีเทาระหว่างความสามารถทางเทคนิคที่ดีที่สุดของมนุษย์กับสิ่งที่ AI ทำได้ แต่ V5 ทำให้แทบจะเป็นไปไม่ได้เลยที่จะบอกได้ว่าภาพเหล่านี้สร้างโดย AI เมื่อ MidJourney กำลังยิงกระบอกสูบทั้งหมด

ที่เกี่ยวข้อง: ขออภัย AI Art อัลกอริทึมของคุณไม่สามารถแทนที่ความคิดสร้างสรรค์ของมนุษย์ได้

นอกจากนี้ V5 ยังโดดเด่นในการแก้ปัญหาที่ใหญ่ที่สุดอย่างหนึ่งในการสร้างภาพ AI นั่นคือมือ!

MJ V5 พ่อมดมือสั่น
MidJourney / ซิดนีย์ บัตเลอร์ / How-To Geek

ภาพด้านบนจาก V5 แสดงให้เห็นว่าปัญหาได้รับการแก้ไขแล้ว แม้ว่าที่นี่คุณยังคงเห็นว่ามือข้างใดข้างหนึ่งอาจมีพิ้งกี้หายไปหรือถูกบดบัง Edge case แบบนี้ยังคงหลุดรอดไปได้ แต่ดูเหมือนว่าวันของคนที่มีมือ 7 นิ้วอาจจะใกล้หมดลงแล้ว

MidJourney V5.1 (3 พฤษภาคม 2023)

แม้ว่าการอัปเดตโมเดลล่าสุดที่เรากำลังดูอยู่นี้อาจเป็นเพียงการอัปเดต ".1" เท่านั้น แต่ก็ไม่มีข้อผิดพลาดในการปรับปรุงอย่างแน่นอน จากพื้นฐานของ V5 V5.1 ได้ขัดเกลาข้อบกพร่องเล็กๆ น้อยๆ ใน V5 ในขณะที่ในสายตาของเรา แสดงให้เห็นถึงการปรับปรุงการแสดงออกและไหวพริบทางศิลปะโดยรวมอย่างไม่มีที่ติ

เป็นการยากที่จะจินตนาการว่า MidJourney จะไปต่อจากจุดไหนได้ แต่จำนวนความคืบหน้าจนถึงตอนนี้ช่างน่าเหลือเชื่อ และเราแทบรอไม่ไหวที่จะได้เห็นสิ่งที่เป็นไปได้ต่อไป

ที่เกี่ยวข้อง: วิธีสร้างงานศิลปะ AI สังเคราะห์ด้วย Midjourney